Hướng dẫn Linux Phần mềm

dupeGuru – Công cụ tìm kiếm files trùng lặp

dupeGuru

dupeGuru là một công cụ đa nền tảng viết bằng Python có hỗ trợ GUI để tìm những files trùng lặp trên hệ thống. Chương trình có ba chế độ, Standard/Music và Picture với các cách quét và những tính năng riêng cho từng chế độ

Cài đặt

Rất dễ để cài đặt bằng cách clone mã nguồn từ Github và biên dịch chúng. Các bạn thực hiện tuần tự các câu lệnh sau

git clone https://github.com/arsenetar/dupeguru.git
cd dupeguru
make -j4 (Tham số -j sẽ để trình biên dịch sử dụng nhiều cores trong CPU của bạn, điều này sẽ làm tăng quá trình biên dịch)
make run

Với các Distro dựa trên Arch, thì đã có sẵn package Arch User Repository. Và dupeGuru đã có PPA (Personal Package Archive) dành cho Ubuntu

Tool này cũng hỗ trợ Windows luôn các bạn nhé

Sử dụng

dupeGuru

dupeGuru có giao diện đồ hoạ khá đơn giản và trực quan

dupeGuru cho phép quét sự trùng lặp trong một hay nhiều thư mục, và phần mềm này cũng có thể cho phép chúng ta load lại kết quả của một lần scan trước đây đang dở

Trong hình trên các bạn có thể thấy chương trình có 3 chế độ chính

  1. Chế độ standard cho phép sử dụng với bất kì loại files nào nhưng nó không có tính năng gì quá đặc biệt
  2. Chế độ music cho phép quét những tag của files nhạc như tên ca sĩ, tên album, năm phát hành
  3. Chế độ Picture giúp các bạn quét chi tiết một hình ảnh. Mỗi hình ảnh sẽ được mở ở chế độ RGB bitmap, sau đó chương trình sẽ chia hình ảnh ra thành những mảnh nhỏ kích cỡ 15×15 và tính toán màu sắc trung bình của từng mảnh nhỏ đó, sau một hồi tính toán thì chương trình đưa ra kết quả tổng thể

Chương trình cũng có 3 chế độ scan

  1. Filename: Scan theo tên files
  2. Contents: Chương trình đọc files và nếu contents giống nhau, thì 2 files được tính là trùng lặp
  3. Folders: Sử dụng để tìm Folders trùng lặp, một folder sẽ bị tính là trùng lặp nếu các files trong đó có nội dung giống hệt các files của một Folders khác

Sau khi scan thành công, dupeGuru hiển thị kết quả cùng với những lựa chọn như lọc, tìm và một số hành động như chọn files để xoá, di chuyển, copy, đổi tên,…

Bạn có thể lưu kết quả lại ở dạng files riêng của dupeGure hoặc xuất chúng ra dạng HTML hoặc CSV

Các tính năng khác

dupeGuru cho phép chúng ta thiết lập các cài đặt bằng cách click vào nút More Options. Tuy nhiên việc tuỳ chỉnh một số thiết đặt phụ thuộc vào chế độ scan bạn đang chọn

Word weighting thay đổi tỉ lệ trùng hợp được so sánh khi so sánh 2 từ (đặc biệt là từ lớn và dài). Thay vì chỉ cần có giá trị giống nhau về số lượng từ mà mỗi từ cần có số lượng kí tự bằng nhau

Match Similar Words có nghĩa rằng hai từ được coi là giống nhau nếu nó được làm giống nhau chỉ với một số thao tác chỉnh sửa đơn giản (bỏ đi hoặc thêm vào một kí tự)

Chương trình này đã hỗ trợ nhiều ngôn ngữ khác nhau và đã có cả tiếng Việt

Thông tin tham khảo

Dọn dẹp file trùng lặp là một cách giúp các bạn được tiết kiệm một chút ít dung lượng ổ đĩa. Ngoài ra bạn có thể tham khảo bài Làm thế nào để dọn RAM trên Linux?

Bài viết được dịch và viết dựa trên bài: dupeGuru – find duplicate files – LinuxLinks

Hits: 103