Pregunta:
¿Es posible encontrar archivos duplicados en mi disco que sean idénticos bit a bit pero que tengan nombres de archivo diferentes?
Respuesta:
fdupes
pueden hacer esto. De man fdupes
:
Busca archivos duplicados en la ruta indicada. Estos archivos se encuentran comparando tamaños de archivo y firmas MD5, seguido de una comparación byte por byte.
En Debian o Ubuntu, puede instalarlo con apt-get install fdupes
. En Fedora / Red Hat / CentOS, puede instalarlo con yum install fdupes
. En Arch Linux puede usar pacman -S fdupes
, y en Gentoo, emerge fdupes
.
Para ejecutar una verificación que descienda de la raíz de su sistema de archivos, que probablemente tomará una cantidad significativa de tiempo y memoria, use algo como fdupes -r /
.
Como se solicita en los comentarios, puede obtener los duplicados más grandes haciendo lo siguiente:
fdupes -r . | {
while IFS= read -r file; do
[[ $file ]] && du "$file"
done
} | sort -n
Esto se romperá si sus nombres de archivo contienen nuevas líneas.