Doppelte Dateien durch Scan der Inhalte erkennen?

Hallo!!
Vor einigen Monaten ist meine externe Festplatte gecrasht und ich konnte nur unter Mühen (und leser vieler Anleitungen) die Daten retten.
Leider hat dies mehrere Anläufe gebraucht und jetzt hab ich ein anständiges Datenchaos, in welchem fast keine Sortierung ist wie zuvor, viele Dateinamen falsch sind und es haufenweise doppelte Dateien gibt.

Gibt es eine Möglichkeit Daten zu scannen und aufgrund ihres Inhaltes (nicht Name) als doppelte Datei zu erkennen?
Danke

Unter welchem Betriebssystem soll die Datensuche laufen?

Hi,

unter Linux wären das zwei kleine Scripts, hier abstract beschrieben:

  1. erzeugt für jede Datei in einem Verzeichnis (rekursiv) einen Hashwert in einer Ausgabedatei
  2. überprüft zwei derartig erzeugte Dateien auf doppelte Einträge bzw. dubiose Einträge (diese müssen dann kontrolliert werden)

cd /tmp
mkdir -p cmpfiles
cd cmpfiles
hash_files dir1 master
hash_files dir2 slave
verify.pl master slave diff dubious

Es mag Tools geben, die das auch so können, aber derartig gleiche ich schon jahrelang meine Fotobestände ab (und ich weiß, was das Skript macht).

MfG
HH

PS Als hasher benutzte ich initial md5sum, danach aber aus Geschwindigkeitsgründen blake512

hallo,

ich empfehle:
http://www.clonespy.com/

muss man sich ein bisschen einlesen und die rechten einstellungen finden, dann ist das ein starkes tool.

grüße