Duplikatsuche

<< Zum Inhaltsverzeichnis >>

Navigation:  TreeSize Dateisuche verwenden >

Duplikatsuche

Sucht nach doppelten Dateien auf den ausgewählten Festplatten und Freigaben.
Doppelte Dateien bedeutet hier: Dateien die mehr als einmal existieren, potentiell gleich sind (evtl. kopiert wurden) und somit möglicherweise unnötigen Speicherplatz belegen.

Eine detaillierte Schritt-für-Schritt Anleitung wie Sie die Duplikatsuche benutzen, finden Sie hier.

TreeSize-FileSearch_DuplicateFiles

 

Die Registerkarte "Duplikatsuche"

 

Suchmodus:

Wählen Sie einen von drei Modi zur Suche nach Duplikaten. Sie können nach doppelten Dateien, doppelten Verzeichnissen, oder auch nach Dateien suchen, die keine Duplikate besitzen.

Doppelte Dateien

Sucht nach Dateien, die Duplikate voneinander sind. Die Dateien werden anhand der ausgewählten Vergleichsmethode miteinander verglichen.

Doppelte Ordner

Sucht nach Verzeichnissen, die Duplikate voneinander sind. Zwei Verzeichnisse werden als Duplikate eingestuft, wenn sie dieselbe Anzahl Unterverzeichnisse und Dateien haben. Außerdem müssen diese Unterverzeichnisse und Dateien, im Sinne der ausgewählten Vergleichsmethode, auch jeweils Duplikate voneinander sein.

Einzigartige Dateien

Diese Einstellung sucht nach Dateien, für die keine Duplikate innerhalb der ausgewählten Suchpfade gefunden werden können.

 

Vergleichsmethode:

Sie können entscheiden, wie genau Sie die Gleichheit der Dateien überprüfen möchten. Hierfür stehen folgende Strategien zur Verfügung:

Dateiinhalt

Diese Option verwendet in der Standard-Einstellung MD5-Prüfsummen für den Vergleich von Dateien.

Wenn Sie diese Option wählen, wird ein sogenannter Hash-Wert für den Inhalt jeder Datei erstellt. Dateien mit demselben Inhalt haben denselben Hash-Wert, Dateien mit unterschiedlichem Inhalt haben mit an Sicherheit grenzender Wahrscheinlichkeit unterschiedliche Hash-Werte. Leere Dateien werden ignoriert, da diese keinen Inhalt haben.

Diese Variante ist genauer als der Vergleich von Namen, Größe und Datum, allerdings auch um einiges langsamer.

 

Es ist möglich, SHA256-Prüfsummen anstelle von MD5-Summen zu verwenden. Der SHA256-Algorithmus senkt die rechnerisch extrem geringe Wahrscheinlichkeit für gleiche Prüfsummen bei unterschiedlichem Dateiinhalt noch weiter, ist allerdings wesentlich langsamer. Die Umstellung von MD5 auf SHA256 erfolgt in den Optionen der Dateisuche und ist nur im Experten-Modus möglich.

Name, Größe und Datum

Vergleicht Dateien anhand Ihres Namens, der Dateigröße und des Datums der letzten Änderung.

Diese Variante ist merklich schneller als der Vergleich mittels Prüfsummen, allerdings auch ungenauer.

Name und Größe

Vergleicht Dateien anhand Ihres Namens und der Dateigröße.

Diese Variante ist vergleichbar mit der aller ersten Vergleichsmethode, außer das hier das Datum der "Letzen Änderung" der Dateien nicht berücksichtigt wird.
Das ist hilfreich wenn Beispielsweise Dateien an einen andern Speicher-Ort verschoben wurde, was unter Umständen diesen Zeitstempel manipuliert.

Name

Wählen Sie diese Variante, um alle Dateien mit gleichen Namen zu finden.

Diese Methode kann sehr hilfreich sein, um ungewollte Kopien von Dateien zu finden (z.B.: Dokumente die lokal kopiert und modifiziert wurden).

Name ohne Dateiendung

Wählen Sie diese Vergleichs-Art um Dateien mit gleichen Namen, ohne Berücksichtigung der Dateiendung, zu identifizieren.

Dieser Vergleich kann Ihnen helfen, duplizierte Backup-Dateien zu finden, oder z.B. gleiche Bilder oder Videos in unterschiedlichen Bild-/Video-Formaten ("MeinBild.bmp" - "MeinBild.png").

Größe und Datum

Vergleicht Dateien anhand der Dateigröße und des Datums. Erlaubt das schnelle, dafür etwas ungenauere Suchen von Duplikaten mit unterschiedlichen Dateinamen. Aus Versehen erzeugte Duplikate mit Namen wie "Kopie von ..." können mit dieser Methode sehr schnell identifiziert werden.

Größe

Wählen Sie diese Variante, um alle Dateien mit gleicher Größe zu finden.

 

Suchfilter:

Weitere Optionen, mit denen die Duplikatsuche angepasst werden kann:

Ausschlussfilter

Erlaubt das Aktivieren/Deaktivieren und Bearbeiten von globalen Ausschlussfiltern für diese Suche.

 

Mit dem Ausschluss bestimmter Dateien oder Pfade können Sie z.B. Systemverzeichnisse von der Duplikatsuche ausnehmen. Des Weiteren wird die Anzahl der zu überprüfenden Dateien reduziert und somit die die Geschwindigkeit der Suche verbessert.

NTFS Hardlinks ignorieren

Ist diese Option aktiviert, werden Hardlinks nicht als Datei-Duplikate betrachtet.

Hinweis: NTFS Hardlinks allokieren keinen Speicher. Deshalb wird durch ihre Löschung kein zusätzlicher Speicher verfügbar gemacht. Darüber hinaus verwendet TreeSize Hardlinks für die Deduplizierung.

Deduplizieren

Benutzen Sie die Option "Operationen > Deduplizieren", um alle markierten Dateien einer Gruppe bis auf eine durch einen NTFS Hardlink auf die eine verbleibende Datei zu ersetzen. Nähere Informationen zur Deduplikation finden Sie in diesem Kapitel.

Wenn Sie diese Option benutzen, wird Ihnen ein Konfigurationsdialog angezeigt, in dem Sie eine Log-Datei zum Protokollieren der durchgeführten Operationen angeben können. Zusätzlich können Sie hier entscheiden, wie mit Dateien verfahren werden soll, die sich auf unterschiedlichen Laufwerken befinden. Solche Dateien können nicht durch NTFS Hardlinks ersetzt werden. Die Dateien können separat pro Laufwerk durch Hardlinks ersetzt werden, alternativ wählen Sie ein Referenz-Laufwerk und alle Dateien auf anderen Laufwerken werden durch Symbolische Links ersetzt. Hinweis: Solte das erstellen von Symbolischen Links nicht erlaubt, so wird eine Windows Verknüpfung (.LNK-Datei) als Fallback erstellt.

Im Kontextmenü der Liste der doppelten Dateien befindet sich der Eintrag "Duplikate durch Hardlinks ersetzen". Dieser Eintrag funktioniert genau wie die oben erwähnte Schaltfläche "Deduplizieren", nur dass sie statt der abgehakten alle selektierten (also mit der Maus ausgewählten) Dateien ersetzt.

TreeSize-FileSearch_Duplicates_Deduplicate