Backup von Fotos: Datensicherung und -verifikation im digitalen Bildarchiv
Inhaltsverzeichnis
Problembeschreibung
Analoge Originale (Dias/Negative) müssen sorgfältig gelagert werden,
sonst droht der Verfall. Aber auch dann kann mit gewissem Aufwand immer
noch eine Rekonstruktion gelingen.
Digitale Aufnahmen verzeihen da nicht so schnell, einige “gekippte Bits”
können den Totalverlust bedeuten.
In Zeiten der “Hybridfotografie” (analog aufnehmen, dann einscannen und digital weiterverarbeiten) konnte man das etwas entspannter sehen, es gab ja immer das “analoge Backup im Schrank”. Im Zweifel war also etwas Arbeit verloren, nicht aber das Bild insgesamt, wenn eine Datei oder gar ein Datenträger beschädigt wurde.
Und weil “digital” eben nur 2 Zustände kennt - “geht”/“geht nicht”, lohnt es sich bei rein digitaler Fotografie durchaus, sich Gedanken über Sicherungsstrategieen zu machen.
Erstellung von Backups
Grundsätzlich werden zwei Arten des Backups unterschieden. Das volle Backup sichert stets den kompletten Bestand an Daten, während das inkrementelle Backup nur Daten archiviert, die innerhalb einer bestimmten Periode modifiziert wurden. Dabei steht die Periode meist für den Zeitraum seit der letzten Sicherung.
In der Bildbearbeitung ist heute Stand der Technik, sog. “non destructive imaging” anzuwenden: Programme wie darktable, RawTherapee und auch Adobe Lightroom arbeiten nach diesem Konzept.
Dabei geht es grundsätzlich darum, eine Bilddatei, ist sie einmal auf den Computer importiert, nur noch lesend zu benutzen. Alle Bearbeitungsschritte werden in sog. Sidecar-Files (meist xml-Dateien) ausgelagert, diese sind nur einige kB groß. Erst beim Export ins Ausgabeformat (meist jpg) werden die in dieser Datei festgelegten Bearbeitungsschritte wie ein Fahrplan angewandt, aus den Rohdaten das veränderte Bild erzeugt und im Ausgabeordner gespeichert.
Das hat Folgen für die Backupstrategie.
Vollbackup
Ein RAW-File aus einer 12MP-Kamera hat eine Dateigröße von rund 15MB,
die Files aus der 36MP-Kamera Nikon D800 liegen bei einer Größe von rund
45-50MB. Regelmäßige Voll-Backups, bei denen der komplette Datenbestand
auf einen anderen Datenträger (Band- oder Festplattenspeicher) kopiert
werden, übersteigen daher sehr schnell die Möglichkeiten der meisten
Anwender.
Zudem ist zu bedenken, daß man alte Sicherungen nicht überschreiben
sollte, da man nicht weiß, zu welchem Zeitpunkt evtl. Fehler entstanden
sein können.
Incrementelles Backup
Ein volles Backup ist wegen des hohen Bedarfs an Zeit und Speichervolumen weniger für den täglichen Einsatz geeignet, deswegen entscheidet man sich heute meist für eine Mischform aus voller und inkrementeller Datensicherung. Hierbei wird zu einem Zeitpunkt der komplette Datenbestand gesichert und nachfolgend - in regelmäßigen Abständen - archiviert man nur die modifizierten Daten.
Dabei hat man wiederum die Wahl:
- regelmäßige Speicherung der Änderungen gegenüber dem letzten Voll-Backup
- Speicherung der Änderungen gegenüber dem letzten incrementellen Backup
doppeltes Backup mit Verifikation
Allen reinen Backup-Strategien ist eigen, daß sie ein über die Zeit stetig wachsendes Datenvolumen erzeugen und nie genau bekannt ist, wo (in welchem Backup) im Fehlerfall die intakte Datei zu finden ist.
Daher wird hier eine gänzlich andere Vorgehensweise vorgeschlagen:
- Wie in Schritt 2 der Darstellung des digitalen Workflows beschrieben, erfolgt ein erstes Backup gleichzeitig mit dem Import der Bilder aus der Kamera auf den Rechner, z. B. auf eine externe Festplatte.
- Auf dem Rechner werden die Aufnahmen der “Session” gesichtet und einer Bearbeitung unterzogen, dabei entstehen Sidecar-Files.
- In regelmäßigen Abständen werden die Inhalte der “Arbeitsordner” auf
dem Rechner auf einen weiteren externen Datenträger übertragen.
Hierzu kommt eine Synchronisationssoftware, z. B.
FreeFileSync
zum Einsatz.
Wichtig ist, daß dabei nur die Veränderungen seit der letzten Synchronisation - das sind hier die Übertragung der neu hinzugekommenen Aufnahmen incl. der Sidecar-Files und ggf. die Aktualisierung der bereits vorhandenen Sidecar-Files - auf den externen Datenträger geschrieben werden (bereits auf dem externen Datenträger vorhandene RAW-Dateien bleiben also unberührt). - Nach Abschluß eines Projekts werden über alle RAW-(evtl. auch TIF-Files, z. B. bei der Ausgabe von Panorama- oder HDR-Aufnahmen) Prüfsummen erzeugt, um in der Zukunft die Unversehrtheit der Files prüfen zu können (siehe nächstes Kapitel “Datenkonsistenz”).
- Durch regelmäßige Überprüfung der Prüfsummen auf allen drei Datenträgern (Rechner und die beiden externen Datenträgern), insbesondere aber auch bei jedem Kopiervorgang auf einen anderen Rechner oder Datenträger, können evtl. zwischenzeitlich aufgetretene Datenfehler erkannt und anhand der auf den beiden anderen Datenträgern liegenden Kopien wieder hergestellt werden.
Prüfung der Datenkonsistenz
Was bedeutet “Prüfung der Datenkonsistenz”?
Für digitale Daten lassen sich durch mathematische Verfahren sog. Prüfsummen ermitteln, die eine Art “Fingerabdruck” für eine Datei darstellen. Eine Änderung der Datei, sei es durch eine Bearbeitung, sei es durch einen Datenfehler, der sich im Laufe der Zeit eingeschlichen hat, hat eine Änderung der Prüfsumme zur Folge.
Ermittelt man nun für alle zu sichernden Dateien ihre jeweilige Prüfsummen und speichert diese ab, so kann man zu jedem beliebigen späteren Zeitpunkt prüfen, ob die Dateien sich noch im Ursprungszustand befinden. Dazu ermittelt man die Prüfsummen erneut und vergleicht sie mit den ursprünglich berechneten und abgespeicherten Werten. Abweichungen signalisieren Dateifehler.
Voraussetzungen
Aufgrund der oben erläuterten Technik des sog. “non destructive imaging” ergibt sich für die Konsistenzprüfung:
Es gibt jede Menge Dateien in den Kamera-Raw-Formaten, aber ggf. auch
unkomprimiert in .TIF, die als Ursprungsdateien die Funktion des
analogen “Negativs” oder “Dias” übernehmen, nur noch gelesen werden und
sich daher nicht mehr ändern sollten.
Diese - und nur diese - sind Gegenstand der Prüfung!!
Und dann gibt es mindestens so viele dieser xml-Dateien (2
Bearbeitungsversionen desselben Bildes geben 1 Rohdatei und zwei
xml-Dateien) in denselben Ordnern, deren Kennzeichen eben die
Veränderung ist.
Bilder und zugehörige xml-Dateien liegen typischerweise in
Jahrgangsordnern und dort in untergeordneten Projektordnern.
Die Prüfung (sowohl die ursprüngliche Erzeugung der Prüfsummen als auch
die späteren Vergleiche) sollten per Software automatisch erfolgen.
An eine solche Software ergibt sich als Anforderungsprofil:
- Programm mit GUI (also graphischer Benutzeroberfläche - kein Kommandozeilen-Streß)
- Rekursives Erzeugen und Prüfen in Verzeichnisbäumen (auch Unterverzeichnisse werden durchsucht)
- Filterung unerwünschter Dateitypen (hier im konkreten Beispiel: xmp (von Darktable), pp3 (von RawTherapee), …)
- evtl. unterschiedliche Hash-Funktionen (mathematische Verfahren zur Prüfsummenermittlung) zur Auswahl (crc32 oder md5)
- möglichst Cross-Plattform Software (es gibt Versionen sowohl für Windows als auch Linux)
Ein Beispiel für eine geeignete Software bildet Checksum Control.
Zusammenfassung:
- Bereits beim Import von Bilddateien von der Kamera ein Doppel auf einen externen Datenträger schreiben, dieses Doppel gleich mit Prüfsumme versehen
- ausschließlich Software verwenden, die NICHTS in das Originalfile schreibt, auch keine Bearbeitungsschritte oder Metatags
- Auf dem Rechner die bearbeiteten Bilder im Projektordner sammeln, dort mit Prüfsumme versehen.
- Projektordner regelmäßig auf weiteren externen Datenträger synchronisieren
- auf allen Datenträgern in der Zukunft regelmäßig (z. B. monatlich/vierteljährlich) die Bilddateien anhand der Prüfsummen verifizieren
- nach jedem Kopiervorgang auf einen anderen Datenträger Prüfsummen verifizieren (Dateien NIE verschieben, sondern immer kopieren, dann Prüfsummen checken und erst bei 100% Erfolg die Dateien auf dem Herkunfts-Datenträger löschen).
- im Falle von Fehlern die betroffenen Bilddateien vom intakten Datenträger zurückkopieren
zuletzt geändert am: 20.11.2015 - 1065 Worte - Lesezeit: 5 Minute(n)