Diskussion:Datensicherung/ Teilsicherung

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
Aus Wikibooks

Dieses Buch über "Datensicherung" müsste dringend um moderne Backupstrategien auf Backup-Festplatten ergänzt werden. Die Verwendung von Voll, Inkrementellen und Differenziellen Sicherungen ist heute noch üblich (vor allem auf Band), andere Möglichkeiten sollten aber auch erwähnt werden. Dieses insbesondere, als derartige Tools sowohl als OSS sowie auch im Paketmanager von Debian / Ubuntu verfügbar sind.

Ich beziehe mich im Folgenden insbesondere auf die Backup Suite storeBackup.

Das Tool erstellt Folgebackups auf der Basis von Hardlinks, d.h. unveränderte Dateien werden in Folgesicherungen per Hardlink referenziert. Neue Dateien werden dem neuen Backup durch Kopie hinzugefügt. Dieser Mechanismus ist auch bei anderen Tools wie rsync oder faubackup gegeben. Das Ergebnis sind immer volle Backups, jedoch mit dem Aufwand eines inkrementellen Backups. Bei storeBackup geht das soweit, dass temporär ein inkrementelles Backup erstellt werden kann (um die Zeit für die Hardlinks zu sparen), welches dann später (unabhängig vom eigentlichen Backup) um die (noch) fehlenden Hardlinks ergänzt werden kann (bzw. muss), um so wieder volle Backups zu erhalten.

Die Vorteile, nur volle Backup zu erhalten, sind:

  • Beliebige Reihenfolge beim Löschen alter Backup, keine Löschstrategie aus technischen Gründen notwendig
  • Dateien müssen nicht über mehrere Sicherungen gesucht werden, sondern sind in jedem Backup verfügbar
  • Das Zurücksichern von Verzeichnisbäumen ist deutlich schneller und einfacher, da in jedem Backup alles vorliegt und nicht 5-10 Sicherungen "übereinander-zurück-kopiert" werden müssen.

Letztendlich sind alle für die inkrementellen / differenziellen Backup notwendigen Überlegungen und Verrenkungen nicht mehr nötig.

storeBackup geht aber noch weiter. Wie in einigen (sehr teuren) kommerziellen Backuplösungen beherrscht es Deduplikation, d.h. das Erkennen von mehrfach vorkommenden Inhalten, die nur einmal abgespeichert werden, auf die aber mehrfach referenziert wird. Dieses erfolgt meist über zentrale Datenbanken o.ä., die eine Wiederherstellung der Daten nur über entsprechende Tools möglich machen. StoreBackup geht hier einen Weg, der die Wiederherstellung der Daten mit einfachsten Unix / Linux Tools ermöglicht:

  • Dateien werden als Ganzes per Hardlink referenziert, wenn sie identisch sind. Dieses bezieht sich nicht nur auf unveränderte Dateien bei einem neuen Backup (wie z.B. bei rsync), sondern auf alle Dateien innerhalb nicht nur einer Backup-Serie sondern auch auf voneinander unabhängigen Backups von z.B. unterschiedlichen Rechnern in den Backup-Pool Bereich.
  • Image Dateien, wie die von Virtuellen Maschinen (VM) oder große Dateien mit partiellen Änderungen (die berühmte Outlook pst Datei) können blockweise abgespeichert werden. Auch werden im Backup-Verzeichnis vorhandene identische Blöcke per Hardlink verbunden; nur noch nicht vorhandene werden neu angelegt. Die Wiederherstellung dieser Dateien ist (wie alles andere auch) mit einem Tool von storeBackup möglich. Sie kann aber auch durch einfaches 'cat *' oder 'bzcat *' erfolgen - letzteres, sofern die Blöcke komprimiert gespeichert wurden.
Ich habe diese Strategien noch nicht eingesetzt und werde deshalb nicht darüber schreiben. Ich vermute, derartige Software ist teuer. Zielgruppe dieses Buches sind "alle Computer-Benutzer, vor allem die mit einem oder wenigen Computern", die nicht viel Geld ausgeben werden. Fühle dich frei, darüber zu schreiben. Gruß -- Klaus 23:02, 25. Mai 2012 (CEST)[Beantworten]
Hier handelt es sich um ein Missverständnis; StoreBackup ist seit etwa 10 Jahren unter der GPL verfügbar (und hat sich natürlich in der Zeit weiterentwickelt). Du kannst es Dir (wenn Du willst) direkt herunterladen und ausprobieren. Eine ausführliche Dokumentation ist auch vorhanden. Als Festplatten-basiertes Backup-Programm, welches sehr sparsam mit dem verfügbaren Plattenplatz umgeht (Deduplikation, Kompression) dürfte es in den Gesamtkosten (Hardware, Aufwand) deutlich unter denen von Bandbasierten-Lösungen liegen.