ZFS auf Linux/ zdb

zdb

Neben dem reinen Debugging kann zdb auch zum Monitoring eingesetzt werden. Da es sich jedoch eher an die Entwickler richtet, fällt die Dokumentation großteils knapp aus. Somit ist es möglich, dass Funktionen existieren, die man als Endnutzer nicht direkt finden kann. Des Weiteren sind die Ausgaben des Tools bzw. dessen Funktionsweise teilweise schwer zu verstehen. Mit der Simulation der blockweisen Deduplizierung bietet es jedoch ein sehr hilfreiches Feature an. Dabei wird die theoretische Auswirkung der Deduplizierung auf einen bestimmten Pool berechnet. Dieser Vorgang kann je nach Größe des Pools viel Zeit in Anspruch nehmen. Am Ende werden der erreichbare Deduplizierungsfaktor sowie weitere Eckdaten des Pools ausgegeben. Anhand dieser Simulation kann entschieden werden, ob eine Aktivierung der Deduplizierung ratsam ist. Die folgende Ausgabe zeigt das Ergebnis einer solchen Simulation, die über den Parameter -S ausgelöst werden kann:

user@host:~$ zdb -S <POOLNAME>
Simulated DDT histogram:

bucket              allocated                       referenced          
------   ----------------------------     ----------------------------
refcnt   blocks   LSIZE   PSIZE   DSIZE   blocks   LSIZE   PSIZE   DSIZE
------   ------   -----   -----   -----   ------   -----   -----   -----
     1     555K   69.3G   33.3G   33.3G     555K   69.3G   33.3G   33.3G
    2M        1    128K    128K    128K    2.13M    272G    272G    272G
 Total     555K   69.3G   33.3G   33.3G    2.67M    342G    306G    306G

dedup = 9.18, compress = 1.12, copies = 1.00, dedup * compress / copies = 10.26

Die für die Auswertung der Simulation relevanten Werte befinden sich in der letzten Zeile der Ausgabe. Der unter dedup ausgegebene Wert entspricht dem berechneten Deduplizierungsfaktor. Je größer dieser ist, desto wirkungsvoller ist die Deduplizierung. Der als compress angegebene Komprimierungsfaktor wird nicht berechnet, sondern entspricht dem tatsächlichen Zustand des Pools. Es wird demnach keine Simulation der Komprimierung durchgeführt. Sollte eine bestimmte Anzahl an Replikas konfiguriert sein, würde der Wert copies der Anzahl dieser Replikas entsprechen. Aus den drei beschriebenen Werten wird zusätzlich das Verhältnis zwischen den zu speichernden Daten und dem dafür benötigten Speicherplatz unter Berücksichtigung aller Einflussgrößen berechnet und ausgegeben.