ZFS auf Linux/ zdb
zdb
[Bearbeiten]Neben dem reinen Debugging kann zdb auch zum Monitoring eingesetzt werden. Da es sich jedoch eher an die Entwickler richtet, fällt die Dokumentation großteils knapp aus. Somit ist es möglich, dass Funktionen existieren, die man als Endnutzer nicht direkt finden kann. Des Weiteren sind die Ausgaben des Tools bzw. dessen Funktionsweise teilweise schwer zu verstehen. Mit der Simulation der blockweisen Deduplizierung bietet es jedoch ein sehr hilfreiches Feature an. Dabei wird die theoretische Auswirkung der Deduplizierung auf einen bestimmten Pool berechnet. Dieser Vorgang kann je nach Größe des Pools viel Zeit in Anspruch nehmen. Am Ende werden der erreichbare Deduplizierungsfaktor sowie weitere Eckdaten des Pools ausgegeben. Anhand dieser Simulation kann entschieden werden, ob eine Aktivierung der Deduplizierung ratsam ist. Die folgende Ausgabe zeigt das Ergebnis einer solchen Simulation, die über den Parameter -S ausgelöst werden kann:
user@host:~$ zdb -S <POOLNAME>
Simulated DDT histogram:
bucket allocated referenced
------ ---------------------------- ----------------------------
refcnt blocks LSIZE PSIZE DSIZE blocks LSIZE PSIZE DSIZE
------ ------ ----- ----- ----- ------ ----- ----- -----
1 555K 69.3G 33.3G 33.3G 555K 69.3G 33.3G 33.3G
2M 1 128K 128K 128K 2.13M 272G 272G 272G
Total 555K 69.3G 33.3G 33.3G 2.67M 342G 306G 306G
dedup = 9.18, compress = 1.12, copies = 1.00, dedup * compress / copies = 10.26
Die für die Auswertung der Simulation relevanten Werte befinden sich in der letzten Zeile der Ausgabe. Der unter dedup ausgegebene Wert entspricht dem berechneten Deduplizierungsfaktor. Je größer dieser ist, desto wirkungsvoller ist die Deduplizierung. Der als compress angegebene Komprimierungsfaktor wird nicht berechnet, sondern entspricht dem tatsächlichen Zustand des Pools. Es wird demnach keine Simulation der Komprimierung durchgeführt. Sollte eine bestimmte Anzahl an Replikas konfiguriert sein, würde der Wert copies der Anzahl dieser Replikas entsprechen. Aus den drei beschriebenen Werten wird zusätzlich das Verhältnis zwischen den zu speichernden Daten und dem dafür benötigten Speicherplatz unter Berücksichtigung aller Einflussgrößen berechnet und ausgegeben.