Privacy-Handbuch: Daten anonymisieren
Dieser Abschnitt ist noch im Entstehen und noch nicht offizieller Bestandteil des Buchs. Gib den Autoren Zeit, den Inhalt anzupassen!
Fotos, Office Dokumente, PDFs und andere Dateitypen enthalten in den Metadaten viele Informationen, die auf den ersten Blick nicht sichtbar sind jedoch vieles verraten können.
- Fotos von Digitalkameras enthalten in den EXIF-Tags eine eindeutige ID der Kamera, Zeitstempel der Aufnahmen, bei neueren Modellen auch GPS-Daten. Die IPTC-Tags können Schlagwörter und Bildbeschreibungen der Fotoverwaltung enthalten. XMP Daten enthalten den Autor und der Comment üblicherweise die verwendete Software.
- Office Dokumente enthalten Informationen zum Autor, letzte Änderungen, verwendete Softwareversion und vieles mehr. Diese Angaben sind auch in PDFs enthalten, die mit der Export-Funktion von OpenOffice.org oder Microsoft Office erstellt wurden.
Vor dem Upload der Dateien ins Internet ist es ratsam, diese überflüssigen Informationen zu entfernen. Es gibt mehrere Firmen, die sich auf die Auswertung dieser Metadaten spezialisiert haben. Ein Beispiel ist die Firma Heypic, die die Fotos von Twitter durchsucht und anhand der GPS-Koordinaten auf einer Karte darstellt. Auch Strafverfolger nutzen diese Informationen. Das FBI konnte einen Hacker mit den GPS-Koordinaten im Foto seiner Freundin finden[1].
Der StolenCameraFinder[2] sucht anhand der Kamera ID in den EXIF-Tags alle Fotos, die mit dieser Kamera gemacht wurden. Da die Kamera ID mit hoher Wahrscheinlichkeit eindeutig einer Person zugeordnet werden kann, sind viele Anwendungen für diese Suche denkbar.
Fotos und Bilddateien anonymisieren
[Bearbeiten]Irfan View [3] (Windows) kann in Fotos mit Öffnen und Speichern die Metatags entfernen. Im Batchmode kann man die Funktion Konvertieren nutzen, um mehrere Bilder mit einem Durchgang zu bearbeiten. Man konvertiert die Fotos von JPEG nach JPEG und gibt dabei in den Optionen an, dass keine EXIF, XMP und IPTC Daten erhalten bleiben sollen.
[htb]
[[Image:../screenshots/irfan1.png|image]] [abb:irfanview]
exiv2 (für Linux) ist ein nettes kleines Tool zum Bearbeiten von EXIF, XMP und IPTC Informationen in Bilddateien. Es ist in den meisten Linux Distributionen enthalten. Nach der Installation kann man z.B. Fotos auf der Kommandozeile säubern:
> exiv2 rm foto.jpg
Allerdings wird damit auch die Information über die Bildorientierung gelöscht. Daher sollte man die Bilder vorher ausrichten.
PDF-Dokumente säubern
[Bearbeiten]Für Windows gibt es das Tool BeCyPDFMetaEdit [4] in einer portablen Version für den USB-Stick oder als Installer. Nach dem Download und evtl. der Installation kann man das Tool starten und die zu säubernden PDF-Dokumente laden. Auf den Reitern Metadaten und Metadaten (XMP) klickt man auf den Button Alle Felder löschen und speichert das gesäuberte Dokument.
[htb]
[[Image:../screenshots/becypdfedit.png|image]] [abb:irfanview]
Metadata Anonymisation Toolkit (MAT)
[Bearbeiten]Metadata Anonymisation Toolkit (MAT)[5] wurde im Rahmen des GSoC 2011 unter Schirmherrschaft von TorProject.org entwickelt. Es ist vor allem unter Linux einfach einsetzbar und kann folgende Datentypen säubern: PNG und JPEG Bilder, PDF-Dokumente, OpenOffice und Microsoft Office Dokumente, MP3 und FLAC Dateien. Das Tool ist in Python geschrieben und braucht einige Bibliotheken. Unter Debian, Ubuntu und Linux Mint installiert man zuerst die nötigen Bibliotheken mit:
> sudo aptitude install libimage-exiftool-perl python-hachoir-core python-hachoir-parser python-poppler python-cairo python-mutagen python-pdfrw
Danach entpackt man das herunter geladene Archiv, wechselt in das neu erstellte Verzeichnis und kann das Programm starten. Es gibt eine Version für die Kommandozeile und eine Version mit grafischer Oberfläche (GUI). Auf der Kommandozeile säubert man Dateien mit:
> mat -b /path/to/datei.ext
Die GUI-Version startet man mit:
> mat-gui
Alternativ kann man MAT auch für alle User installieren mit:
> sudo python setup.py install
In der Programmgruppe Zubehör findet man den Starter für das GUI von MAT. Mit dem + kann man Dateien der Liste hinzufügen und mit dem Besen-Icon daneben säubern. Die gesäuberten Dateien findet im gleichen Verzeichnis, wie die Originale mit der Erweiterung .cleaned. im Namen.
[htb]
[[Image:../screenshots/rmmeta1.png|image]] [abb:mat]