Digitale bildgebende Verfahren: Digitale Bilder

Aus Wikibooks
Wechseln zu: Navigation, Suche

< Digitale bildgebende Verfahren

Dieses Kapitel beschäftigt sich hauptsächlich mit digitalen, zweidimensionalen Rasterbildern. Diese sind im Allgemeinen rechteckig begrenzt, also mit parallelen, geraden Kanten, die in den Ecken in rechten Winkeln aufeinanderstehen.

Dies entspricht zum einen sowohl der historischen Herangehensweise mit photographischen Platten, die aus praktischen Erwägungen rechtwinklig aus Glas hergestellt werden, als auch mit Filmmaterial, wo die Kanten der Bilder parallel beziehungsweise rechtwinklig zu den Filmstreifen angeordnet werden.

Zweidimensionale Rastergraphik mit rechteckig angeordneten Bildpunkten; a Bildpunkte in der Breite und b Bildpunkte in der Höhe

Zum anderen ergibt sich aber bei der digitalen Verarbeitung der Rasterbilddaten mit Computern eine wichtige Randbedingung, die die effiziente Implementierung von Rechenalgorithmen betrifft. In Computern werden zweidimensionale Daten ähnlich wie in Tabellen spalten- und reihenweise in Datenfeldern (englisch: Arrays) gespeichert. Die Kontrollstrukturen, mit denen Computerprogramme erstellt werden können, benutzen ganzzahlige Indizes, mit denen einzelne Spaten oder Reihen sehr effizient bearbeitet werden können. Auch die Adressierung von benachbarten Datenfeldern funktioniert über diese Indices sehr einfach und effizient, was für viele Bildbearbeitungsalgorithmen ausgenutzt wird.

Viele allgemeine Eigenschaften digitaler Bilder sind unabhängig von der Frage, ob die Bilder mehrfarbig oder monochrom sind. Auf die Farben in digitalen Bildern wird aber in mehreren Abschnitten eingegangen.

Inhaltsverzeichnis

Digitale Berechnung [Bearbeiten]

Ein mit einem Computerprogramm als skalierbare Vektorgraphik erstelltes Bild einer Kamera

Digitale Bilder können direkt mit einem Computer erstellt werden, indem ein geeignetes Computerprogramm digital gespeicherte Messwerte oder Anweisungen eines Benutzers intern umsetzt.

Einfache Beispiele sind Computerprogramme zur Tabellenkalkulation, die Zahlen auch graphisch darstellen können, oder Programme zur Erstellung von Vektorgraphiken.

Bild- und Videobearbeitungsprogramme können aus bereits digital vorliegenden Ausgangsdaten (zum Beispiel auch Rohdaten) veränderte Bilder oder Bilderfolgen berechnen. Dies wird sehr häufig eingesetzt, um die Bilder so zu transformieren, so dass die subjektiv wahrgenommene oder aber auch die objektive Bildqualität verbessert wird. Dabei kann eine Vielzahl von verschiedenen Bildparametern variiert werden, wie zum Beispiel die Helligkeit, der Kontrast, der Kontrastverlauf, die Farben, die Bildauflösung ober die Ausrichtung bis hin zu perspektivischen Verzerrungen oder Montagen mehrerer Bilder.

Vektorisierung [Bearbeiten]

Bei digitalen Bildern, die aus einzelnen Bildpunkten zusammengesetzt sind, gibt es keine informationstechnischen Verknüpfungen oder Beziehungen zwischen den Bildpunkten, die über das rechteckige und rechtwinklige Anordnen der Bildpunkte hinausgehen.

Benachbarte Punkte können dieselbe Helligkeit oder Farbe aufweisen, ohne dass dies in den Bilddaten kodiert ist. Solche Beziehungen zwischen zusammengehörigen Bildpunkten können mit geeigneter Software erstellt oder in vorhandenen gerasterten Bildern ermittelt werden. Typische Beispiele für auszeichenbare topographische Gebilde in digitalen Bildern sind isolierte Punkte, gerade oder nach bestimmten Regeln gekrümmte Linien oder durch geschlossene Linienzüge begrenzte Flächen mit oder ohne Füllung, die auch als graphische Primitive bezeichnet werden. Die Orte der zur Beschreibung dieser Gebilde verwendbaren Punkte - seien es Anfangs-, End- oder Eckpunkte - können mathematisch durch Vektoren definiert werden.

Die graphischen Objekte können bei der Anzeige – auch bei einem Punktdurchmesser oder einer Strichstärke von null – minimal mit dem Durchmesser der dargestellten Bildpunkte wiedergegeben werden. Es ist aber auch möglich, den Punkten einen definierten Durchmesser oder den Linien eine bestimmte Breite zuzuordnen, so dass diese dann gegebenenfalls auch mit mehr als einem Bildpunkt dargestellt werden.

Vektorisierte Bilddaten haben eine Reihe von Vorteilen:

  • Die Datenmenge für die vektorielle Beschreibung von einigen wenigen geeigneten Punkten ist oft erheblich geringer als die Datenmenge für die Beschreibung aller beteiligten Punkte in einem Punktraster
  • Vektoren können mit einfachen mathematischen Transformationen beliebig skaliert, gedreht, gespiegelt oder verschoben werden
  • Mit Vektoren können Abbildungen auch ohne weiteres in drei- oder mehrdimensionalen Räumen realisiert werden, wobei sich die Datenmenge im Vergleich zu gerasterten Daten dann nochmals drastisch reduzieren kann. Mittels geeigneter mathematischer Projektionen lassen sich ohne großen Aufwand zweidimensionale Ansichten, Schnitte oder Perspektiven der Bilddaten erzeugen

Auf der anderen Seite gibt es auch Gründe, die für die Verwendung von gerasterten Bilddaten sprechen:

  • Bei einer optischen Abbildung stehen die Informationen über die Beziehungen von benachbarten Punkten nicht unmittelbar zur Verfügung, sondern müssen mit aufwendigen Verfahren im Anschluss an die Aufnahme ermittelt werden
  • Bei Bildern mit sehr heterogener Verteilung der Helligkeiten und Farben ist es in der Regel sehr schwierig, Bezüge zwischen benachbarten Punkten herzustellen
  • Bei komplexen Bildern wird die Datenmenge zur vollständigen Beschreibung der Bildinhalte mit Vektoren deutlich größer als bei gerasterten Daten
  • Gerasterte Daten lassen sich zur Reduktion der Datenmenge meist sehr effizient komprimieren, ohne dass es zu wesentlichen Informationseinbußen kommt

Diese Aspekte führen dazu, dass vektorisierte Daten insbesondere bei der manuellen Erstellung von Bilddaten Verwendung finden (Graphik) und gerasterte Daten vorwiegend bei der maschinellen Erstellung anfallen (Photographie, bildgebende Verfahren).

Wie auch immer, es ist meist leicht möglich, Vektorgraphiken in Rasterdaten umzuwandeln. Als Parameter muss lediglich eine Punktdichte oder die gewünschte Bildauflösung des gesamten Rasterbildes vorgegeben werden.

Umgekehrt ist es meist deutlich schwieriger, insbesondere wenn die gerasterten Vorlagen schlechten Kontrast oder eine schlechte Auflösung haben. Eine besondere Form der Vektorisierung ist die optische Schriftzeichenerkennung (auch OCR für englisch: Optical Character Recognition), die in großem Umfang zur Umwandlung von gerasterten Textvorlagen in Textdokumente eingesetzt wird.

Bilddateiformate [Bearbeiten]

Es gibt eine Vielzahl von Dateiformaten für gerasterte Bilddaten (englisch: bitmap). Zu den am weitesten verbreiteten allgemein verwendbaren Formaten gehören zum Beispiel:

  • JPEG (englisch: Joint Picture Expert Group = Gemeinsame Bildexperten-Gruppe), das eine flexible Datenkompression sowie vorgegebene und proprietäre Metadaten zulässt, jedoch je nach Qualität und Stärke der Datenreduktion immer mit einem mehr oder weniger starken Informationsverlust behaftet ist und von allen Webbrowsern wiedergegeben werden kann
  • DNG (englisch: Digital Negative = digitales Negativ) als Nachfolger von TIFF (englisch: Tagged Image File Format = Mit „Anhängern“ (Attributen) versehenes Dateiaustauschformat) zur verlustfreien Speicherung von Rohdaten und Metadaten, das nur in Anspielung auf den Umkehrfilm als „Negativ“ bezeichnet wird, obschon die Bildinformation in aller Regel ohne die Umkehrung von Farb- und Helligkeitswerten gespeichert wird
  • PNG (englisch: Portable Network Graphics = portierbare Netzwerkgraphik) mit verlustfreier Datenkompression ist der Nachfolger von GIF (Graphics Interchange Format = Graphikaustauschformat) und kann von allen Webbrowsern wiedergegeben werden

Es ist zu beachten, dass die meisten Speicherformate für gerasterte Bilddaten wegen der Adressierung von Graphikspeicher in Rechenmaschinen den Koordinatenursprung (0 | 0) links oben im Bild haben. Die positive horizontale Achse verläuft also von links oben nach rechts und die positive vertikale Achse von links oben nach unten.

Typische Dateiformate für vektorisierte Graphiken sind:

  • DXF (englisch: Drawing Exchange Format = Zeichnungsaustauschformat)
  • SVG (englisch: Scalable Vector Graphics = skalierbare Vektorgraphik) mit ausschließlich zweidimensionalen Vektoren und kann von allen Webbrowsern wiedergegeben werden
  • PostScript, das als Seitenbeschreibungssprache vor allem für die Druckausgabe entwickelt wurde, aber auch das PDF (englisch: Portable Document Format = portierbares Dokumentenformat) beeinflusst hat, als Encapsulated PostScript (abgekapseltes PostScript) für einzelne graphische Druckseiten verwendet wird und auch zur Einbettung und Speicherung von gerasterten Daten verwendet werden kann

Bildeigenschaften digitaler Bilder [Bearbeiten]

Einige Bildeigenschaften spielen nur im Zusammenhang mit digitalen Bildern eine Rolle, da die entsprechenden Größen und Zusammenhänge bei analogen Bildern nicht vorhanden sind. In den folgenden Abschnitten finden sich daher einige für digitale BIlder wichtige und wesentliche Eigenschaften.

Bildauflösung [Bearbeiten]

Ein sehr wichtiger Parameter für digitale Rasterbilder ist die Bildauflösung oder Pixelzahl. Diese kann entweder als 2-Tupel (N_x, N_y) mit der Angabe der Bildpunkte in der Bildbreite N_x und in der Bildhöhe N_y oder als Produkt N dieser beiden Werte angegeben werden:

N = N_x \cdot N_y

Als Maßeinheit für die Anzahl der Bildpunkte wird in der Regel Pixel beziehungsweise Megapixel verwendet.

In der Regel sind die Bildpunkte quadratisch, so dass das Verhältnis exakt das geometrische Verhältnis beim wiedergegebenen Bild widerspiegelt. Obwohl die Diagonale die Bildpunnkte unregelmäßig schneidet, kann die effektive Anzahl der Bildpunkte entlang der Bilddiagonalen N_d mit Hilfe des Satzes des Pythagoras über die folgende Beziehung ermittelt werden:

N_d = \sqrt {{N_x}^2 \cdot {N_y}^2} = N_x \cdot \sqrt {1 + \frac {1}{q^2}} = N_y \cdot \sqrt {1 + q^2}

Bildseitenverhältnis [Bearbeiten]

Verschiedene Bildseitenverhältnisse in willkürlichen Größen

Das Bildseitenverhältnis wird als das Verhältnis q der Anzahl der Bildpunkte in der Breite zur Anzahl der Bildpunkte in der Höhe angegeben:

q = N_x \colon N_y \!\

Das Verhältnis wird im Allgemeinen als rationale Zahl mit einem Doppelpunkt und nicht mit einem Bruchstrich oder als reelle Zahl angegeben.

Das Bildseitenverhältnis von 4:3 stammt vom analogen Fernsehen und wurde für die ersten Computer-Monitore übernommen - die meisten digitalen Kameras haben daher Bildsensoren mit diesem nativen Bildseitenverhältnis; auch die ersten digitalen Camcorder hatten Bildsensoren im Verhältnis 4:3.

Das Bildseitenverhältnis 3:2 stammt aus der analogen Photographie mit Kleinbildfilm; es wird auch bei vielen digitalen Spiegelreflexkameras eingesetzt, wo dieses feste Bildseitenverhältnis auch durch die optischen Sucher vorgegeben ist.

Bei Videoanwendungen hat sich das Bildseitenformat 16:9 durchgesetzt, das sich auch bei den entsprechenden Wiedergabegeräten, wie digitalen Fernsehgeräten und Projektoren, sowie teilweise auch bei Computer-Monitoren wiederfindet. Beim DVD-Format gab es zunächst noch viele ältere Wiedergabegeräte mit dem Bildseitenverhältnis 4:3 und dann zunehmend neuere Wiedergabegeräte mit dem Bildseitenverhältnis 16:9. Die Bildpunkte dieses Formates sind nicht quadratisch und können bei den Wiedergabegeräten eingestellt werden.

Bildformate [Bearbeiten]

In der folgenden Tabelle sind einige wichtige digitale Bildformate angegeben:

Bildformat
Bezeichnung
Anzahl der Bildpunkte
N_x in Pixel
Anzahl der Bildpunkte
N_y in Pixel
Anzahl der Bildpunkte
N in Megapixel
Bildseitenverhältnis
VGA 640 480 0,3 4:3
DVD 720 576 0,4 4:3 oder 16:9
SVGA 800 600 0,5 4:3
XGA 1024 768 0,8 4:3
HD ready 1280 720 0,9 16:9
SXGA 1280 1024 1,3 5:4
UXGA 1600 1200 1,9 4:3
Full HD 1920 1080 2,0 16:9
QXGA 2048 1536 3,1 4:3
4k 4096 3072 12,6 4:3

Siehe auch Abschnitt Bildsensoren.

Ortsauflösung [Bearbeiten]

Entsprechend der Bildauflösung gibt es für die Ortsauflösung eine maximale Anzahl von Informationseinheiten, die entlang der Bildhöhe beziehungsweise der Bildbreite erfasst werden können. Bei Filmmaterial wurde diese Informationsdichte meist richtungsunabhängig in Linienpaaren pro Millimeter ermittelt und angegeben. Bei digitalen Bildern hat es sich durchgesetzt, Linienpaare pro Bildhöhe (horizontale Linien, abwechselnd hell und dunkel) als Bezugsgröße zu verwenden. Diese Bezugsgröße wird dann ebenfalls für die Informationseinheiten in horizontaler Richtung (vertikale Linienpaare) oder für jeden beliebigen anderen Azimut (also schräg liegende Linienpaare) verwendet. Rechnerisch ergibt sich die maximal darstellbare Linienauflösung L_{max} durch die Halbierung der Anzahl der Punkte in der Bildhöhe:

L_{max,\,y} = \frac {N_y} {2}

Dieser Wert entspricht genau der Grenze nach dem Nyquist-Shannon-Abtasttheorem (auch Whittaker-Kotelnikow-Shannon-Abtasttheorem) für die maximal darstellbaren Ortsfrequenzen f_{Nyquist}, wonach diese innerhalb einer Periode mindestens zwei abgetastete Stützstellen haben müssen:

L_{max,\,y}\!=\!f_{Nyquist} (siehe auch Abschnitt Ortsfrequenz)

Für die maximale Anzahl vertikaler Linienpaare in horizontaler Richtung ergibt sich mit dem Bildseitenverhältnis q dann einfach:

L_{max,\,x} = q \cdot L_{max,\,y} = \frac {N_x} {2}

Punktdichte [Bearbeiten]

Der Abbildungsmaßstab ist zwar in Bezug auf das registrierende optoelektronische Bauelement real, da ja die betrachte Abbildung eine reale Abbildung ist, jedoch ist dieser Abbildungsmaßstab in der abstrakten digitalen Darstellung der Daten nicht mehr relevant, solange den einzelnen Bildpunkte nicht eine absolute Größe zugeordnet werden kann. Diese Bildpunkte – auch als Pixel bezeichnet (englisches Kunstwort aus den beiden Begriffen picture element zusammengesetzt) – haben auf dem Bildsensor einen bestimmten Abstand, der auch als Pixelpitch bezeichnet wird und meist in Mikrometern (µm) angegeben wird. Abgesehen von der Tatsache, dass die Oberfläche eines Bildsensors nicht notwendiger Weise vollständig zur Lichtdetektion zur Verfügung steht, da zwischen den Bildpunkten meist optisch inaktive Zonen vorhanden sind, kann der Abstand der Pixel für Betrachtungen, die das gesamte digitale Bild betreffen auch als Pixelgröße s betrachtet werden.

Wenn der Bildpunktabstand den digitalen Bildern eindeutig zugeordnet werden kann, zum Beispiel in den Metadaten einer Bilddatei, kann auch die Größe des realen Bildes rückwirkend eindeutig ermittelt werden. Ansonsten muss eine bestimmte Punktdichte festgelegt oder bestimmt werden, mit der die digitalen Bildpunkte wiedergegeben werden. Diese Punktdichte R wird häufig in der traditionellen Maßeinheit dpi (englisch für dots per inch = Punkte pro Zoll) angegeben, die sich rechnerisch aus dem entsprechenden Verhältnis zur in Millimetern angegebenen Pixelgröße ergibt:

R = \frac{C}{s},

mit der Konstante C = 25,4 \frac {mm}{Zoll}

Bei vorgegebener Punktdichte R in dots per inch ergibt sich die Pixelgröße in Millimetern s zu:

s = \frac{C}{R}

Da die Pixelgröße bei rechteckigen Bildpunkten in vertikaler und horizontaler Richtung verschieden sein kann, muss diese Betrachtung gegebenenfalls für diese beiden Richtungen getrennt durchgeführt werden.

Die Bildgröße in den senkrecht aufeinanderstehenden Längen x (Bildbreite) und y (Bildhöhe) ergibt sich mit Hilfe dieser Umrechnung aus der Anzahl der Bildpunkte in der Bildbreite N_x und in der Bildhöhe N_y und der entsprechenden Pixelgröße in horizontaler Richtung s_x beziehungsweise in vertikaler Richtung s_y:

x = s_x \cdot N_x

y = s_y \cdot N_y

Diese Überlegung kann ohne weiteres auch auf die Bilddiagonale d übertragen werden, wenn N_d die Anzahl der Bildpunkte auf der Diagonalen ist:

d = \sqrt {s_x^2 + s_y^2} \cdot N_d

Bei quadratischen Bildpunkten vereinfacht sich diese Beziehung zu:

d = s \cdot N_d = \frac{C}{R} \cdot N_d = \frac{C}{R} \cdot \sqrt {N_x^2 + N_y^2}

Die Diagonale eines Bildes - bei einem bestimmten Betrachtungsabstand gilt sies auch für den Bildwinkel respektive den Betrachtungswinkel - hängt also nur von der Punktdicht und der Anzahl der Bildpunkte ab.

Der Bildwinkel \alpha ergibt sich beim Betrachtungsabstand b dann zu:

\alpha = 2 \cdot \arctan\left(\frac {C \cdot N_d}{2 \cdot R \cdot b}\right) = 2 \cdot \arctan\left(\frac {s \cdot N_d}{2 \cdot b}\right)

Wird der Betrachtungswinkel \alpha festgelegt, ergibt sich der entsprechende Betrachtungsabstand b zu:

b = \frac {C \cdot N_d}{2 \cdot R \cdot \tan {\frac {\alpha}{2}}} = \frac {s \cdot N_d}{2 \cdot \tan {\frac {\alpha}{2}}} = \frac {d}{2 \cdot \tan {\frac {\alpha}{2}}}

Beim Betrachtungswinkel bei Normalbrennweite von \alpha = 46,8^\circ ergibt sich der normale Betrachtungsabstand b_{norm} aus den übrigen Konstanten zu:

b_{norm} \approx \frac {C \cdot N_d}{0,865 \cdot R} = \frac {s \cdot N_d}{0,865} = \frac {d}{0,865} \approx 1,16 \cdot d = c \cdot d

mit

c = \frac {f_{norm}}{d} (siehe auch Abschnitt Normalbrennweite)

Betrachtet man also ein Bild mit der Diagonale d aus dem Abstand b_{norm}, der etwas (16 Prozent) mehr als die Bilddiagonale beträgt, sieht man die Bildecken unter dem normalen Bildwinkel von 46,8°. Diese Bildweite entspricht der Normalbrennweite f_{norm}, die erforderlich ist, um ein Bild mit normalen Bildwinkel aus dem Unendlichen zu projizieren, da für den Grenzwert der Gegenstandsweite g gegen unendlich für die normale Bildweite b_{norm} gilt:

\lim_{g \to \infty} b_{norm}(g) = \lim_{g \to \infty} \frac {1}{\frac {1}{f_{norm}} - \frac {1}{g}} = f_{norm}

Bittiefe [Bearbeiten]

Die Bittiefe gibt an, in welchem dynamischen Umfang Helligkeitsunterschiede in digitalen Bildern gespeichert werden können. Der maximale Helligkeitswert H_{max} ergibt sich aus der Anzahl der Bits, die für einen ganzzahligen Wert zur Verfügung stehen:

H_{max} = 2^B\!\

Die minimale Helligkeit liegt bei 0.

Die möglichen digitalen Helligkeitswerte H_d liegen also im Bereich von 0 bis H_{max}:

0 \leq H_d \leq H_{max} mit H_d \in \N_0

Diese Überlegungen gelten sowohl für die Helligkeit in Graustufenbildern, als auch für die einzelnen Farbkanäle in Farbbildern, wo dann von der Farbtiefe gesprochen wird. Bei den drei Farbkanälen rot, grün und blau, die den Primärfarben entsprechen, ergibt sich für die digitalen Helligkeitswerte dieser drei Farben dementsprechend:

0 \leq H_r \leq H_{max} mit H_r \in \N_0

0 \leq H_g \leq H_{max} mit H_g \in \N_0

0 \leq H_b \leq H_{max} mit H_b \in \N_0

Bei dem standardisierten Dateiformat JPEG (Joint Picture Expert Group) stehen für die drei Primärfarben jeweils acht Bits zur Verfügung, so dass also für jeden Punkt und für jeden Farbkanal 256 verschiedene, ganzzahlige Helligkeitswerte von 0 bis 255 gespeichert werden können.

Bei Rohdatenspeicherung werden in der Regel mehr als acht Bits pro Farbkanal gespeichert, je nachdem welche Genauigkeit und Dynamik der Bildwandungsprozess und der Analog-Digital-Wandler haben. Rohdatenformate sind oft nicht nur für einzelne Anbieter proprietär, sondern häufig sogar für einzelne Geräte. Mit dem Dateiformat DNG (englisch: Digital Negative = digitales Negativ) wurde ein standardisiertes Rohdatenformat geschaffen, das zunehmend Unterstützung findet.

Speicherbedarf [Bearbeiten]

Der Speicherbedarf M (englisch: memory) in Bytes (1 Byte = 8 Bit) lässt sich aus der Anzahl der Farbkanäle N_F, der Bittiefe pro Farbkanal B und der Bildauflösung N ermitteln:

M = \frac {N_F \cdot B \cdot N}{8 \frac {Bits}{Byte}}

Nicht-komprimierte, monochrome Bilddaten mit einer Bittiefe von 8 Bits benötigen daher genauso viele Bytes, wie sie Bildpunkte beinhalten. Ist eine höhere Helligkeitsauflösung mit einer Bittiefe von 16 Bits erforderlich, um zum Beispiel die Nachbearbeitung von Bildausschnitten zu ermöglichen, ergibt sich ein doppelt so großer Speicherbedarf. Monochrome Bilder benutzen in der Regel nur einen Farbkanal, Farbbilder werden jedoch üblicherweise mit drei Farbkanälen gespeichert, die den drei Primärfarben rot, grün und blau (RGB) entsprechen, wodurch sich der Speicherbedarf gegenüber monochromen Bilddaten verdreifacht. In der folgenden Tabelle finden sich einige Beispielwerte für nicht-komprimierte, dreifarbige Bilder mit einer Bittiefe von 8 Bits pro Farbkanal:

Bildauflösung
N in Megapixel
Speicherbedarf
M in Megabytes
1 3
2 6
4 12
8 24
16 48
32 96

Durch geeignete und hochwertige Bildkompressionsverfahren - zum Beispiel unter Verwendung des weit verbreiteten JPEG-Formats, das mit drei Farbkanälen (RGB) und einer Bittiefe von 8 Bit pro Farbkanal definiert ist - lässt sich der Speicherbedarf ohne nenn- oder erkennbare Verluste oft auf etwa 10 Prozent der unkomprimierten Werte reduzieren.

Bildbearbeitung [Bearbeiten]

Dank schneller digitaler Datenverarbeitung können digitale Bilder in kurzer Zeit analysiert und verändert werden. Oft findet eine umfangreiche Bildbearbeitung bereits unmittelbar nach der Aufnahme der Bilddaten mit Hilfe einer Firmware innerhalb von optischen, digitalen Geräten statt. Es besteht aber auch die Möglichkeit weitgehend unbearbeitete Daten, sogenannten Rohdaten zu speichern. Eine Bildbearbeitung kann aber auch nach dem Speichern der Bilddaten in einer Datei zu einem beliebigen späteren Zeitpunkt mit einer geeigneten Software erfolgen. Das Ergebnis einer solchen Bearbeitung wird in der Regel in einer weiteren Datei gespeichert, damit die Originaldaten für eventuell später erforderliche Prozesse erhalten bleiben.

In den folgenden Abschnitten werden einige wichtige Verfahren und Begriffe in diesem Zusammenhang beschrieben.

Digitalzoom - Softwarelupe [Bearbeiten]

Bei digitalen Bildern ist es sehr leicht möglich, nur einen rechteckigen Ausschnitt des gesamten Bildes zu betrachten. Hierbei ändern sich bei konstanter Brennweite sowohl der Abbildungsmaßstab als auch der Bildwinkel, so dass ein Effekt wie bei der vollständigen Aufnahme mit einer entsprechend längeren Brennweite entsteht.

Es ist allerdings zu beachten, dass ein solcher digital gezoomter Ausschnitt über weniger Bildpunkte verfügt als das Gesamtbild und die Bildauflösung somit reduziert ist. Dies ist solange kein Problem, wie das verwendete Wiedergabegerät beim Einsatz der sogenannten Softwarelupe nicht mehr Bildpunkte hat, als der gewählte Bildausschnitt, da dann höchstens so viele Informationen vorhanden sind, wie dargestellt werden können. Wird der Digitalzoom noch weiter erhöht, müssen die für die Anzeige erforderlichen Punkte (N_{x, Anzeige}, N_{y, Anzeige}) zum Beispiel durch Interpolation oder Punktverdopplung aus den verfügbaren Bildpunkten ((N_{x, Bild}, N_{y, Bild}) berechnet werden, wobei sich allerdings für den Betrachter kein Informationsgewinn ergibt, sondern die Bilder bei hinreichend genauer Betrachtung nur grob gerastert beziehungsweise unscharf wirken.

Üblicherweise wird der Digitalzoom als Faktor z_d oder in Prozent z_{d%} angegeben, wobei sich dieser Wert auf die Längenskalierung und nicht auf die Flächenskalierung bezieht, also:

z_d = \frac {N_{x,\,Anzeige}}{N_{x,\,Bild}} = \frac {N_{y,\,Anzeige}}{N_{y,\,Bild}} = \frac {N_{d,\,Anzeige}}{N_{d,\,Bild}}

beziehungsweise

z_{d%} = \frac {N_{x,\,Anzeige}}{N_{x,\,Bild}} \cdot 100% = \frac {N_{y,\,Anzeige}}{N_{y,\,Bild}} \cdot 100% = \frac {N_{d,\,Anzeige}}{N_{d,\,Bild}} \cdot 100%

Wird bei optischen Geräten zur Bildaufnahme vor der Aufnahme das Bild auf einem Monitor oder in einem elektronischen Sucher wiedergegeben („Live-View“), kann mit Hilfe der Softwarelupe ein beliebiger Ausschnitt des Bildes mit einhundertprozentigem Digitalzoom dargestellt werden. Dies ist besonders zur Einstellung der korrekten Entfernung am Objektiv sehr hilfreich, hilft aber beispielsweise auch beim Erkennen von Bildrauschen.

Histogramme [Bearbeiten]

Histogramme (rechts) eines farbigen Bildes mit zufällig verteilten Tonwerten (links)

Histogramme sind Diagramme, die die Häufigkeitsverteilung der diskreten Helligkeiten in digitalen Bildern angeben. Dabei ist es üblich, auf der horizontalen Achse die Helligkeitswerte (respektive Tonwerte) von dunkel nach hell aufzutragen und bei jedem ganzzahligen Helligkeitswert die Anzahl der im gesamten Bild (oder einem vorher zu definierenden Teilbereich) auftretenden Bildpunkte in vertikaler Richtung anzugeben.

Histogramme können für die gesamte Luminanz oder auch getrennt nach Farbkanälen ausgegeben werden.

Gammakorrektur [Bearbeiten]

Um die mittleren Helligkeiten eines digitalen Bildes anzupassen, ohne die minimale Helligkeit (schwarz) und die maximale Helligkeit (weiß) zu ändern, kann eine rechnerische Gammakorrektur durchgeführt werden, um eine Eingangshelligkeit E in eine Ausgangshelligkeit A umzuwandeln. Der Name dieser Korrektur rührt vom Exponenten \gamma der Übertragungsfunktion her:

A = E^{\gamma}\!\

mit

A, E \in \R \mid [0, 1]

und

\gamma \in \R \mid (0, \infty)

Die Werte für die Eingangshelligkeiten E ergeben sich aus den digitalen Zahlenwerten für die Helligkeit H_d folgendermaßen:

E = \frac {H_d}{H_{max}}

Der reellwertige Exponent \gamma ist hierbei immer positiv. Die Null und die Eins - also der dunkelste und der hellste Helligkeitswert - bleiben nach der Transformation erhalten, die dazwischenliegenden Werte werden entweder alle vergrößert (\gamma < 1) oder alle verkleinert (\gamma > 1). Bei \gamma = 1 behalten alle Helligkeiten ihren Wert (identische Abbildung).

Die Gammakorrektur kann daher eingesetzt werden, wenn in einem Bild zwar alle Tonwerte vorhanden sind, jedoch die mittleren Tonwerte zu hell oder wie in folgendem Beispiel zu dunkel wirken:

Die Gammakorrektur kann bei Bedarf auch für alle Farbkanäle unabhängig eingestellt werden, wie zum Beispiel bei den drei Primärfarben rot, grün und blau:

A_r = E_r^{\gamma_r} = \left(\frac {H_r}{H_{max}}\right)^{\gamma_r}

A_g = E_g^{\gamma_g} = \left(\frac {H_g}{H_{max}}\right)^{\gamma_g}

A_b = E_b^{\gamma_b} = \left(\frac {H_b}{H_{max}}\right)^{\gamma_b}

Tonwertkorrektur [Bearbeiten]

Weißpunkt [Bearbeiten]

Wenn der Spielraum der ebenfalls Tonwerte genannten Helligkeitswerte in einem digitalen Bild nicht ausgenutzt wird - bei unterbelichteten Bildern ist dies üblicherweise der Fall, da die höheren Helligkeitswerte nicht auftauchen -, ist es sinnvoll, die Helligkeitswerte gleichmäßig zu erhöhen, damit bei der Wiedergabe ein klares Bild mit der Möglichkeit von schwarzen und weißen Bildpunkten entsteht. Die Ausgangswerte A ergeben sich dann auf einfache Weise aus den Eingangswerten E durch eine lineare Transformation:

A = c \cdot E

mit

c = \frac {H_{max}} {E_{max}},

wobei E_{max} die maximale im Eingangsbild auftretende Helligkeit ist. Im Ausgangsbild ist nach der Transformation die maximal auftretende Helligkeit gleich 1. Entsprechende Punkte werden auch als die Weißpunkte des Bildes bezeichnet.

Weißabgleich [Bearbeiten]

Eine Tonwertkorrektur kann auch separat für alle vorhandenen Farbkanäle, meist die Primärfarben rot, grün und blau, durchgeführt werden. Um einen Bildbereich farbneutral, also ohne Farbstich, zu bekommen, müssen die entsprechenden Tonwerte der Farbkanäle auf die gleichen Helligkeiten gerechnet werden - diesen Vorgang bezeichnet man als Weißabgleich. Bei Aufnahmesystemen mit automatischem Weißabgleich wird oft in jedem Farbkanal der hellste Punkt gesucht, und mit deren Tonwerten werden die Korrekturen für die einzelnen Farbkanäle ausgerechnet. Bei den üblicherweise verwendeten Primärfarben ergibt sich dann:

A = \begin{pmatrix} A_r \\ A_g \\ A_b \end{pmatrix} = c \cdot E = c \cdot \begin{pmatrix} E_r \\ E_g \\ E_b \end{pmatrix} = \begin{pmatrix} c_r \cdot E_r \\ c_g \cdot E_g \\ c_b \cdot E_b \end{pmatrix}

mit

c = \begin{pmatrix} c_r & c_g & c_b \end{pmatrix} = \begin{pmatrix} \frac {H_{max}} {E_{r, max}} & \frac {H_{max}} {E_{g, max}} & \frac {H_{max}} {E_{b, max}} \end{pmatrix}

wobei E_{r, max}, E_{g, max} und E_{b, max} die maximalen im Eingangsbild auftretenden Helligkeiten der drei Farbkanäle sind. Im Ausgangsbild ist nach der Transformation die maximal auftretende Helligkeit für alle Farbkanäle gleich 1. Punkte mit diesen Tonwerten werden auch hier als Weißpunkte bezeichnet.

Problematisch ist der automatische Weißabgleich, wenn es im Eingangsbild gar keine Punkte gibt, die dem Weißpunkt entsprechen. Solche Umstände liegen vor, wenn das aufgenommene Objekt keine weißen Punkte enthält oder monochromatische Punkte die hellsten im Bild sind. Eine typische Situation sind Sonnenauf- und -untergänge, bei der das helle Sonnenlicht eine deutliche Rotfärbung der Szenerie verursacht. Hier ist es in der Regel vorzuziehen, die Farbkanäle nicht für den hellsten Punkt, sondern für einen farbneutralen Punkt (Graupunkt) anzugleichen.

Graukarte mit einem Grauwert von 16 Prozent (entspricht also einer Bildhelligkeit von 84 Prozent) zum Ermitteln eines korrekten Weißabgleiches

Als photographisches Hilfsmittel gibt es Graukarten, die vor der eigentlichen Aufnahme zur manuellen Einstellung des Weißabgleichs eines Aufnahmesystems verwendet werden können. Auch weiße Karten finden hierzu Anwendung, jedoch besteht hierbei unter Umständen die Gefahr einer Überbelichtung, die die Messergebnisse verfälschen würde. Bei weißen Referenzflächen ist also darauf zu achten, dass die Tonwerte nicht in der Sättigung sind.

Farbmanagement [Bearbeiten]

RGB-Daten [Bearbeiten]

Gerechnetes Bild mit vielen Kombinationen der Primärfarben rot, grün und blau (RGB) bei verschiedenen Farbintensitäten

CMYK-Farbmodell [Bearbeiten]

Farbräume [Bearbeiten]

(sRGB, ECI, LAB)

Bildfehler [Bearbeiten]

Helligkeitsrauschen [Bearbeiten]

Beispiel für reines graustufiges 1/f-Rauschen (Luminanzrauschen)

Beim Helligkeitrauschen (Luminanzrauschen) handelt es sich um eine zufällige, mehr oder weniger stark sichtbare Schwankungen bei der Bildhelligkeiten einzelner Bildpunkte, die bei digitalen Bildsensoren durch das Dunkelstromrauschen, durch den Ausleseprozess und durch das Quantisierungsrauschen der Analog-Digital-Wandler verursacht werden. Bei Halbleitern kann der Dunkelstrom und somit das Dunkelstromrauschen durch Kühlung drastisch reduziert werden. Bei einer Erwärmung um mehrere Kelvin verdoppelt sich das Dunkelstromrauschen von Bildsensoren typischerweise.

Simulierte Bilder [Bearbeiten]

Im folgenden wird das Aussehen von Helligkeitsrauschen anhand eines von einer digitalen Kamera aufgenommenen schwarz-weißen Musters demonstriert, dem künstlich und zunehmend ein farbloses 1/f-Rauschen hinzugefügt wurde.

Rauschreduktion [Bearbeiten]

In der nächsten Zusammenstellung ist der Effekt einer nachträglichen Rauschreduktion in den Bildern zu erkennen. Meist werden die Kontrastanteile bei hohen Ortsfrequenzen verringert, wobei allerding auch die entsprechenden Strukturen, die nicht auf dem Rauschen beruhen, eliminiert werden können. Da bei einer Rauschreduktion häufig extrem große und kleine Helligkeiten eliminiert werden, kann der Bildkontrast nach der Rauschreduktion oft erhöht werden, indem der Weißpunkt und der Schwarzpunkt der Bilder optimiert werden.

Gaußsche Weichzeichnung [Bearbeiten]

Ein sehr einfach zu implementierendes Verfahren zur Rauschreduktion ist der Gaußsche Weichzeichner. Hierbei werden die Helligkeiten der einzelnen Bildpunkte mit den Helligkeiten in der Umgebung gewichtet gemittelt. Je mehr Punkte in der Umgebung dazu herangezogen werden, desto niedrigere Ortsfrequenzen werden in ihrer Modulation verringert, so dass die Bilder zunehmend grob strukturiert werden, wobei es keine schnellen Kontrastwechsel mehr gibt. Bei zu starker Weichzeichnung verschwindet nicht nur das Bildrauschen, sondern auch jegliche beabsichtigten Strukturen in den Bildern, so dass auch diese schließlich gar nicht mehr erkannt werden können.

Farbrauschen [Bearbeiten]

Beispiel für reines farbiges 1/f-Rauschen (Chrominanzrauschen)

Beim Farbrauschen (Chrominanzrauschen) handelt es sich um eine zufällige, mehr oder weniger stark sichtbare Schwankungen bei den Farbwerten einzelner Bildpunkte, die die gleichen Ursachen haben wie das Helligkeitsrauschen.

Die folgende Zusammenstellung zeigt Aufnahmen einer nicht reflektierenden schwarzen Scheibe in heller Umgebung, die bei verschiedenen Empfindlichkeiten (ISO-Zahlen) sowohl als kameraintern bearbeite JPEG-Datei als auch als kameraintern unbearbeitete Rohdaten-Datei gespeichert wurden. Zur besseren Erkennbarkeit wurden die geringen Helligkeiten durch eine Gamma-Korrektur bei allen Aufnahmen im gleichen Maße aufgehellt:

Blooming [Bearbeiten]

Gibbssches Phänomen [Bearbeiten]

Kompressionsverluste [Bearbeiten]

Moiré-Muster [Bearbeiten]

Rolling-Shutter-Effekt [Bearbeiten]

Smear-Effekt [Bearbeiten]

Videoaufnahme mit der Demonstration des Smear-Effektes bei einer CCD-Kamera durch das Ein- und Ausschalten einer hellen Lichtquelle im Bildfeld:

Geisterflecke [Bearbeiten]