Fachinformatik/ Information

| Inhaltsverzeichnis | Netzwerktechnik >

In diesem Kapitel befassen wir uns mit Zahlen, Information und ihrer Codierung.

Zahlensysteme und die Darstellung von Zahlen

Rechnen in verschiedenen Zahlensystemen

binär (dual)	1	10	11	100	101	110	111	1000	1001	1010	1011	1100	1101	1110	1111	10000
oktal	1	2	3	4	5	6	7	10	11	12	13	14	15	16	17	20
dezimal	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16
hexadezimal	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F	10

Anwendungsbeispiele


Hex.	Dualsystem				Dez.


0	0	0	0	0	00
1	0	0	0	1	01
2	0	0	1	0	02
3	0	0	1	1	03



4	0	1	0	0	04
5	0	1	0	1	05
6	0	1	1	0	06
7	0	1	1	1	07



8	1	0	0	0	08
9	1	0	0	1	09
A	1	0	1	0	10
B	1	0	1	1	11



C	1	1	0	0	12
D	1	1	0	1	13
E	1	1	1	0	14
F	1	1	1	1	15

Oktalsystem

Unix-Dateirechte lassen sich mit dem Befehl chmod ändern. Dabei kann u.a. eine oktale Notation verwendet werden (siehe Manual Page, man man: man chmod):

chmod 0644 DATEI

chmod 0755 VERZEICHNIS

Mit einer oktalen Ziffer 0 … 7 werden dabei jeweils 3 Bits, (für rwx bzw. setuid bit, setgid bit, und sticky bit) gesetzt.

Hexadezimalsystem

Römische Zahlen: Welche Nachteile hat das System?
Warum verwenden wir das Dezimalsystem?
Wie funktionieren Stellenwertsysteme allgemein?

Zahlensysteme des Rechners

Bytes in Binärschreibweise darzustellen erfordert viele Ziffern und wird schnell unübersichtlich. Darum stellt man meist ein halbes Byte, also vier Bit, mit einer hexadezimalen Ziffer dar. Man bezeichnet ein halbes Byte als Nibble. Ein Nibble kann die Werte 0 bist 15 annehmen, was genau den möglichen Werten einer hexidezimalen Ziffer entspricht. Wenn klar ist, um welches Zahlensystem es sich handelt, wird die Vorsilbe 0b oder 0x meist weggelassen.

Beispiele:

0b11111111 = 0xff
0b11110000 = 0xf0
0b00001111 = 0x0f
0b10101010 = 0xaa
0b01010101 = 0x55
0b11010101 = 0xd5

Darstellung und Analyse von Binärdaten (siehe auch: Hexdump, man echo, man xxd, man hexdump):

echo Text | xxd
echo -n Text | xxd
echo Text | xxd
echo  Text | hexdump -C
hexdump -C DATEI

Gleitkommazahlen

FIXME IEEE 754

Kodierung von Information

Rechner können nur mit Zahlen arbeiten. Daher muss Information in Zahlen „übersetzt“, d.h. kodiert werden, um sie auf Rechnern verarbeiten und in Dateien speichern zu können. Ohne Kenntnis dieser Kodierung, d.h. ohne Kenntnis der Übersetzung Daten ⟷ Information ist die Datei wertlos und stellt nur eine Aneinanderreihung von Zahlen, d.h. Bits und Bytes, dar.

Dateiformate

Dieser Abschnitt wurde bereits im Kapitel Dateiformate im Wikibook Informationstechnische Grundlagen behandelt und soll hier nicht noch einmal abgehandelt werden.

Aufgabe: Arbeite den Abschnitt Dateiformate durch!

Dateiformate erkennen

Das Dateiformat kann man oft (und je nach Betriebssystem ist das die (einzige) Methode der Wahl) durch Interpretation der Dateiendung erkennen. Diese lässt sich aber durch umbenennen der Datei leicht ändern. Ein besseres Verfahren zur Bestimmung des Dateiformats ist:

Interpretation von Metadaten, oder
Interpretation des Dateiinhalts.

Das auf GNU/Linux oder Unix Systemen vorhandenen Kommando file arbeitet mit genau diesen Verfahren. Details findet man in der Manual-Page mit man file.

Rechnen mit Binärzahlen

Computer rechnen: Die Verarbeitung von Information erfolgt durch logische und arithmetisch Operationen. Dazu besitzt jeder Rechner eine „arithmetisch-logische Einheit“ (arithmetic logic unit (ALU)), die aus Bits und Bytes andere Bits und Bytes erzeugt. Wir betrachten hier exemplarisch die Addition und Subtraktion zweier Zahlen.

Addition

Wir können Binärzahlen addieren, indem wir stellenweise vorgehen und entstehende Überträge bei der nächsten Stelle berücksichtigen.

Addition zweier positiver Binärzahlen (rechts bei 4 Bit-Zahler Überlauf)
${{\begin{matrix}\ &0_{\ }&1_{\ }&0_{\ }&1&&&5\\+\quad &0_{\color {Red}1}&1_{\color {Red}1}&1_{\color {Red}1}&1&&&7\end{matrix}} \over {\begin{matrix}\qquad &1_{\ }&1_{\ }&0_{\ }&0_{\ }&&&12\end{matrix}}}$	${{\begin{matrix}\ &{\ }_{\ }&1_{\ }&1_{\ }&0_{\ }&1&&&13\\+&{\ }_{\color {Red}1}&0_{\color {Red}1}&1_{\color {Red}1}&1_{\color {Red}1}&1&&&7\end{matrix}} \over {\begin{matrix}\quad &\color {gray}1_{\ }&0_{\ }&1_{\ }&0_{\ }&0_{\ }&&&20\end{matrix}}}$

Dies ist elektronisch über ein Addierwerk leicht zu realisieren, allerdings müssen wir beachten, dass je nach Datentyp möglicherweise das Ergebnis unserer Rechnung nicht mehr darstellbar ist. So „passt“ im Beispiel das Ergebnis nicht mehr in 4 Bit. Es kommt zum arithmetischen Überlauf (Zählerüberlauf). Je nachdem ob Vorkehrungen getroffen wurden, um einen solchen Zählerüberlauf adäquat zu behandeln, kann es weitreichende Folgen haben, wenn der Zähler „plötzlich“ wieder bei 0 anfängt und es gibt in der Geschichte bereits viele Beispiele für bereits erfolgte Überläufe (oder verwandte Problematiken) als auch noch zu erwartende:

Jahr-2000-Problem (Y2K)
Jahr-2010-Problem
Verlorener Kontakt zur Raumsonde Deep Impact
Jahr-2038-Problem (Y2K38)

Das Zweierkomplement

Darstellung des Zweierkomplements bei einer Ganzzahl aus vier Bit.

Bevor wir Zahlen subtrahieren, müssen wir uns überlegen, wie wir negative Zahlen darstellen. Wie wir im Folgenden sehe werden, bietet ich dazu das Zweierkomplement an. Beim Zweierkomplement bekommt der Wert des höchstwertigen Bits ein negatives Vorzeichen, also bei acht Bit den Wert -2⁷ = -128, bei vier Bit den Wert -2³ = -8.

Stelle	8	7	6	5	4	3	2	1
Unsigned Integer (vorzeichenlose Ganzzahl)	2⁷ = 128	2⁶ = 64	2⁵ = 32	2⁴ = 16	2³ = 8	2² = 4	2¹ = 2	2⁰ = 1
Signed Integer (vorzeichenbehaftete Ganzzahl)	-2⁷ = -128	2⁶ = 64	2⁵ = 32	2⁴ = 16	2³ = 8	2² = 4	2¹ = 2	2⁰ = 1

Damit können nun z.B. mit einem Byte die folgenden Zahlen dargestellt werden:

-128 = 0b10000000
-127 = 0b10000001
-1 = 0b11111111
 0 = 0b0
 127 = 0b01111111

Subtraktion

Die Darstellung negativer Zahlen durch das Zweierkomplement erlaubt die Subtraktion auf die Addition zurückzuführen. Wir subtrahieren, indem wir das Zweierkomplement addieren und den Überlauf ignorieren:

Subtraktion als Addition von Binärzahlen verschiedenen Vorzeichens
${{\begin{matrix}\ &{\ }_{\ }&0_{\ }&1_{\ }&0_{\ }&1&&&5\\+&{\ }_{\ }&1_{\ }&0_{\ }&0_{\color {Red}1}&1&&&-7\end{matrix}} \over {\begin{matrix}\quad &\color {gray}_{\ }&1_{\ }&1_{\ }&1_{\ }&0_{\ }&&&-2\end{matrix}}}$	${{\begin{matrix}\ &{\ }_{\ }&0_{\ }&1_{\ }&1_{\ }&1&&&7\\+&{\ }_{\color {Red}1}&1_{\color {Red}1}&1_{\color {Red}1}&0_{\color {Red}1}&1&&&-3\end{matrix}} \over {\begin{matrix}\ &\color {gray}1_{\ }&0_{\ }&1_{\ }&0_{\ }&0_{\ }&&&4\end{matrix}}}$

Wie bei der vorzeichenlosen Addition müssen wir dabei aber sicherstellen, dass das Ergebnis durch die für den gewählten Datentyp zur Verfügung stehenden Bits darstellbar ist. Ansonsten wird das Ergebnis falsch interpretiert, erhält falschen Wert und Vorzeichen. Entsprechend springt ein Zähler nach seinem höchsten positiven Wert 0b011…111 auf den kleinsten, negativen Wert 0b100…000.

 -6 + (-3) = -9 entspricht:
   0b1010
+  0b1101
---------
= 0b10111  wäre -16 + 7 = -9, aber bei Beschränkung auf 4 Bit: 0b0111 = 7

Aufgaben

Zahlensysteme

Umrechnen von Zahlen

Rechne die folgenden Zahlen jeweils in zwei andere Zahlensysteme um:

64, 1024, 2021, 0b1111, 0xA, 0xF, 0b01010101, 0b11010101, 0xAFFE, 0xCAFE, 0xBEEF, 111, 0x111, 0xFE, 0o644, 0o755, 0o1777, 0o4777, 0o7777

Überprüfe die Ergebnisse mit Python.

Darstellung von Bytes mit Hexadezimalzahlen

Zur Darstellung von Bytes verwenden wir pro Byte zwei hexadezimale Ziffern, 0, 1, …, 9, A, B, C, D, E, F. Wir stellen damit jeweils vier Bit, also ein Nibble dar. Warum hat man sich nicht für die Darstellung eines Bytes mit einer Ziffer entschieden?

Unix-Zugriffsrechte im Oktalmode

Erzeuge eine Datei mit touch datei. Setze mit z.B. chmod 644, chmod 755 unterschiedliche Dateirechte für den Besitzer (user), die Gruppe (group) und alle anderen (others). Untersuche das Ergebnis mit ls -l datei.
(↯) Erzeuge ein Verzeichnis mit mkdir verzeichnis und setze die Dateirechte mit chmod 1777 verzeichnis. Welche Bedeutung haben diese Zugriffsrechte und welches Verzeichnis hat üblicherweise genau diese gesetzt? Untersuche mit ls -ld verzeichnis, ls -ld /tmp.

Dateiformate und Kodierung

ASCII–Format

**Binärer Inhalt einer Datei:**
4772	6174	756c	6174	696f	6e2c	2044	7520
6861	7374	2064	6965	7365	7320	4461	7465
6966	6f72	6d61	7420	6572	666f	6c67	7265
6963	6820	656e	7473	6368	6c75	6573	7365
6c74	210a	4461	7320	4153	4349	492d	466f
726d	6174	2065	6967	6e65	7420	7369	6368
207a	756d	2073	7065	6963	6865	726e	2065
696e	6661	6368	6572	2054	6578	742d	4461
7465	6965	6e20	6f68	6e65	2055	6d6c	6175
7465	2e0a

Eine Datei ist im ASCII–Format gespeichert, ihr binärer Inhalt ist rechts im Hexadezimalsystem dargestellt. Dekodiere diesen Inhalt. Welche Vorteile hat die UTF-8–Kodierung im Vergleich zur ASCII–Kodierung?
Das ASCII–Format ordnet u.a. jedem Buchstaben eine Zahl zu. Damit können wir Text in Zahlen umwandeln und mit dem Rechner verarbeiten. Wie kann man die Information eines Bildes in Zahlen beschreiben und damit der digitalen Verarbeitung zugänglich machen?
ASCII–Kodierung verwendet 7 Bit, das verbleibende 8. Bit hat immer den Wert 0. Welche Hexadezimalzahl kann demnach maximal für das höherwertige Nibble eines Bytes auftreten?
Arbeite den Abschnitt Dateiformate im Wikibook ITG durch.

Rastergrafik

Wir untersuchen eine Rastergrafik im Bitmap .bmp Format.

Erzeuge mit dem Bildbearbeitungsprogramm GIMP ein 3×2 Pixel kleines „Bild“ und speichere es als Bitmap .bmp. Wähle beim Abspeichern 24 Bit Farbauflösung ‚R8 G8 B8‘.
Finde heraus, welche Bytes der Bilddatei zum Pixel oben links, welche zum Pixel unten rechts gehören. Untersuche dazu die erzeugte Datei mit einem Hex-Editor (z.B. Emacs: Alt-x, hexl-mode; oder auch xxd, hexdump) und verändere einzelne Pixel.
Ordne die Farbkanäle Rot, Grün, Blau eines Pixels den jeweiligen Bytes zu.
Untersuche den Datei-Header und vergleiche mit dem Bitmap .bmp-Format.

Vektorgrafik

Wir untersuchen eine Vektorgrafik im Scalable-Vector-Graphics-Format .svg.

Erzeuge mit dem Bildbearbeitungsprogramm Inkscape eine Grafik mit einem Kreis und einer Linie.
Untersuche, wie die Information dieses mal kodiert ist. Ändere dazu Eigenschaften der Figuren in Inkscape und direkt in der .svg-Datei.
Diskutiere Vor- und Nachteile von Raster- und Vektorgrafik.

Büro-Dokument

Erstelle ein Office-Textdokument mit etwas Text und einem Bild.
Such Informationen über das Format, in dem die Datei abgespeichert wurde.
Wende den Befehl unzip auf die abgespeicherte Datei an und untersuche das Ergebnis.
Ändere Inhalte und füge sie anschließend mit dem Befehl zip wieder zu einer einzelnen Datei zusammen. Prüfe das Ergebnis mit dem ursprünglichen Textverarbeitungsprogramm nach.

Dateiformate mit `file`

Rufe man file auf und schaue die Beispiele an.
Wende file auf einige bekannte Dateien an und betrachte die Ausgabe: file DATEI.TYP
Vertausche die Dateiendungen und führe file DATEI.FALSCHERTYP aus. Vergleiche mit dem vorherigen Aufruf bei korrekten Dateiendung.

Rechnen mit Binärzahlen

Untersuche den Zählerüberlauf mit Python anhand folgender Beispiele:

$ python3
>>> from numpy import int8, uint8  ## lade die Datentypen 8-Bit Ganzzahl mit/ohne (unsigned) Vorzeichen
>>> uint8(0b111111111)
255
>>> uint8(256)
0
>>> uint8(257)
1
>>> int8(0b10000000)
-128
>>> int8(127)
127
>>> int8(128)
-128

| Inhaltsverzeichnis | Netzwerktechnik >

Zahlensysteme und die Darstellung von Zahlen

Rechnen in verschiedenen Zahlensystemen

Anwendungsbeispiele

Oktalsystem

Hexadezimalsystem

Zahlensysteme des Rechners

Gleitkommazahlen

Kodierung von Information

Dateiformate

Dateiformate erkennen

Rechnen mit Binärzahlen

Addition

Das Zweierkomplement

Subtraktion

Aufgaben

Zahlensysteme

Umrechnen von Zahlen

Darstellung von Bytes mit Hexadezimalzahlen

Unix-Zugriffsrechte im Oktalmode

Dateiformate und Kodierung

ASCII–Format

Rastergrafik

Vektorgrafik

Büro-Dokument

Dateiformate mit file

Rechnen mit Binärzahlen

Dateiformate mit `file`