Awk: Grundlagen: Dateien, Datensätze und Felder

Aus Wikibooks


Datei (file)[Bearbeiten]

Eine (reguläre) Datei ist eine Folge von Bytes, welche unter einem Dateinamen gespeichert ist. Für awk sind in erster Linie sogenannte Textdateien interessant. awk arbeitet diese Eingabedateien in der Reihenfolge ab, wie sie beim awk-Kommando angegeben sind.

Datensatz (record)[Bearbeiten]

In jedem Abarbeitungsschritt liest awk einen Datensatz ein. Normalerweise entspricht ein Datensatz einer Zeile. Wie auch mehrzeilige Datensätze einzulesen sind, wird im Kapitel awk-Einstellungen abgehandelt. Angesprochen wird ein Datensatz mit dem Variablenbezeichner $0.

Feld (field)[Bearbeiten]

Ein Feld ist die kleinste Einheit, in die awk Datensätze unterteilt. Normalerweise werden Datensätze durch Whitespaces (Leerzeichen oder Tabulatoren) in einzelne Felder unterteilt. Wie man das Feldtrennzeichen ändert, wird im Kapitel awk-Einstellungen gezeigt. Angesprochen werden Felder durch die Variablenbezeichner $1, $2, $3, ...


Beispiel:

Gegeben sei eine Eingabedatei test1.txt mit dem einzigen Eintrag

Datensatz und Felder

awk '{print $0
      print $1
      print $4}' test1.txt

ergibt

11  Hans Meyer  08.07.1986   88888   Münchenstadt
11
08.07.1986