Reguläre Ausdrücke/ Einstieg

Aus Wikibooks

Wechseln zu: Navigation, Suche

Matching · Substitution

Go-previous.svg zurück
Go-next.svg weiter


Mithilfe von regulären Ausdrücken (auch kurz RegEx genannt) lassen sich bestimmt Zeichen, Wortfolgen oder Ähnliches suchen und (wenn nötig) ersetzen. Allerdings beschränkt sich der Funktionsumfang nicht nur auf einfache Wörter oder Buchstaben die gefunden werden können, sondern kann auch komplexere Folgen finden. Einige Beispiele sind:

  • Alle Geldbeträge zwischen 10€ und 99€
  • Die Buchstabenfolge „Auto“ in Wortfolgen, z. B. „Automarke“, „Automat“ oder „Mautordnung“
  • Das Wort „Auto“ als alleiniger Bestandteil des Wortes
  • Das Wort „Auto“, aber nur wenn „blaues“ oder „rotes“ davor steht.

Inhaltsverzeichnis

[Bearbeiten] Über dieses Buches

Dieses Buch soll einen Einblick in Perl-kompatible reguläre Ausdrücke geben, die von allen Varianten den größten Funktionsumfang besitzen. Im Hauptteil wird die Anwendung in den beiden Sprachen Wikipedia-logo.png PHP und Wikipedia-logo.png Perl im Vordergrund stehen, minimale Kentnisse ein einer der Sprachen sollten vorhanden sein.

Im hinteren Teil werden die Besonderheiten anderer Sprachen genauer unter die Lupe genommen, einige Vorkenntnisse (wie sie durch dieses Buch erworben werden können) werden dort allerdings vorausgesetzt.

Für einen kurzen Überblick steht der Spickzettel zu Verfügung.

[Bearbeiten] Verwendete Symbole

Dialog-information.svg

Der Hinweis gibt nützliche Tipps, die Ihnen das Leben leichter machen


Stop hand nuvola orange.svg

Hier stehen Informationen auf mögliche Fehlerquellen

[Bearbeiten] Aufbau eines regulären Ausdrucks

/RegEx/

Ein regulärer Ausdruck wird von zwei sogenannten „Delimitern“ (zu deutsch: Begrenzer) eingeschlossen. Zwischen diesen steht dann der eigentliche Ausdruck, genannt „Pattern“.

[Bearbeiten] Die Delimiter

Jedes beliebige Zeichen, das kein Buchstabe, keine Ziffer ist und nicht der Backslash „\“, kann als Delimiter verwendet werden, allerdings darf es nicht im Pattern vorkommen. Der entsprechende Interpreter verwendet immer das erste benutzte Zeichen. Im Beispiel oben also den Slash „/“, was neben der Raute „#“ eines der am häufigsten verwendeten Zeichen ist. Diese beiden Zeichen sind so gut wie nie im Ausdruck selber zu finden. Sollte man trotzdem den Delimiter als normales Zeichen verwenden wollen, lässt sich dieses durch einen vorangegangen Backslash „\“ bewerkstelligen. Wenn man also im Beispiel oben, im Pattern ein „/“ braucht, lässt sich dieses durch „\/“ erreichen.

[Bearbeiten] Das Pattern

Das Pattern besteht aus ganz normalen Zeichen, von denen jedes im Regelfall für sich steht. Das Beispiel oben trifft auf jedes Vorkommen von „RegEx“ zu. Einige Zeichen haben jedoch eine andere Bedeutung, welche, das wird in späteren Kapiteln geklärt. Jetzt ist erst einmal wichtig zu wissen, welche Zeichen das sind und wie sie ihre tatsächliche Bedeutung erhalten. In der folgenden Tabelle sind in der oberen Zeile das jeweilige Zeichen („Metazeichen“ genannt) und in der unteren Zeile, die Verwendung des jeweiligen Zeichens, wenn es für sich selber stehen soll.

Metazeichen [ ] ( ) { } | + *  ? ^ $ \ .
Tatsächliches Zeichen \[ \] \( \) \{ \} \| \+ \* \? \^ \$ \\ \.


Go-up.svg Inhaltsverzeichnis
Go-next.svg weiter
Good art ru.svg Dieses Buch wird durch intensive Zusammenarbeit sicher schnell besser. Der Hauptautor freut sich über jeden, der mitmacht. Kaputtmachen kannst du nicht viel – also sei mutig. Wenn etwas nicht passt, rührt sich der Hauptautor bestimmt. Danke.
Persönliche Werkzeuge