GNU R: regexp

Aus Wikibooks

regexp-Ausdrücke ermöglichen das Arbeiten mit "regular expressions" innerhalb von Funktionen.

Übersicht[Bearbeiten]

  • ^ steht für den Anfang des untersuchten Ausdrucks
  • $ steht für das Ende des untersuchten Ausdrucks
  • . steht für ein beliebiges Zeichen
  • * bedeutet, dass das Zeichen links daneben entweder gar nicht oder beliebig oft vorkommen kann
  • + bedeutet, dass das Zeichen links daneben entweder einmal oder beliebig oft vorkommen kann, aber nicht gar nicht
  • .* entsprechend für eine beliebige Zeichenfolge
  • a* steht für beliebig viele "a" (usw.)
  • [0-9a-z] eckige Klammern stehen für ein Zeichen, das aus der in den Klammern definierten Menge stammen kann
  • ( ) runde Klammern bezeichnen ein Muster, das mit \\1 , \\2 usw. wieder ersetzt werden kann.
R> test <- "Hier fehlen _ einige _ Worte."
R> sub("_ (einige) _","noch \\1 wichtige",test) 
[1] "Hier fehlen noch einige wichtige Worte."


Im folgenden Beispiel wird geprüft ob die Zeichenkette nicht mit / endet.

R> analyzeDir="demodata/cordata/"
R> !grepl("/$",analyzeDir)
R> [1] FALSE

Weblinks[Bearbeiten]


siehe auch[Bearbeiten]