GNU R: regexp

regexp-Ausdrücke ermöglichen das Arbeiten mit "regular expressions" innerhalb von Funktionen.

Übersicht

^ steht für den Anfang des untersuchten Ausdrucks
$ steht für das Ende des untersuchten Ausdrucks
. steht für ein beliebiges Zeichen
* bedeutet, dass das Zeichen links daneben entweder gar nicht oder beliebig oft vorkommen kann
+ bedeutet, dass das Zeichen links daneben entweder einmal oder beliebig oft vorkommen kann, aber nicht gar nicht
.* entsprechend für eine beliebige Zeichenfolge
a* steht für beliebig viele "a" (usw.)
[0-9a-z] eckige Klammern stehen für ein Zeichen, das aus der in den Klammern definierten Menge stammen kann
( ) runde Klammern bezeichnen ein Muster, das mit \\1 , \\2 usw. wieder ersetzt werden kann.

R> test <- "Hier fehlen _ einige _ Worte."
R> sub("_ (einige) _","noch \\1 wichtige",test) 
[1] "Hier fehlen noch einige wichtige Worte."

Im folgenden Beispiel wird geprüft ob die Zeichenkette nicht mit / endet.

R> analyzeDir="demodata/cordata/"
R> !grepl("/$",analyzeDir)
R> [1] FALSE