GNU R: sum
Mit sum()
wird die Summe der übergebenen Werte berechnet. Die Funktion kann auf numerische und logische Variablen angewendet werden. Bei logischen Variablen wird wahr (TRUE) gleich 1 und falsch (FALSE) gleich 0 gesetzt.
Handhabung
[Bearbeiten]sum(x)
Beispiel
[Bearbeiten]Als erstes erzeugen wir einen numerische Variable.
x = c(1, 2, 4, NA, 5, 7, 8) sum(x) [1] NA
Was ist schief gelaufen? NA steht für nicht available, also einen fehlenden Wert (missing). Viele Funktionen in R geben standardmäßig NA zurück, wenn in den auszuwertenden Variablen missings vorkommen. Mit der Option na.rm = TRUE
werden die fehlenden Werte erst entfernt, bevor die Summe gebildet wird.
sum(x, na.rm = TRUE) [1] 27
Nun wird das gewünschte Ergebnis geliefert.
Im zweiten Beispiel soll die Anzahl der missings (NA) bestimmt werden. Dazu wird eine neue Variable erzeugt, die für jeden Wert von x angibt, ob er vorhanden ist oder nicht. Die Funktion is.na
erledigt dies.
missings = is.na(x)
missings
[1] FALSE FALSE FALSE TRUE FALSE FALSE
sum(missings)
[1] 1
Auf dem gleichen Weg ist es auch möglich die Anzahl der gültigen Werte zu bestimmen. Dazu wird die Negation von is.na
, d.h. ist kein missing !is.na
, eingesetzt.
gueltig = !is.na(x) gueltig [1] TRUE TRUE TRUE FALSE TRUE TRUE sum(gueltig) [1] 5
Sofern die Variablen mit den logischen Werten nicht weiter benötigt werden, können auch folgende Kurzversionen verwendet werden:
sum(is.na(x))
bwz.
sum(!is.na(x))