GNU R: sum

EDV GNU R Befehlsübersicht

Mit sum() wird die Summe der übergebenen Werte berechnet. Die Funktion kann auf numerische und logische Variablen angewendet werden. Bei logischen Variablen wird wahr (TRUE) gleich 1 und falsch (FALSE) gleich 0 gesetzt.

Handhabung

sum(x)

Beispiel

Als erstes erzeugen wir einen numerische Variable.

 x = c(1, 2, 4, NA, 5, 7, 8)
 
 sum(x)
 
 [1] NA

Was ist schief gelaufen? NA steht für nicht available, also einen fehlenden Wert (missing). Viele Funktionen in R geben standardmäßig NA zurück, wenn in den auszuwertenden Variablen missings vorkommen. Mit der Option na.rm = TRUE werden die fehlenden Werte erst entfernt, bevor die Summe gebildet wird.

 sum(x, na.rm = TRUE)
 [1] 27

Nun wird das gewünschte Ergebnis geliefert.

Im zweiten Beispiel soll die Anzahl der missings (NA) bestimmt werden. Dazu wird eine neue Variable erzeugt, die für jeden Wert von x angibt, ob er vorhanden ist oder nicht. Die Funktion is.na erledigt dies.

 missings = is.na(x)
 missings
 [1] FALSE FALSE FALSE  TRUE FALSE FALSE
 
 sum(missings)
 [1] 1

Auf dem gleichen Weg ist es auch möglich die Anzahl der gültigen Werte zu bestimmen. Dazu wird die Negation von is.na, d.h. ist kein missing !is.na, eingesetzt.

 gueltig = !is.na(x)
 gueltig
 [1]  TRUE  TRUE  TRUE FALSE  TRUE  TRUE
 sum(gueltig)
 [1] 5

Sofern die Variablen mit den logischen Werten nicht weiter benötigt werden, können auch folgende Kurzversionen verwendet werden:

 sum(is.na(x))

bwz.

 sum(!is.na(x))

EDV GNU R Befehlsübersicht