Zum Inhalt springen

GNU R: wilcox test

Aus Wikibooks

wilcox_test führt den Wilcoxon-Mann-Whitney-Test durch.

Der Befehl befindet sich in dem Package coin, welches installiert sein muss.

Installation

[Bearbeiten]

Zunächst muss das Package mit weiteren erforderlichen Paketen installiert werden. Dies geht per:

install.packages("coin", dependencies=TRUE)

(Anmerkung: unter Debian/Ubuntu zunächst die Pakete libblas-dev liblapack-dev installieren!)

Anschließend muss das Paket aktiviert werden per:

library(coin)

Handhabung

[Bearbeiten]

Vorbereitung

[Bearbeiten]

Benötigt wird ein Datenframe, welches zum einen die beobachteten Werte, und zum anderen eine Gruppierungsvariable enthält. Nehmen wir die Tabelle aus Anwendungsbeispiel 2:

x <- factor(c("m", "w", "m", "m", "w", "m", "w", "w", "w", "m", "m", "w", "m", "w", "m", "m", "w", "m", "w", "w"))
y <- c(2,1,5,3,4,3,2,2,1,3,1,4,2,1,4,3,5,2,1,2) 
bsp2 <- data.frame(x,y)
colnames(bsp2) <- c("Geschlecht", "Note")
rm(x,y)
bsp2

Dies ergibt (wenn man bsp2 eintippt):

   Geschlecht Note
1           m    2
2           w    1
3           m    5
4           m    3
5           w    4
6           m    3
7           w    2
8           w    2
9           w    1
10          m    3
11          m    1
12          w    4
13          m    2
14          w    1
15          m    4
16          m    3
17          w    5
18          m    2
19          w    1
20          w    2

Die Spalte "Noten" enthält hierbei die beobachteten Werte, die Spalte "Geschlecht" unterteilt die Tabelle in die Gruppen "m" (= männlich) und "w" (weiblich).

Testen

[Bearbeiten]

Mann-Whitney-Test

[Bearbeiten]

Für den Mann-Whitney-Test gibt man in unserem Beispiel nun ein:

wilcox_test(Note~Geschlecht, data = bsp2)

Erklärung:

Note gibt an, dass sich in der Spalte "Note" die zu untersuchenden Werte befinden
~Geschlecht gibt an, dass die Noten-Werte anhand der Spalte "Geschlecht" in Gruppen eingeteilt werden.
Note~Geschlecht heisst soviel wie "Nimm die Daten aus Note, welche durch Geschlecht gruppiert werden"
data gibt das Datenframe an, in welchem sich die Daten befinden (hier: data=bsp2, da die Daten in bsp2 gespeichert wurden.)


Als Ergebnis bekommen wir ausgegeben:

	Asymptotic Wilcoxon Mann-Whitney Rank Sum Test

data:  Note by groups m, w 
Z = 1.0873, p-value = 0.2769
alternative hypothesis: true mu is not equal to 0 

Da der p-Wert > 0.05 ist, wird die Nullhypothese beibehalten. Es existiert in diesem Beispiel also kein signifikanter Unterschied zwischen Männern und Frauen

Werte-Aufruf

[Bearbeiten]
  • um nur den p-Wert ausgeprintet zu bekommen gibt man ein: pvalue(wilcox_test(Note ~ Geschlecht, data = bsp2))


siehe auch

[Bearbeiten]


[Bearbeiten]