Statistik: Zeitreihenanalyse
Einführung
Zeitreihen sind Beobachtungen, die im Lauf der Zeit erhoben wurden. Bei der Analyse von Zeitreihen versuchen wir, die Beobachtungen durch den Faktor Zeit zu erklären. Wir suchen nach bestimmten Gesetzmäßigkeiten, nach denen diese Zeitreihen zustande kommen.
Für die optische Unterstützung stellen wir eine Zeitreihe als Streudiagramm dar. Um den Verlauf, die Entwicklung des Merkmals darstellen, können wir die Punkte zu einer Kurve (Polygonzug) verbinden.
Wir haben hier beispielsweise das Bruttoinlandsprodukt der Bundesrepublik Deutschland (Quelle: © Statistisches Bundesamt Deutschland 2005) der Quartale 2001 bis 2005 gegeben.
Stichtag |
Mrz 01 |
Jun 01 |
Sep 01 |
Dez 01 |
Mrz 02 |
Jun 02 |
---|---|---|---|---|---|---|
BIP |
514,51 |
522,63 |
531,51 |
544,91 |
519,19 |
531,66 |
Stichtag |
Sep 02 |
Dez 02 |
Mrz 03 |
Jun 03 |
Sep 03 |
Dez 03 |
---|---|---|---|---|---|---|
BIP |
546,06 |
551,9 |
524,4 |
533,59 |
550,76 |
556,12 |
Stichtag |
Mrz 04 |
Jun 04 |
Sep 04 |
Dez 04 |
Mrz 05 |
---|---|---|---|---|---|
BIP |
537,36 |
547,85 |
557,21 |
564,82 |
539,78 |
Modell der Zeitreihe
Die Zeitreihenanalyse erfordert die Konzipierung der Zeitreihe als Modell:
Wir betrachten einen Beobachtungszeitraum mit T vielen Zeitpunkten t. Zu einem Zeitpunkt t gehört die Beobachtung yt des Merkmals y.
Da Zeitangaben häufig unhandlich bei der Berechnung sind (z. B. 1.3.1996), empfiehlt es sich, die Zeitpunkte durchzunummerieren, z.B. t = 1, 2, ... , n.
Beispiel Großhandel
Es liegen n = 60 Quartalsumsätze des Gartenbedarfsgroßhandels Rosalinde vor. Die Quartale sind durchnummeriert als t = 1, ... , 60. Es sind hier nur die ersten Beobachtungen wiedergegeben. Die komplette Zeitreihe befindet sich in Zeitreihe Rosalinde.
Stichtag zum Ende des Monats | Quartal | Umsatz in Mio. € | Linearer Trend |
---|---|---|---|
Mrz 90 |
1 |
52,19 |
42 |
Jun 90 |
2 |
48,69 |
44 |
Sep 90 |
3 |
49,28 |
46 |
... |
... |
... |
Stichtag zum Ende des Monats | Saisonaler Zyklus | Konjunktureller Zyklus | Restschwankung |
---|---|---|---|
Mrz 90 |
6,00 |
3,06 |
1,13 |
Jun 90 |
0,00 |
5,66 |
-0,96 |
Sep 90 |
-6,00 |
7,39 |
1,89 |
... |
... |
... |
Wir sehen, dass die Tendenz der Umsätze steigend ist. Es scheint sich außerdem ein vermutlich konjunktureller Zyklus abzuzeichnen, der z. B. 1992 ein Tief und 1995 ein Hoch hatte. Und es ist deutlich ein einjähriger, saisonaler Zyklus zu erkennen, der auch aus der Tabelle ersichtlich ist.
Wir können also die Komponenten der Zeitreihe unterscheiden:
- Trend Q
- Konjunkturelle Schwankung K
- Saisonale Schwankung S
- Restschwankung r
Sind diese Komponenten unabhängig voneinander, gehen wir vom additiven Modell aus:
Oft überlagern sich mehrere zyklische Schwankungen. Es gibt hier spezielle Verfahren, die Zyklen zu identifizieren.
Ein Problem in der Zeitreihenanalyse ist die Wahl des richtigen Modells. Bei den einfacheren Modellen beschränkt man sich meist auf die Bestimmung einer glatten Komponente, die aus Trend und/oder konjunktureller Komponente gebildet wird, einer saisonalen Komponente und die Restschwankung.