Zum Inhalt springen

MathemaTriX ⋅ Lineare Funktion und Regression

Aus Wikibooks

DEINE FESTE BEGLEITERIN
FÜR DIE SCHULMATHEMATIK
EINFACH UND
VERSTÄNDLICH
GRATIS!*
MIT MEHR ALS 200 THEORIE- UND AUFGABEN-ERKLÄRUNGS VIDEOS!
Mathe lernen ist wie Fahrradfahren lernen: Du kannst es dir stundenlang erklären lassen, du wirst nie fahren können, wenn du nicht selber zu fahren probierst.
LINKS
Zur Bucherklärung im Zentralteil Weitere Links und Videos

Zum Erklärungsvideo

Zum Video mit Anwendung von Hilfsmitteln
Frage stellen!
 ACHTUNG! 
Zumindest Aufgabe 1 und 2 probieren,
sie sind unterschiedlich!
Theorie in Kürze (mit Geogebra)


  • y in Abhängigkeit von x
  • Punkt (x|y), also erst x und dann y.

Lineare Funktion, also Gerade.




f(x) oder y ist die y-Achse (das y), x die x-Achse (das x).

d (bzw. n oder oder was auch immer nicht mit x multipliziert wird) ist der "Anfangswert", also der Wert der Funktion (y-Wert) da, wo x Null ist (y-Achsenabschnitt). Die Einheiten von d sind die Einheiten des y-Achse.

k (bzw. m oder s oder was auch immer mit x multipliziert wird) ist die Steigung der lineare Funktion. Wenn die Gerade eine Verbindung zwischen zwei Punkte in einem Liniendiagramm darstellt, dann sprechen wir von einer mittlere Änderungsrate. Die Steigung (z.B. k) ist positiv, wenn die Funktion nach oben geht, negativ wenn sie nach unten geht und Null wenn sie parallel zur x.Achse ist. y=d (z.B. y=4) bedeutet, dass die Steigung gleich Null ist, also die Gerade ist parallel zur x-Achse. Es gilt:

Die Einheiten der Steigung sind daher y-Einheiten pro eine x-Einheit.
Ausdruck: Der/Die/Das (Begriff, was auf der y-Achse steht) ändert sich (wächst, zunimmt usw. oder fällt, abnimmt usw.) um (y-Einheiten pro EINE x-Einheit) →→ Steigung

Für die Funktion selber können wir beliebige Symbole benutzen, z.B.:

In diesem Beispiel steht A(h) als Ausdruck für die Abhängigkeit, also A (wofür in der Angabe A steht) in Abhängigkeit von h (wofür in der Angabe h steht). A(h) ist daher hier das y, h steht für das x. Mit h (also das Symbol für die x-Achse) wird hier d multipliziert, also ist d hier doch die Steigung. m wird zu diesem Produkt addiert, daher ist es der y-Achsenabschnitt ("Anfangswert").

In einem Punkt schreiben wir erst x und dann y (x|y). Um herauszufinden, ob drei oder mehrere Punkte zu einer und derselben Gerade gehören, können wir ggf. Tabellenkalkulation benutzen. Tabellenkalkulation benutzen wir bei der Regression.

Die lineare Funktion kommt oft als Regressionsgerade vor. Der Korrelationskoeffizient (mit r angegeben) ist NICHT mit der Steigung zu verwechseln. Im ersten Bild sind die Punkte weit entfernt von der Gerade, im zweiten fast auf der Gerade, also im zweiten Fall ist der Koeffizient fast 1 (in diesem Fall allerdings −1, da fallend), im ersten Bild hingegen zwischen 0 und 1, aber näher zu 0,5. Bei starkem Zusammenhang ist das r nah zu 1, wenn die Gerade steigend ist und nah zu −1, wenn sie fallend ist.
Ausdruck: Der lineare Zusammenhang zwischen (was auch immer auf den beiden Achsen steht) ist schwach (falls r nah zu 0) bzw. stark (im Gegenfall, also nah zu 1 für steigende und −1 für fallende Gerade).
In Geogebra als r abzulesen, wenn man die Statistik (Symbol rechts oben im Diagramm) abruft, dafür ist die Gerade nicht notwendig.

Vergleich linearer und exponentieller Funktion:
Lineare Funktion Exponentialfunktion
Formel
Im Text erkennen durch Steigung der Gerade
(in der Formel: s)
Änderungsrate
y-Einheiten PRO eine x-Einheit
Basis der Hochzahl
(in der Formel: a)
Relative Änderung
("Prozent"-Änderung)
des y-Wertes
bei Änderung des x-Wertes um 1
Änderungsrate Absolut
(genauer Wert)
Relativ
(Anteil,
Prozent, -fach)
steigend ("nach oben")
Wachstum
s>0 (positiv) a>1
fallend ("nach unten")
Abnahme
s<0 (negativ) 0<a<1
y-Achsenabschnitt
(i.d.R. "Anfangswert")
Diagramme


Aufgaben

    1. Folgende Daten über das mittlere Gewicht in kg in Bezug auf das Alter in Jahren wurden erhoben:
      Alter 4 6 8 10 12 14 16
      Gewicht 15,4 18,3 22,7 33,9 44,0 53,2 68,4
    2. Stellen Sie die lineare Abhängigkeit des Gewichts vom Alter mit Hilfe einer Regressionsgerade dar (Funktion und Diagramm)!
    3. Was bedeutet der y-Achsenabschnitt in diesem Zusammenhang? Wie viel beträgt er? Ist das Sinnvoll?
    4. Stellen Sie mit Hilfe der Regressionsrechnung ein exponentielles Modell her! Was passt zu den Daten "besser", ein exponentielles oder ein lineares Modell? Warum?

    5. Für die gleiche Gruppe von Personen wurde die mittlere Größe in cm in Bezug auf das Alter in Jahren in der folgenden Tabelle erfasst:
      Alter 6 8 10 12 14 16
      Größe 74,4 82,6 100,1 118,7 146,5 174,3
    6. Stellen Sie die lineare Abhängigkeit des Gewichts von der Größe mit Hilfe einer Regressionsgerade dar (Funktion und Diagramm)!
    7. Was zeigt uns die Steigung in diesem Zusammenhang?
    8. Wie viel soll das Gewicht einer 150 bzw. 160 cm große Person nach diesem linearen Modell sein?
    9. Wie können wir den Korrelationskoeffizienten deuten und welchen Wert beträgt er? Gibt es hier eine Kausalität?

    10. Könnten folgende Daten eine lineare Funktion darstellen?
      Größe (cm): 165 168 170
      Gewicht (kg): 63 66,5 67

    11. Die Größe eines Kindes in dm in Bezug auf sein Alter in Jahren wird von der nebenstehenden linearen Funktion angenähert. Nach dieser Funktion ist das Kind 2 Jahren nach seinem Geburt 4 dm groß und wächst pro 1,5 Jahre um 12 cm.
    12. Tragen Sie die entsprechenden Werten in den Kästchen ein!
    13. Wie groß war das neugeborene Kind?
    Antwort Antwort
    1. (a in Jahre G in Kg)
    2. Gewicht bei Geburt, sinnlos
    3. EXP: linear
    4. (g in cm G in Kg)
    5. Wie viel kg mehr pro cm mehr eine Person wiegt
    6. fast vollständige Korrelation, die Änderung des Gewichts ist fast ausschließlich durch die Änderung der Größe zu erklären, Kausalität möglich
    7. nein
    8. 2,4 dm, 4 dm, 11,2 dm
    9. 2,4 dm

    1. Ein Zug hat 2 Arten Wagons, eine für die erste und eine für die zweite Klasse. In jedem Wagon der ersten Klasse gibt es 40 Sitzplätze und 20 Fenster. In jedem Wagon der zweiten Klasse gibt es 65 Sitzplätze und 30 Fenster. Insgesamt haben alle diese Wagons 720 Sitzplätze und 340 Fenster. Wie viele Wagons der ersten bzw. der zweiten Klasse gibt es?

    2. Folgende Daten über die Anzahl der StudienabsolventInnen wurden erhoben:
      Jahr 2001 2004 2007 2010 2013 2016 2019
      AbsolventInnen 2196 3550 6095 8969 11743 13705 16103
    3. Stellen Sie die lineare Abhängigkeit der AbsolventInnen mit Hilfe einer Regressionsgerade dar (Funktion und Diagramm)! Wählen Sie für t=0 das Jahr 2001 (Sommer)!
    4. Was zeigt uns die Steigung in diesem Zusammenhang?
    5. Wie können wir den Korrelationskoeffizienten deuten und welchen Wert beträgt er? Gibt es hier eine Kausalität?
    6. Wie viel ist der x-Achsenabschnitt und wie würden Sie ihn in diesen Zusammenhang interpretieren?
    7. Wann werden nach diesem linearen Modell die AbsolventInnen 21000 sein?
    8. Ist das Modell geeignet, wenn höchstens eine Abweichung von 6% vom tatsächlichen Wert im Jahr 2004 akzeptiert wird?

    9. Nehmen wir an, dass sich die Anzahl der AbsolventInnen nach einem linearen Modell je 4 Jahren um 2856 erhöht. Stimmen folgende Daten mit diesem Modell exakt überein?
      Jahr: 2004 2006 2010
      AbsolventInnen: 1500 2928 5784

    10. Die Anzahl der AbsolventInnen pro Jahr in einem Staat gemessen ab das Jahr 2001 wird von der nebenstehenden linearen Funktion angenähert. Nach dieser Funktion gab es im Jahr 2003 3000 AbsolventInnen und sie wuchsen um 2100 pro 3,5 Jahren.
    11. Tragen Sie die entsprechenden Werten in den Kästchen ein!
    12. Wie viele waren die AbsolventInnen im Jahr 2001?
    Antwort Antwort
    1. (t in Jahre seit 2001, Z Anzahl der AbsolventInnen)
    2. Wie viel mehr AbsolventInnen es jedes Jahr gibt
    3. fast vollständige Korrelation, in der Vergangenheit gab es weniger AbsolventInnen und das Wachstum ihre Anzahl hängt extrem mit dem Verlauf der Jahren zusammen, Kausalität ist allerdings nicht vorstellbar
    4. Anzahl der AbsolventInnen im Jahr 2001, ca. 1657, sinnvoll(das wäre y-Achsenabshnitt)
      1999, dann hatte die Uni ihre ersten Absolventinnen
    5. ca. 2025
    6. nein
    7. ja
    8. 1800, 3000 bzw. 8400 AbsolventInnen
    9. 1800 AbsolventInnen

    1. Folgende Daten über den Einfluss der sexuellen Häufigkeit auf das Todesalter bei einer Gruppe von Männern wurden erhoben:
      Wöchentliche
      Sexhäufigkeit
      3 17 1 6
      Todesalter 79 82 83 79 75 80
    2. Stellen Sie die lineare Abhängigkeit des Zusammenhangs mit Hilfe einer Regressionsgerade dar (Funktion und Diagramm)!
    3. Was bedeutet der y-Achsenabschnitt in diesem Zusammenhang? Wie viel beträgt er? Ist das Sinnvoll?
    4. Stellen Sie mit Hilfe der Regressionsrechnung ein exponentielles Modell her! Was passt zu den Daten "besser", ein exponentielles oder ein lineares Modell? Warum?

    5. Folgende Daten über den möglichen Zusammenhang des Todesalters in Jahren in Bezug auf den Bierkonsum in Flaschen pro Woche bei der gleichen Gruppe von Männern wurden erhoben:
      Bierkonsum 2 3 2 8 6 5
      Todesalter 79 82 83 79 75 80
    6. Stellen Sie die lineare Abhängigkeit des Bierkonsums von der sexuellen Häufigkeit mit Hilfe einer Regressionsgerade dar (Funktion und Diagramm)!
    7. Was zeigt uns die Steigung in diesem Zusammenhang?
    8. Wie viel ist nach diesem linearen Modell die sexuelle Häufigkeit einer Person, die 4,2 Flaschen Bier pro Woche konsumiert?
    9. Wie können wir den Korrelationskoeffizienten deuten und welchen Wert beträgt er? Gibt es hier eine Kausalität?

    10. Könnten folgende Daten eine lineare Funktion darstellen?
      Wöchentliche
      Sexhäufigkeit
      2 3 5
      Todesalter 73 74,5 77,2

    11. Der Weinkonsum in Bezug auf die wöchentlichen sexuellen Häufigkeit wird von der nebenstehenden linearen Funktion angenähert. Nach dieser Funktion ist der Konsum 10,5 Gläser Wein, wenn man 4 mal in der Woche Sex hat und wächst um 3 Gläser, wenn man 2 mal mehr pro Woche Sex hat.
    12. Tragen Sie die entsprechenden Werten in den Kästchen ein!
    13. Wie viel ist der Konsum bei Zölibat?
    Antwort Antwort
    1. (h für Häufigkeit, T in Jahren)
    2. Todesalter bei Zölibat, möglich
    3. EXP: linear
    4. (h für Häufigkeit, B Bierflaschen pro Woche)
    5. Wie viel Flaschen weniger getrunken werden, wenn ein mal mehr Sex gemacht wird (pro Woche)
    6. mittlere Korrelation, schwache Zusammenhang, die Kausalität könnte lauten: Je mehr Sex, desto weniger (Lust auf) Bier, sie könnte auch vekehrt sein: je mehr Bier, desto weniger Sex (Alkohol beeinflüsst die Sexualität tatsächlich negativ)
    7. nein
    8. 4,5, 10,5 bzw. 21 Gläser pro Woche
    9. 4,5 Gläser pro Woche

    1. Eine Flugzeugfirma hat 26 Flugzeuge, manche für 130 und der Rest für 150 Passagiere. Insgesamt kann die Firma 3680 Passagiere gleichzeitig bedienen. Wie viele Flugzeuge für 130 bzw. 150 Passagiere hat die Firma?

    2. Eine  Kohortenstudie über Rauchen hat im Jahr 1935 geborenen Personen auf ihren Todesalter untersucht. Die durchschnittliche Anzahl der täglich gerauchten Zigaretten wurde ermittelt und in folgender Tabelle zusammengefasst.
      Jahr 2001 2004 2007 2010 2013 2016 2019
      Zigaretten 35,4 30 25,1 19,8 15,3 9,9 5,2
    3. Stellen Sie die lineare Abhängigkeit der Anzahl der täglich gerauchten Zigaretten von der Zeit mit Hilfe einer Regressionsgerade dar (Funktion und Diagramm)! Wählen Sie für t=0 das Jahr 2001!
    4. Was zeigt uns die Steigung in diesem Zusammenhang?
    5. Wie können wir den Korrelationskoeffizienten deuten und welchen Wert beträgt er? Gibt es hier eine Kausalität?
    6. Was bedeutet der x-Achsenabschnitt in diesem Zusammenhang? Wie viel beträgt er? Ist das Sinnvoll?
    7. Welches Jahr sterben nach diesem linearen Modell Personen, die 40 Zigaretten rauchen?
    8. Ist das Modell geeignet, wenn höchstens eine Abweichung von 6% vom tatsächlichen Wert im Jahr 2004 akzeptiert wird?

    9. Nehmen wir an, dass sich die Anzahl der täglich gerauchten Zigaretten nach einem linearen Modell je 4 Jahren um 14,4 sinkt. Stimmen folgende Daten mit diesem Modell exakt überein?
      Jahr: 2004 2007 2010
      Zigaretten ∅: 28,2 39 49,8

    10. Die Häufigkeit eines Herzanfalls in Bezug auf die Anzahl der täglich gerauchten Zigaretten wird von der nebenstehenden linearen Funktion angenähert. Nach dieser Funktion ist die Häufigkeit bei 4 Zigaretten am Tag 14% und steigt um 6% je 3 tägliche Zigarette.
    11. Tragen Sie die entsprechenden Werten in den Kästchen ein!
    12. Wie viel ist die Häufigkeit nach diesem Modell, wenn keine Zigarette geraucht wird?
    Antwort Antwort
    1. (t in Jahre seit 2001, Z Anzahl der Zigaretten)
    2. Wie viele Zigaretten mehr durchschnittlich täglich geraucht werden, wenn jemand ein Jahr früher stirbt
    3. fast vollständige Korrelation, die Änderung des Todesjahres ist fast ausschließlich durch die Änderung der täglichen Zigarettenanzahl zu erklären, Kausalität möglich
    4. Wann ein nicht Raucher durchschnittlich stirbt, ca. 21, also im Jahr 2022, sinnvoll
    5. ca. 1998
    6. ja
    7. ja
    8. 6%, 14%, 28%
    9. 6%



BILDERVERZEICHNIS
ÖFFNE DEIN HORIZONT!
LERNE MIT MATHEMATRIX!
Seite mit Anleitungen zur Anwendung von MathematrixProblemmeldung

LOGO CH DE AT
SPENDEN
Der Hauptautor ggf. das Team verdient zwar nicht viel, braucht allerdings dein Geld eigentlich nicht. Wenn du aber doch meinst, dass gute Arbeit belohnt werden soll und dieses Projekt gut findest, kannst du immer in diesem Link spenden. Das ist allerdings vielleicht die einzige Einrichtung mit völliger Transparenz, wo du genau weißt, was mit deinem Geld passiert.