Diskussion:Statistik: Approximation von Verteilungen

Aus Wikibooks
Zur Navigation springen Zur Suche springen

Folgendes sind Informationen für die Berechnung mit dem Taschenrechner und vereinfachende Formeln für Binomial-Verteilung, Hypergeometrische und Poisson-Verteilung: Bitte alles ordentlich darstellen, mir selbst ist das leider nicht weiter möglich, tut mir leid.


http://www.matheboard.de/thread.php?postid=143443#post143443 im selben Thread die Verwechslung (mit/ohne Zurücklegen) aufgeklärt bekommen: http://www.matheboard.de/thread.php?postid=150205#post150205


vereinfachende Formel für Poisson-Verteilung http://www.matheboard.de/thread.php?postid=141111#post141111


Daraus läßt sich bestimmt ein schönes kleines Tutorial für die schnelle Berechnung mit dem Taschenrechner schreiben. Aber alle Berechnungen und Bezeichnung müssen vor Veröffentlichung besser nochmal geprüft werden. Sry, ich selber bin schon nicht mehr in der Materie drin.


Aber folgendes habe ich soeben abgeglichen und es stimmt:


--->>> Binomialverteilungsformel ist abgekürzt: P(X=k) = ......blablalangeFormelmitBruchstrichen...... = C n,k * p ^k * (1-p) hoch (n-k) mit p = M/N, M = Teilvorrat, N = Gesamtvorrat

Das Cnk ist auf vielen Taschenrechnern berechenbar, Taste nCr, vermutlich auf der Taste zum teilen/dividieren. Beispielhaft: 8 Unfälle, davon 5 mit überhöhter Geschwindigkeit, n=8, k=5 = C 8,5 berechnet man ein wie folgt = 8 nCr 5 = 56


--->>> hypergeometrische Verteilungsformel ist abgekürzt: P(X=k) = ( C M,k * C N-M,n-k ) / ( C N,n)

Dazu aus einem Beispiel dort zitiert: Eine Firma produziert verschieden Bausteine. Wie groß ist die Wahrscheinlichkeit für höchstens einen defekten Baustein, wenn man einer bereits produzierten Tageseinheit von 100 Stück, die genau 14 defekte Teile enthält, 6 Stück entnimmt?

Wir haben die Zahlen, 100, 14, 6 und =< 1 (kleiner gleich 1) N = Gesamtvorrat = (in diesem Beispiel größte Zahl) = 100 M = Teilvorrat = (in diesem Beispiel zweitgrößte Zahl) = 14 n = entnommene Auswahl = 6 k = Zahl-für-die-die-Wahrscheinlichkeit-gesucht-wird ("höchstens 1 defekter Baustein") = kleiner-gleich 1 = P (X=<1) = [ P(X=0) + P(X=1)]


Ich hoffe geholfen zu haben. Und Nein, dies ist nicht aus einem Buch entnommen, hatte uns unser weiser ;-) Statistik-Professor beigebracht :-) An dieser Stelle nochmal ein geistiges Dankeschön für die einfacheren Rechenwege an ihn. MfG markus06

Unlustgefühle?[Bearbeiten]

Ja, bei dieser Darstellung wird mir in der Tat unwohl:

1. Das Wort "Unlustgefühl" sollte nicht in diesem Buch (und in keinem anderen mit pädagogischem Anspruch) verwendet werden.

2. Die Auswerung von

ist übrigens gar nicht so schlimm, wenn man's geschickt macht:

Einsetzung in die obige Formel führt auf:

Eine günstige Reihenfolge für die numerischen Operationen (29 Multiplikationen und 29 Divisionen) wäre nun z.B.

,

D.h. Division und Multiplikation wechseln sich ab und man arbeitet sich systematisch von den großen zu den kleinen Zahlen durch. Das geht mit jedem Taschenrechner (ohne die Fakultäts-Funktion zu bemühen!). Das Ergebnis ist übrigens 0.001674 (auf 4 signifikante Dezimalziffern gerundet).

"Leichter" wäre natürlich die Auswertung auf einem programmierbaren Rechner (Taschenrechner oder kleiner PC, das reicht). Die Programmierung ist nicht schwierig.

Auf jeden Fall habe ich bei dieser kleinen Rechenaufgabe keinerlei "Unlustgefühle"!

Ich weiß bereits, dass du ein Fan des geschickten Kürzens bist. Wenn man effizient arbeiten will, wie es ja häufig im praktischen Leben der Fall ist, ist diese Multipliziererei allerdings lästig und man hat auch die Gefahr von Rundungsfehlern bei großen Zahlen. Ich als chronisch arbeitsscheuer Mensch ziehe Approximationen vor. Vor allem bei der Verteilung, wenn es also um Summen mehrerer dieser Produkte geht, empfinde ich extreme Unlustgefühle. --Philipendula 11:28, 4. Jun 2006 (UTC)

Dies ist mehr als "geschicktes Kürzen". Das ist numerisch (d.h. auf Rechnern) schlicht effektiv.

Der relative Rundungsfehler bei Real-Multiplikation und -Division ist übrigens unabhängig von der Größe der Faktoren. Rundungsfehler sind gegenüber Approximationsfehlern (etwa bei der Sterlingschen Formel) wahrscheinlich vernachlässigbar.

Bei einer Diskussion über numerische Effizienz sollte man nicht vergessen, dass Potenzen und Funktions-Auswertungen - hier etwa die Auswertung der Exponential-Funktion - häufig sehr vieler arithmetischer Operationen bedürfen. Dagegen sind manchmal 10 oder 20 simple Multiplikationen ein numerischer Klacks. Eine scheinbar recht einfache Formel (auf dem Papier) kann numerisch wesentlich aufwendiger sein als ein (auf dem Papier) ellenlanger Bruch.

"Im praktischen Leben" wird mit Rechnern gearbeitet. Heute schon und morgen erst recht. Entscheidend für die praktische Relevanz ist daher numerische Effizienz und nicht "Schönheit auf dem Papier".

Martin, 04.06.06

Benütze doch bitte den Vorschaubutton. Siehe auch [1] --Philipendula 13:14, 4. Jun 2006 (UTC)


Stetigkeitskorrektur[Bearbeiten]

Da fehlt was beim Erklaeren. Warum sollte man die ganze Saeule addieren?? Das laesst sich zwar erklaeren, aber das steht nicht im Text. Entweder:

oder:

Nijdam 14:04, 12. Jul 2006 (UTC)

Ich verstehe das Problem nicht. Warum soll

rein? --Philipendula ? 17:27, 12. Jul 2006 (UTC)


Das soll nicht unbedingt, aber kann rein. Es gibt eine moeglichkeit die Korrektur zu verdeutlichen. ich dachte du kennst dieses Argument. Man bekommt 2 annaeherungen von und nimmnt eine Art Mittelwert als bessere .Nijdam 21:46, 12. Jul 2006 (UTC)

Dass es sich um einen mittleren Zuschlag handelt, war mir schon klar. Ich dachte nur, du beziehst dich speziell auf . Ich bezweifle allerdings, ob man da der Zielgruppe, Wirschaftler, mit so etwas einen Gefallen tut. Der Vergleich mit der ganzen Säule macht wenigstens klar, dass zwischen stetiger und diskreter Zufallsvariablen ein konzeptioneller Unterschied besteht. --Philipendula ? 14:29, 13. Jul 2006 (UTC)

Figur[Bearbeiten]

Ich denke die Figur mit B(45,0.3) und annaeherende N-verteilung stimmt nicht. Der Erwarungswert ist 13.5 und das kommt nicht ueberein mit dem Hochpunkt der N-Kurve. Allerdings zeigen Berechnungen das links von der Mitte die N-Dichte kleiner und rechts groesser ist als die B-verteilung.Nijdam 07:23, 14. Jul 2006 (UTC)

Stabdiagram[Bearbeiten]

Es bleibt auch noch zu erklaeren das du die diskrete Verteilungen, die eigentlich als Stabdiagram graphisch dargestellt werden sollen, hier als Saeulendiagram gezeichnet hast.Nijdam 13:18, 15. Jul 2006 (UTC)

Jawohl. --Philipendula ? 16:36, 15. Jul 2006 (UTC)

Weit entfernte Sterne[Bearbeiten]

Was ist die zusammenhang von Alpha Proxima Centauri mit diesem Artikel? Nijdam 18:40, 18. Mai 2009 (CEST)[Beantworten]

Ich wollte eigentlich nur zeigen, dass Approximation und Proxima verwandt sind. Ist vielleicht tatsächlich überflüssig. Ich dachte, dass die Kids den Stern eher kennen als die Bezeichnung Approximation. Habs etwas umformatiert. --Philipendula ? 10:36, 19. Mai 2009 (CEST)[Beantworten]
Jetzt verstehe ich es. Wäre Annäherung (Ap-proximation) nicht eine bessere Übersetzung? Und dann: Approximation: Approximation heißt Annäherung, vom Lateinische Proxima, nächste, wie ja beispielsweise Alpha Proxima Centauri der uns am nächsten gelegene Stern ist. Wir wollen ... Nijdam 10:03, 22. Mai 2009 (CEST)[Beantworten]

Vorschlag[Bearbeiten]

Entschuldige Philipendula, ich habe nicht gesehen es sei dein Buch Statistik, sonst haette ich, was ich jetzt machhe, hier Meine Aenderungen vorgeschlagen.

1.

Die Wahrscheinlichkeitsfunktion der Hypergeometrischen Verteilung mit den Parametern sieht so aus:

(Selbst schreibe ich p(m) um die diskrete Art zu betonen, und wegen die Aehnlichkeit: N -> n, M->m)

2.

... dass beide den gleichen Erwartungswert nθ haben.

Es kommt mir unlogisch vor hier EX = nθ zu schreiben, denn X ist hier ohne Bedeutung.

3.

Binomialverteilung: und hypergeometrische Verteilung:

(Auch hier ist X nicht definiert. Im Buch wird die Varianz definiert wie Var, aber spaeter auch klein geschrieben.)

4.

statt

(Vermutlich nur ein Typfehler)

Nijdam 10:01, 24. Jul. 2013 (CEST)[Beantworten]