Medizinische Informatik: Statistik
Zurück zur Übersicht
Einleitung
[Bearbeiten]In einigen Punkten hat die Einführung des Computers statistische Berechnungen in der Medizin entscheidend verbessert:
- Ohne Computer war die Datenerfassung in einem Karteikasten oder etwas ähnlichem sehr mühsam
- Ohne Computer musste man tagelang rechnen, bis man eine statistische Auswertung fertig bekam.
- Das Verfassen einer medizinischen Arbeit mit der Schreibmaschine war mühsam. Viele Seiten mussten wegen kleiner Fehler noch einmal geschrieben werden.
- Die Suche nach speziellen Patientendaten geht heute viel schneller, da vieles in den Krankenhäusern oder Arztpraxen bereits edv-mäßig erfasst ist.
Man hat also eigentlich genügend Zeit für wichtige Fragen, bei denen der Computer wenig helfen wird:
- Was will ich eigentlich untersuchen ?
- Wie komme ich am besten an meine Daten ?
- Wie erfasse ich meine Daten gleich so, daß ich sie hinterher auch gut auswerten kann ?
- Wie werte ich meine Daten aus ?
- Kritische Bewertung von Studien und deren Statistiken
Will man ein paar gute medizinische Arbeiten lesen, in denen die medizinische Statistik in der Regel hervorragend umgesetzt wurde, dann sollte man sich Orginalarbeiten aus dem Lancet oder dem New England Journal of Medicine anschauen. Empfehlenswert sind auch die Zusammenfassungen auf folgender Website:
- http://www.evimed.ch/cgi-bin/WebObjects/nuSite.woa/evimed/journal_club.html
- Schweizer Horten-Zentrum für praxisorientierte medizinische Forschung
Der 4 Felder Test, ein simples aber wichtiges Instrument für die medizinische Statistik
[Bearbeiten]Der 4-Feldertest ist ein universelles Statistikwerkzeug für Mediziner. Man sollte ein bißchen mit ihm herumspielen, dann weiß man wie er funktioniert und wie man Daten damit bewerten kann.
Der Vierfeldertest dient dazu, die Häufigkeit eines Merkmals in zwei unabhängigen Gruppen zu vergleichen
Visual Basic 3.0 Quelltext
[Bearbeiten]Sub Befehl1_Click () Rem Fehlerroutine bei leeren Feldern einbauen text5.Text = "" N1 = Val(text1.Text) N2 = Val(text2.Text) M1 = Val(text3.Text) M2 = Val(text4.Text) Rem ERWARTUNGSWERT EN1 R1 = N1 + M1 NN = N1 + N2 N = N1 + N2 + M1 + M2 E1 = R1 * NN / N text5.Text = text5.Text + "Erwartungswert E1 =" + Str(E1) + Chr(13) + Chr(10) Rem ERWARTUNGSWERT EN2 MM = M1 + M2 E2 = R1 * MM / N text5.Text = text5.Text + "Erwartungswert E2 =" + Str(E2) + Chr(13) + Chr(10) Rem ERWARTUNGSWERT EN3 R2 = N2 + M2 E3 = R2 * NN / N text5.Text = text5.Text + "Erwartungswert E3 =" + Str(E3) + Chr(13) + Chr(10) Rem ERWARTUNGSWERT EN4 E4 = R2 * MM / N text5.Text = text5.Text + "Erwartungswert E4 =" + Str(E4) + Chr(13) + Chr(10) Rem PROBE=0? S = E1 + E2 + E3 + E4 P = S - N text5.Text = text5.Text + "Probe" + Str(S) + "-" + Str(N) + "=" + Str(P) + "=0?" + Chr(13) + Chr(10) Rem CHI^2 D1 = (N1 - E1) ^ 2: C1 = D1 / E1 D2 = (M1 - E2) ^ 2: C2 = D2 / E2 D3 = (N2 - E3) ^ 2: C3 = D3 / E3 D4 = (M2 - E4) ^ 2: C4 = D4 / E4 C = C1 + C2 + C3 + C4 text5.Text = text5.Text + "CHI-QUADRAT=" + Str(C) + Chr(13) + Chr(10) If C - 3.841 > 0 Then text5.Text = text5.Text + "Bei P=0.05 besteht ein signifikanter Unterschied" If C - 3.841 <= 0 Then text5.Text = text5.Text + "Bei P=0.05 besteht kein signifikanter Unterschied " End Sub
Beispiel:
[Bearbeiten]Man befragt 50 Frauen ( GRUPPE 1) , ob sie rauchen oder nicht.
Dasselbe macht man mit 50 Männern ( GRUPPE 2).
Man erhält das Ergebnis :
FRAUEN : 25 Raucher 25 Nichtraucher MÄNNER : 30 Raucher 20 Nichtraucher
Kann man anhand dieser Befragung schon sagen , ob es mehr Nichtraucher unter den Frauen gibt ?
Diese Frage beantwortet der Vierfelder Test .
Dazu muß man die Werte beider Gruppen eingeben und eine Irrtumswahrscheinlichkeit wählen. ( Hier p = 0.05 )
Wollen Sie das Ergebnis mal testen ?
Erwartungswert E1 = 27.5 Erwartungswert E2 = 27.5 Erwartungswert E3 = 22.5 Erwartungswert E4 = 22.5 Probe 100- 100= 0=0? CHI-QUADRAT= 1.01010101010101 Bei P=0.05 besteht kein signifikanter Unterschied
2 Schlüsse kann man aus diesem Ergebnis ziehen :
==> Entweder es gibt tatsächlich keinen Unterschied in der Verteilung des Merkmals Raucher/Nichtraucher ODER
==> die Stichproben aus beiden Gruppen waren zu klein
Probieren Sie mal , dieselben Werte nur alle mal 10 genommen.
Frauen: 250 Nichtraucher 250 Raucher Männer: 300 Nichtraucher 200 Raucher
Wollen Sie noch einmal testen , dann drücken Sie auf die Taste SIGNIFIKANZBERECHNUNG !
Erwartungswert E1 = 275 Erwartungswert E2 = 275 Erwartungswert E3 = 225 Erwartungswert E4 = 225 Probe 1000- 1000= 0=0? CHI-QUADRAT= 10.1010101010101
Bei P=0.05 besteht ein signifikanter Unterschied
Dann sieht das Ergebnis anders aus. Wenn man kleine Unterschiede finden will,braucht man also große Zahlen in den Stichproben.
Links
[Bearbeiten]- http://www.langsrud.com/stat/Fishertest.htm
- Vierfeldertest Online
- http://www.madeasy.de/4/4feld.htm
- http://www.madeasy.de/7/4feld.htm
- Gambas: Statistik#Vierfeldertest
Tipps für die medizinische Doktorarbeit
[Bearbeiten]Man will im Rahmen einer Doktorarbeit medizinische Daten erheben und möchte diese zur Beantwortung einer Fragestellung auswerten.
Dabei empfiehlt sich:
- Erfassung der Daten in einer bestimmten Struktur z.B. in EXCEL oder Formular in ACCESS
- Patientennamen und Daten in 2 getrennten Dateien erfassen, wenn man die Daten extern auswerten lassen will.
- Jedem Patienten wird eine Nummer zu geordnet ( Tabelle Name - FallNummer )
- Eigentliche Datentabelle mit FallNummer - Daten
Datentabelle
[Bearbeiten]- Kategorien werden mit Zahlen verschlüsselt (z.B. 1 bedeutet männlich, 2 bedeutet weiblich)
- Zeilen in der Tabelle sind Fälle (Patienten, Probanden, Tiere), in der Regel eine Zeile pro Fall
- Spalten in der Tabelle sind die Variablen (Alter, Geschlecht, Laborwerte ...)
- jede Variable wird durch einen plausiblen Namen definiert mit dem in der Statistiksoftware gearbeitet wird.
- dieser Name muss
- eindeutig sein,
- sollte eine Länge von maximal 8 Zeichen haben,
- mit einem Buchstaben beginnen und
- keine Sonderzeichen und Umlaute enthalten
- dieser Name muss
- die Variablennamen stehen in der ersten Tabellenzeile
- ab der 2. Zeile werden die Rohdaten eingetragen, die möglichst nur Zahlen- und Datumsangaben enthalten sollten
- bei fehlenden Werten sind die entsprechenden Felder leer zu lassen
- alle Daten sollten in eine einzige Tabelle geschrieben werden
- jedes Tabellenfeld darf nur eine einzige Information enthalten; so müssen z.B. Mehrfachdiagnosen in mehrere Spalten aufgeteilt werden (DIAG1, DIAG2, DIAG3 ...)
Beispieltabelle Statistik BlindarmOP
[Bearbeiten]PatNr Geschl Alter Leukos CRP Tastbef Sono OP Histo --------------------------------------------------------- 1 1 12 12000 5 1 1 1 1 2 2 34 8000 8 0 1 1 1 3 1 75 11000 12 1 0 0 0 4 2 7 17000 2 1 0 1 1
Geschl 1 = männlich 2 = weiblich Tastbef 1 = VaApp 2 = kein VaApp 0 = nicht untersucht Sono 1 = VaApp 2 = kein VaApp 0 = nicht untersucht OP 1 = App 2 = keine App 0 = nicht operiert Histo 1 = App 2 = keine App 0 = keine Histo vorliegend
Einige wichtige Statistiken
[Bearbeiten]Krankenhausdaten
[Bearbeiten]Kennzahlen zur stationären Gesundheitsversorgung 2006
Grunddaten Einheit Krankenhäuser Vorsorge- o.Reha-einrichtungen ------------------------------------------------------------------------------- Krankenhäuser/ Einrichtungen Anzahl 2104 1255 Betten Anzahl 510767 172717 Patientenfälle Anzahl 16 Mio 832883 1 Mio 836 681 Verweildauer Tage 8,5 25,6 Bettenauslastung % 76,3 74,6
Krankenhausdaten Deutschland (Quelle destatis)
Jahr 1991 1998 2008 -------------------------------------------------------- Anzahl der KH 2411 2263 2067 KH-Betten 1000 666 572 500 Anzahl d.Pat. Mio 14,6 16,8 17,4 Verweildauer Tage 14,0 10,1 8,1
Kosten
[Bearbeiten]Gesundheitsausgaben in Deutschland 2006 nach Ausgabenträgern
Ausgabenträger Milliarden EUR --------------------------------------------------- insgesamt 245 Gesetzliche Krankenversicherung 140 Private Haushalte, Private Organis. ohne Erwerbszweck 33 Private Krankenversicherung 22 Soziale Pflegeversicherung 18 Öffentliche Haushalte 13 Arbeitgeber 10 Gesetzliche Unfallversicherung 4,1 Gesetzliche Rentenversicherung 3,6
Vergleich Gesetzliche Krankenkasse (GKV) mit den Privaten Krankenkassen (PKV) in Deutschland 2007
GKV PKV ---------------------------------- Versicherte in Mio 70,3 8,6 Einnahmen in Mrd € 155,4 27,6 Ausgaben in Mrd € 145,5 18,2
Todesursachen
[Bearbeiten]Anzahl der Gestorbenen nach ICD-10-Hauptgruppen (Kapitel) Deutschland
Anzahl der Gestorbenen Kapitel Name der Hauptgruppe 2004 2005 2006 ---------------------------------------------------------------------------------------- Alle Kapitel Insgesamt 818 271 830 227 821 627 I Best. infektiöse und parasitäre Krankheiten 11 062 12 061 12 354 II Neubildungen (Tumoren,Krebs etc) 214 863 216 928 217 095 III Blut, blutbildende Organe, Immunsystem 2 054 2 123 2 044 IV Hormone, Ernährung Stoffwechsel 27 041 28 271 26 624 V Psychische und Verhaltensstörungen 9 516 11 356 14 145 VI Krankheiten des Nervensystems 17 675 18 555 19 394 VII Auge und der Augenanhangsgebilde 3 1 6 VIII Ohr und Warzenfortsatz 11 9 11 IX Krankheiten des Kreislaufsystems 368 472 367 361 358 953 X Krankheiten des Atmungssystems 52 500 57 742 54 888 XI Krankheiten des Verdauungssystems 42 213 42 787 42 973 XII Krankheiten der Haut und der Unterhaut 587 607 677 XIII Muskel-Skelett-System und Bindegewebe 1 981 2 024 2 282 XIV Krankheiten des Urogenitalsystems 13 246 14 288 15 087 XV Schwangerschaft, Geburt und Wochenbett 37 28 41 XVI Perinatalperiode 1 443 1 341 1 390 XVII Angeborene Fehlbildungen etc 1 576 1 528 1 473 XVIII Symptome anderenorts nicht klassifiziert 20 682 20 193 19 978 XIX Verletzungen, Vergiftungen etc 33 309 33 024 32 212
Diagnosen in der ambulanten Behandlung beim Hausarzt
[Bearbeiten]Häufigste Diagnosen in Prozent der Behandlungsfälle in Arztpraxen in Nordrhein (Rang und Anteil). Gliederungsmerkmale: Jahre, Geschlecht, ICD10, Arztgruppe Angezeigte Werte beziehen sich auf: Praxen von Allgemeinmediziner(n)/innen und praktischen Ärzt(en)/innen, Beide Geschlechter, 2006
Diagnosen (Behandlungsanlass) Rang/Anteil Rang Anteil in % -------------------------------------------------------------------------------------- I10 Essentielle (primäre) Hypertonie 1 28,7 E78 Störungen des Lipoproteinstoffwechsels 2 23,3 M54 Rückenschmerzen 3 14,2 I25 Chronische ischämische Herzkrankheit 4 9,8 E11 Typ-II-Diabetes 5 9,2 E04 Sonstige nichttoxische Struma 6 9,0 E66 Adipositas 7 8,5 M53 Krankheiten der Wirbelsäule 8 7,0 K76 Sonstige Krankheiten der Leber 9 6,8 E79 Purin- und Pyrimidinstoffwechsels (zB Gicht) 10 6,7 I83 Varizen der unteren Extremitäten 11 6,4 K29 Gastritis und Duodenitis 12 6,3 M47 Spondylose 13 5,9 M17 Gonarthrose [Arthrose des Kniegelenkes] 14 5,5 J30 Vasomotorische + allerg.Rhinopathie 15 5,3 J45 Asthma bronchiale 16 5,2 F32 Depressive Episode 17 5,2 J44 Sonstige chron. obstruktive Lungenkrankheit 18 5,2 K21 Gastroösophageale Refluxkrankheit 19 5,0 J06 akute Infektionen der oberen Atemwege 20 4,9 J20 Akute Bronchitis 21 4,9 M51 Sonstige Bandscheibenschäden 22 4,8 I50 Herzinsuffizienz 23 4,5 M81 Osteoporose ohne pathologische Fraktur 24 4,2 I49 Sonstige Herzrhythmusstörungen 25 4,1 F45 Somatoforme Störungen 26 4,0 K80 Gallensteine 27 3,9 G47 Schlafstörungen 28 3,6 G43 Migräne 29 3,6 Z25 Impfungen 30 3,5
Arztbesuche pro Jahr
[Bearbeiten]Deutschland 17 Tschechien 12 - 14 Slowakei 12 - 14 Japan 12 - 14 Österreich 10 Schweiz 5,3 Schweden 2 - 3
NNT Number needed to treat Anzahl der notwendigen Behandlungen
[Bearbeiten]Wie viel muß ich behandeln um ein Ereignis zu verhindern ?
Je kleiner die NNT desto effektiver die Behandlung
Die Anzahl der notwendigen Behandlungen (en. number needed to treat NNT) ist eine wichtige statistische Maßzahl, die angibt, wie viele Patienten behandelt werden müssen, um das gewünschte Therapieziel bei einem Patienten zu erreichen. Sie ist neben der absoluten und relativen Risikoreduktion ein recht anschauliches Mittel, um den Nutzen einer Behandlung in Zahlen darzustellen. Eine größere NNT bedeutet eine kleinere Risikoreduktion.
NNT wird auch in der Präventivmedizin verwendet und manchmal als Anzahl der notwendigen Screenvorgänge (en. numbers needed to screen NNS) bezeichnet. In der praktischen Anwendung sollte die NNT mit der NNH (en, numbers needed to harm) in Relation gesetzt werden, d.h., die Anzahl der notwendigen Behandlungen, um das gewünschte Therapieziel bei einem Patienten zu erreichen wird mit der notwendigen Anzahl Behandlungsvorgänge, um bei einem Patienten einen Schaden zu verursachen, verglichen.
Berechnung
[Bearbeiten]Man kann die Zusammenhänge sehr gut mit Hilfe einer Vierfeldertafel illustrieren. Diese stellt eine Möglichkeit der Auswertung einer wissenschaftlichen Untersuchung dar. Idealerweise handelt es sich um eine prospektive, kontrollierte und randomisierte Studie.
- Man vermutet, dass zwei mögliche Maßnahmen verschieden häufig zu einem bestimmten Ziel führen (Zielpunkt). Verglichen werden zwei (Patienten)gruppen, die sich nur durch die angewandte Maßnahme unterscheiden. Andere Einflussfaktoren wurden durch die Randomisierung ausgeschlossen. Man ermittelt durch eine standardisierte Untersuchung, bei wie vielen Patienten der jeweiligen Gruppe das Ziel erreicht wurde und bei wie vielen es verfehlt wurde.
Zielpunkt | ||
erreicht | nicht erreicht | |
Maßnahme 1 | A | B |
Maßnahme 2 | C | D |
Dabei steht:
- A für die Anzahl der Patienten, bei denen mit Maßnahme 1 das Ziel erreicht wurde,
- B für die Anzahl der Patienten, bei denen mit Maßnahme 1 das Ziel nicht erreicht wurde,
- C für die Anzahl der Patienten, bei denen mit Maßnahme 2 das Ziel erreicht wurde,
- D für die Anzahl der Patienten, bei denen mit Maßnahme 2 das Ziel nicht erreicht wurde.
Die ARR (Absolute Risikoreduktion) berechnet sich dann wie folgt:
Eine positive Absolute Risikoreduktion bedeutet eine Überlegenheit von Maßnahme 1 gegenüber Maßnahme 2. Hat die Absolute Risikoreduktion einen negativen Wert, bedeutet dies eine Unterlegenheit von Maßnahme 1. Für die Aussagekraft der ARR ist weiterhin ihr Konfidenzintervall wichtig.
Die NNT berechnet sich wie folgt:
oder
Eine negative ARR würde man nicht als negative number needed to treat, sondern als positive number needed to harm (NNH) darstellen.
Rundung: Will man die NNT ohne Nachkommastellen angeben, so empfiehlt es sich, aufzurunden. Beispiel:
- 4,2304 Patienten müssen behandelt werden, damit ein Patient weniger stirbt
- (mindestens) 5 Patienten müssen behandelt werden, damit ein Patient weniger stirbt
Das normalerweise übliche Abrunden hätte zur Folge, dass der Therapieeffekt überschätzt würde.
Wertigkeit
[Bearbeiten]Wichtig ist, dass die Werte der NNT bzw. der ARR streng genommen zunächst nur für die Studie gelten, innerhalb der sie ermittelt wurden. Die externe Validität der Studie beschreibt die Übertragbarkeit nach außen - das heißt auf einen speziellen Fall oder auf eine allgemeingültige Aussage. Daher ist es wichtig, dass neben der NNT auch die Gruppen und der Zielpunkt genau beschrieben werden. Beispiel:
- Werden männliche weiße Patienten im Alter zwischen 23 und 34 Jahren, die an Schnupfen erkrankt, sonst aber kerngesund sind, für sieben Tage mit 5 g von Medikament A behandelt, so müssten 100.000 Patienten behandelt werden, damit 1 Patient mehr nach 10 Tagen schnupfenfrei wird, als es ohne irgendeine Behandlung der Fall gewesen wäre.
Weblinks
[Bearbeiten]
Medizinisch-Statistische Fehleinschätzungen
[Bearbeiten]Spermienqualität
[Bearbeiten]Jahrelang wurde behauptet, die Spermienqualität in Deutschland nehme ab, und versucht, dies mit allerlei Ursachen zu erklären. Neure Studien zeigen, daß die Aussagen statistisch nicht haltbar sind. Siehe http://www.aerztezeitung.de/medizin/krankheiten/urologische-krankheiten/?sid=496560 ( Professor Eberhard Nieschlag beim "European Congress of Endocrinology" (ECE) in Berlin )
Literatur
[Bearbeiten]- Medizinische Statistik, Herbert Immich , Schattauer Verlag
- Leider nur noch antiquarisch verfügbar, didaktisch hervorragend gemacht, mit sehr vielen praktischen medizinischen Beispielen. Sehr empfehlenswert.
- Basiswissen Medizinische Statistik (Springer-Lehrbuch) (Taschenbuch) von Christel Weiß
- Biomathematik, Statistik und Dokumentation: Eine leichtverständliche Einführung. Nach den Gegenstandskatalogen für den 1. und 2. Abschnitt der ärztlichen Prüfung von Volker Harms
- Einführung in die Medizinische Statistik (Springer Taschenbuch) von Ralf-Dieter Hilgers (Autor), Peter Bauer (Autor), Viktor Scheiber (Autor)
- Methodik klinischer Studien: Methodische Grundlagen der Planung, Durchführung und Auswertung (Taschenbuch) von Martin Schumacher (Autor), Gabriele Schulgen (Autor)
- Die medizinische Doktorarbeit (Broschiert) von Claudius Diez (Autor)
Links
[Bearbeiten]Linklisten Statistik
[Bearbeiten]Allgemeines
[Bearbeiten]- Statistik
- GNU R
- Kategorie:Medizinstatistik
- http://www.evimed.ch/glossar/index.html
- Glossar medizinische Statistik
Gesundheitsstatistik
[Bearbeiten]- http://www.gapminder.org
- Hans Rosling aus Schweden und seine didaktisch sehr gut aufbereiteten Statistiken
- http://de.statista.org/statistik/studien/kategorie/9/
- Medizinische Statistiken gut verständlich aufbereitet
- http://www.destatis.de/jetspeed/portal/cms/Sites/destatis/Internet/DE/Navigation/Statistiken/Gesundheit/Gesundheit.psml
- Statistisches Bundesamt Deutschland
- http://www.medknowledge.de/qualitaetsmanagement/statistik.htm
- Statistische Daten für das deutsche Gesundheitswesen