Kap. 2.3 Biostatistik

Marcel Zwahlen

Dieses Kapitel führt in die Biostatistik als zentrales Werkzeug von Biomedizin und Public Health ein. Ausgangspunkt ist die Frage, wie sich beobachtete Unterschiede – etwa zwischen Therapien oder Bevölkerungsgruppen – beurteilen lassen und ob sie auf Zufall oder auf echte Effekte zurückzuführen sind. Da biologische Prozesse und Messungen natürlicher Variabilität unterliegen, braucht es statistische Methoden, um Daten systematisch zu beschreiben und zu interpretieren. Behandelt werden grundlegende Datentypen sowie zentrale Verfahren der deskriptiven Statistik, mit denen Daten übersichtlich zusammengefasst und grafisch dargestellt werden können. Ein weiterer Schwerpunkt liegt auf der Analyse von Stichproben: Das Kapitel erklärt, warum Ergebnisse aus Zufallsstichproben schwanken, wie diese Stichprobenvariabilität mit zunehmender Fallzahl abnimmt und welche Rolle dabei die Normalverteilung spielt. Darauf aufbauend werden 95 %-Vertrauensintervalle eingeführt, die einen Wahrscheinlichkeitsbereich für den wahren Wert einer Kenngröße angeben. Abschließend thematisiert das Kapitel den Umgang mit Wahrscheinlichkeiten, die Interpretation von Screening-Tests sowie die Bedeutung von p-Werten und statistischer Signifikanz. Dabei wird betont, dass statistische Signifikanz allein nicht ausreicht: Erst im Zusammenspiel mit Vertrauensintervallen lässt sich beurteilen, ob ein Ergebnis auch klinisch oder gesundheitspolitisch relevant ist.

Auf dieser Seite finden Sie die in diesem Kapitel verwendeten Literaturquellen, Hinweise zu empfohlener Vertiefungsliteratur, ergänzende Abbildungen, Formeln, Tabellen und Boxen sowie weiterführende Internetquellen zum Thema.

Empfohlene Vertiefungsliteratur

Lehrbücher
Zusätzliche Literatur
  • Quatember A. Statistischer Unsinn: Wenn Medien an der Prozenthürde Scheitern. 1st ed. Berlin, Heidelberg: Springer Berlin / Heidelberg; 2015. 1 p.

    Dieses Buch lädt die Leser zu einer kritischen und amüsanten Irrfahrt durch falsche Schlagzeilen und unsinnige Interpretationen statistischer Ergebnisse in Tageszeitungen oder Zeitschriften ein. Staunen Sie darüber, dass ein Viertel aller Studierenden alkoholabhängig ist, dass Männer ihren Rasierern treuer sind als ihren Partnerinnen, dass höherer Schokoladenkonsum mehr Nobelpreisträger erzeugt – und warum das alles blanker Unsinn ist.
  • Special issue of The American Statistican. Statistical Inference in the 21st Century: A World Beyond p < 0.05, 2019.
    Das Sonderheft markiert einen wichtigen Wendepunkt in der statistischen Methodendiskussion. Es kritisiert die verbreitete Praxis, wissenschaftliche Ergebnisse allein anhand einer starren p-Wert-Schwelle zu beurteilen, und zeigt, wie dies zu Fehlinterpretationen, Übervereinfachungen und problematischen Anreizstrukturen in der Forschung beitragen kann.
  • Sterne JA, Davey Smith G. Sifting the evidence-what’s wrong with significance tests? BMJ. 2001 Jan 27;322(7280):226–31.
    Der Artikel von Sterne und Davey Smith ist eine frühe und einflussreiche Kritik an der dominierenden Rolle von Signifikanztests in der medizinischen Forschung. Die Autoren zeigen auf, dass die Fixierung auf p-Werte häufig zu einem mechanischen „Abhaken“ von Ergebnissen als signifikant oder nicht signifikant führt und dabei zentrale Fragen nach der Größe, Präzision und Bedeutung von Effekten in den Hintergrund treten. Besonders problematisch ist, dass nicht signifikante Ergebnisse oft fälschlich als „kein Effekt“ interpretiert werden, während statistisch signifikante Befunde überbewertet werden – unabhängig von ihrer klinischen Relevanz oder der Unsicherheit der Schätzung.

Zusätzliche Abbildungen:

(1) Ergänzende Abbildung zu Kap. 2.3.3 Transparentes Zusammenfassen der erhobenen Daten

Web-Abb. 2.3.1 Häufigkeitsgrafik, die den Zivilstand (Personenstand) der 30- bis 49-jährigen Männer und Frauen in der Schweiz wiedergibt (Schweizerische Gesundheitsbefragung 2007)

(2)   Ergänzende Abbildungen zu Kap. 2.3.4  Variabilität des Mittelwertes bei wiederholten Zufalls-Stichproben

 Web-Abb. 2.3.2  Stichprobenvariabilität in Abhängigkeit von der Stichprobengröße für den Mittelwert des Body Mass Index (BMI in kg/m2) bei einem wahrem Mittelwert von 25 kg/m2 und einer Standardabweichung von 4 kg/m2. Resultate von Computersimulationen mit jeweils 10.000 Stichproben

Web-Abb. 2.3.3  Normalverteilungskurven für die Stichprobenvariabilität in Abhängigkeit von der Stichprobengröße

a. Prozentsatz an verheirateten Personen; Stichprobengröße: 50 bzw. 100 Personen
b. BMI-Mittelwert; Stichprobengröße: 10 bzw. 30 Personen

 

Zusätzliche Formeln

Web-Formel 2.3.1 Formeln für die Berechnung des 95%-Vertrauensintervalls einer Proportion

Web-Formel 2.3.2 Formeln für die Berechnung des Standardfehlers und des 95% Vertrauensintervalls der Differenz zwischen zwei Mittelwerten sowie der Differenz zweier Proportionen

Web-Formel 2.3.3 Formeln für die Berechnung des 95% Vertrauensintervalls des relativen Risikos und der Odds Ratio

Web-Formel 2.3.4 Berechnung des p-Wertes für die Hypothese, dass die Differenz der wahren Mittelwerte zwischen zwei Gruppen exakt Null ist (MWGruppe1 – MWGruppe2 = 0) (s. a. Tab. 2.3.5)

Zusätzliche Tabellen

Web-Tab. 2.3.1 Flächenberechnungen mit Hilfe verschiedener Statistik-Software (R; Stata; Excel) für einen bestimmten Prozentsatz an Werten innerhalb der Normalverteilung bei vorgegebenem Mittelwert (MW) und vorgegebener Standardabweichung (SD)

Zusätzliche Boxen

(1) Ergänzende Box zu Kap. 2.3.7  Der Umgang mit Wahrscheinlichkeiten: Interpretation von Untersuchungen und Tests

Web-Box 2.3.1  Wichtige Rechenregeln für den Umgang mit Wahrscheinlichkeiten

P(A) steht für die Wahrscheinlichkeit (Probabilität), dass das Ereignis A eintritt oder zutrifft (= unbedingte Wahrscheinlichkeit).

P(A | B) steht für die Wahrscheinlichkeit von A, unter der Bedingung, dass B eintritt oder zutrifft (= bedingte Wahrscheinlichkeit).

  • Nichtnegativität und Normierung: 0  ≤  P(A)  ≤  1

Wahrscheinlichkeiten sind nichtnegative, reelle Zahlen. Die Wahrscheinlichkeit eines sicheren Ereignisses ist 1, diejenige des unmöglichen Ereignisses ist 0.

  • Komplementarität: P(A) = 1 – P(nicht A)

Die Wahrscheinlichkeiten zweier sich ausschließender Ereignisse sind komplementär, wenn entweder das eine oder das andere Ereignis eintreten muss (z.B. Tod oder Überleben zum Zeitpunkt des Studienendes; positives oder negatives Resultat einer Mammografie bei untersuchten Frauen).

  • Multiplikation: P(A und B) = P(A | B) x P(B) = P(B | A) x P(A)

Die Wahrscheinlichkeit für das gemeinsame Eintreten der Ereignisse A und B lässt sich durch Multiplikation der bedingten Wahrscheinlichkeit des einen Ereignisses mit der (unbedingten) Wahrscheinlichkeit des anderen Ereignisses berechnen (Beispiele für solche Ereignisse wären Vorhofflimmern [A] und Schlaganfall [B] oder Brustkrebs [A] und positives Resultat einer Mammografie [B]).

  • Addition: P(A oder B) = P(A) + P(B)

Die Wahrscheinlichkeit, dass entweder das Ereignis A oder das Ereignis B eintritt, ist gleich der Summe beider Einzelwahrscheinlichkeiten, wenn beide Ereignisse sich gegenseitig ausschließen (ein Beispiel hierfür wäre ein Sportler, der direkt nach einem Sportunfall entweder zu seinem Hausarzt [A] oder in die Notfallstation eines Krankenhauses [B] geht; beides ist  gleichzeitig nicht möglich).

Software zur Datenanalyse