Der ultimative Leitfaden zum Vergleichen der Mittelwerte zweier Gruppen

Wenn es darum geht, die Mittelwerte zweier Gruppen zu vergleichen, führt kein Weg am Zweistichproben-t-Test vorbei. Dieser Test ist besonders hilfreich, wenn wir beispielsweise die Messungen von Patienten mit einer bestimmten Krankheit mit denen einer gesunden Kontrollgruppe vergleichen möchten.

INHALTSVERZEICHNIS

Hypothesen aufstellen

Bevor wir mit dem Test beginnen, müssen wir klar definieren, welche Hypothesen wir untersuchen möchten. Hierbei gibt es drei verschiedene Möglichkeiten, je nachdem, in welche Richtung unsere Alternativhypothese geht. Für unser Beispiel der längeren Lebenserwartung von Nichtrauchern formulieren wir folgende Hypothesen:

Nullhypothese (H0): Die Lebenserwartung von Nichtrauchern ist kleiner oder gleich der Lebenserwartung von Rauchern (mu_N ≤ mu_R).
Alternativhypothese (H1): Die Lebenserwartung von Nichtrauchern ist größer als die Lebenserwartung von Rauchern (mu_N > mu_R).

Test wählen

Um den Zweistichproben-t-Test durchzuführen, müssen wir die passende Testmethode festlegen. Aufgrund der Art unserer Datensätze ist hier der Zweistichproben-t-Test die beste Wahl.

Signifikanzniveau festlegen

Das Signifikanzniveau bestimmt die Wahrscheinlichkeit, mit der wir einen Fehler machen könnten, indem wir fälschlicherweise die Alternativhypothese akzeptieren, obwohl die Nullhypothese wahr ist. In den meisten Fällen verwenden wir einen Wert von 5% (alpha = 0,05). Für besonders kritische Fragestellungen, die die menschliche Gesundheit betreffen, kann das Signifikanzniveau jedoch niedriger gewählt werden, beispielsweise auf 1% (alpha = 0,01). In unserem Beispiel verwenden wir das übliche Signifikanzniveau von 5% (alpha = 0,05).

Daten sammeln

Bevor wir den Test durchführen können, müssen wir die Daten für unsere beiden Stichproben sammeln. Hier sind die Werte für das erreichte Lebensalter von 6 Nichtrauchern (N) und 8 Rauchern (R).

LESEN Wann darf man am Arm keinen Blutdruck messen?

Prüfgröße berechnen

Um die Prüfgröße (T) zu berechnen, brauchen wir den Mittelwert, die Anzahl der Beobachtungen und die Varianz in beiden Gruppen. Für unsere Daten ergeben sich folgende Werte:

Bar{x}: Der Mittelwert der Nichtraucher ist 82.
nx: Die Anzahl der Beobachtungen in der Nichtrauchergruppe beträgt 6.
s^2x: Die Varianz der Nichtrauchergruppe ist 128,4.
Bar{y}: Der Mittelwert der Raucher ist 72,875.
ny: Die Anzahl der Beobachtungen in der Rauchergruppe beträgt 8.
s^2y: Die Varianz der Rauchergruppe ist 89,554.

Die Prüfgröße (T) berechnen wir dann wie folgt:

[ T = frac{bar{x} – bar{y}}{sqrt{frac{s^2_x}{n_x} + frac{s^2_y}{n_y}}} = 1,598 ]

Verteilung der Prüfgröße bestimmen

Unter der Annahme, dass die Nullhypothese gilt, folgt die Prüfgröße einer t-Verteilung mit (nx + ny – 2) Freiheitsgraden. In unserem Fall haben wir 6 + 8 – 2 = 12 Freiheitsgrade.

Kritischen Bereich (oder p-Wert) berechnen

Um den kritischen Bereich zu bestimmen, suchen wir das 95%-Quantil der t-Verteilung mit 12 Freiheitsgraden. In unserer Tabelle finden wir dafür den Wert 1,782.

Testentscheidung treffen

Mit den Informationen über die Prüfgröße und den kritischen Bereich können wir nun eine Entscheidung treffen. Da unsere Prüfgröße (T) nicht im kritischen Bereich liegt, können wir die Nullhypothese nicht ablehnen. Das bedeutet jedoch nicht, dass wir bewiesen haben, dass Nichtraucher nicht länger leben als Raucher.

Für die anderen beiden Beispiele aus dem 1. Schritt gelten ähnliche Schritte. Die Prüfgröße (T) wird auf die gleiche Weise berechnet, während sich der kritische Bereich je nach Art der Alternativhypothese ändert.

Jetzt bist du bereit, die Mittelwerte zweier Gruppen zu vergleichen und fundierte Schlussfolgerungen zu ziehen. Viel Erfolg bei deinen zukünftigen Analysen!

LESEN Pferdeversicherungen: OP und Krankenversicherung