Die Welch-ANOVA ist ein Test, der unabhängige Stichproben darauf überprüft, ob die Mittelwerte verschiedener Gruppen signifikant unterschiedlich sind. Im Gegensatz zur normalen ANOVA benötigt die Welch-ANOVA keine homogenen Varianzen. Das bedeutet, dass der Test auch dann funktioniert, wenn die Varianzen der Gruppen nicht ähnlich sind. Wenn deine Varianzen homogen sind, kannst du die einfache ANOVA verwenden. Ein kurzes Tutorial zur zweifaktoriellen Varianzanalyse findest du hier.
Voraussetzungen der Welch-ANOVA
Die wichtigsten Voraussetzungen für die Welch-ANOVA sind:
- Mehr als zwei voneinander unabhängige Stichproben/Gruppen – bei nur zwei Gruppen sollte der Welch-Test durchgeführt werden.
- Metrisch skalierte abhängige Variable.
- Normalverteilte Fehlerterme oder normalverteilte abhängige Variable innerhalb der Gruppen.
- Keine homogenen (nahezu gleiche) Varianzen der abhängigen Variable über die Gruppen.
Durchführung der Welch-ANOVA in SPSS
Es gibt zwei Möglichkeiten, die Welch-ANOVA in SPSS durchzuführen:
- Über das Menü in SPSS: Analyse > Allgemeines lineares Modell > Univariat
- Oder über Analyse > Mittelwerte vergleichen > Einfaktorielle Varianzanalyse (*empfohlen)
Wähle als abhängige Variable die Testvariable aus und als Faktor das Merkmal/Variable, das die Gruppen trennt. Im Beispiel untersuchen wir den Ruhepuls über drei Gruppen. Wähle unter Optionen die deskriptive Statistik, den Test auf Homogenität der Varianzen und den Welch-Test aus.
Der Post-Hoc-Test ermöglicht den mehrfachen paarweisen Vergleich zwischen den Gruppen. Wenn ein statistisch signifikanter Unterschied vorliegt, interessiert uns, zwischen welchen der mindestens drei Gruppen dieser Unterschied besteht. Du kannst “Bonferroni” auswählen, obwohl es bei “Varianzgleichheit angenommen” steht. Post-Hoc-Tests sind t-Tests. Da bei mehrfachem Testen derselben Gruppen die Wahrscheinlichkeit, einen Alpha-Fehler zu begehen, steigt, muss die Signifikanz korrigiert werden. Es gibt verschiedene Korrekturverfahren, aber da die Varianzen wahrscheinlich nicht homogen sind, empfehle ich “Dunnett-T3” und “Games-Howell” auszuwählen.
Interpretation der Ergebnisse der Welch-ANOVA in SPSS
Deskriptive Statistiken
Ein erster Eindruck kann anhand der Tabelle der deskriptiven Statistiken gewonnen werden. Die Mittelwerte des Ruhepulses nehmen mit dem Trainingsgrad ab. Die Standardabweichungen, die die Varianz darstellen, sind unterschiedlich. Ein analytischer Test ist jedoch dennoch erforderlich.
Varianzhomogenität
Die Varianzhomogenität wurde mit dem Levene-Test überprüft. Wenn der p-Wert/Signifikanzwert unter 0,05 liegt, wird die Nullhypothese der Varianzhomogenität verworfen. In unserem Beispiel beträgt die Signifikanz 0,039, was kleiner als 0,05 ist. Das bedeutet, dass die Varianzen nicht gleich sind und wir eine Welch-ANOVA durchführen sollten.
Welch-ANOVA
Die Welch-ANOVA “versteckt” sich in der Tabelle “Robuste Testverfahren zur Prüfung auf Gleichheit der Mittelwerte”. Die Signifikanz ist hier besonders zu beachten. Wenn der Signifikanzwert kleiner als 0,05 ist, wird die Nullhypothese der Gleichheit der Mittelwerte über die Gruppen hinweg verworfen. In unserem Beispiel wird die Nullhypothese verworfen, was darauf hindeutet, dass es signifikante Unterschiede in den Mittelwerten der Gruppen gibt.
ACHTUNG: Einseitige Tests sind bei mehr als zwei Gruppen nicht möglich, da nicht gesagt werden kann, welche Gruppe einen größeren oder kleineren Wert hat.
Post-Hoc-Tests
Die Tabelle “Post-Hoc-Tests” zeigt, ob es signifikante Unterschiede zwischen den Gruppen gibt. Wenn die Signifikanz kleiner als 0,05 ist, nehmen wir an, dass es signifikante Unterschiede in den Mittelwerten zwischen den verglichenen Gruppen gibt.
In der obigen Tabelle stehen drei Post-Hoc-Tests: Bonferroni, Dunnett-T3 und Games-Howell. In der zweiten Spalte steht die erste Gruppe, in der dritten Spalte steht die zweite Gruppe, mit der die erste verglichen wird. In der vierten Spalte steht die mittlere Differenz zwischen den Gruppenmittelwerten. In der sechsten Spalte stehen die Signifikanzwerte. Wenn die Signifikanz kleiner als 0,05 ist, wird die Nullhypothese der Gleichheit der Mittelwerte für den jeweiligen Vergleich abgelehnt.
Für den Dunnett-T3-Post-Hoc-Test sehen wir, dass es scheinbar keine Unterschiede zwischen den untrainierten und mäßig trainierten Gruppen gibt (mittlere Differenz von 7,615, Signifikanz von 0,279). Allerdings gibt es einen signifikanten Unterschied zwischen den untrainierten und gut trainierten Gruppen (mittlere Differenz von 10,615, Signifikanz von 0,001). Es gibt auch Unterschiede zwischen den mäßig trainierten und gut trainierten Gruppen (mittlere Differenz von 10,615, Signifikanz von 0,016) bezüglich des Ruhepulses.
Videotutorial
Tipp zum Schluss
Findest du die Tabellen in SPSS hässlich? Erfahre hier, wie du mit nur wenigen Klicks die Tabellen im APA-Standard ausgeben lassen kannst.