Die empirische Varianz ist ein wichtiges Streumaß in der Statistik. Sie gibt an, wie weit die einzelnen Werte um den Mittelwert verteilt sind. Je größer die Varianz, desto weiter sind die Werte vom Mittelwert entfernt.
Streuung
Unter Streuung versteht man die Verteilung der Werte um den Mittelwert. Eine schwache Streuung bedeutet, dass die Werte dicht beim Mittelwert liegen, während eine starke Streuung bedeutet, dass die Werte entfernt vom Mittelwert liegen.
Beispiel: Die Werte 100, 200 und 300 haben einen Mittelwert von 200. Die Werte 199, 200 und 201 haben ebenfalls den Mittelwert 200, streuen aber erheblich weniger.
Streumaße
Streumaße geben Auskunft über die Breite der Verteilung und die Variabilität der Werte.
Streudiagramme
Streudiagramme stellen die Beziehung zwischen zwei Datensätzen grafisch dar.
Spannweite
Die Spannweite R ist die Differenz zwischen dem größten und dem kleinsten Wert der geordneten Datenreihe. Sie gibt jedoch keine Informationen über die Verteilung der Werte zwischen den Extremwerten.
Mittlere lineare Abweichung
Die mittlere lineare Abweichung gibt den durchschnittlichen Abstand jedes einzelnen Werts zum arithmetischen Mittelwert an.
Varianz
Die Varianz ist ein Streumaß, das die durchschnittliche quadratische Abweichung aller Messwerte vom arithmetischen Mittelwert angibt. Sie hat eine andere Einheit als die Messwerte selbst.
Empirische Varianz
Die empirische Varianz berücksichtigt alle Daten einer Grundgesamtheit, die aus der Beobachtung eines Prozesses gewonnen wurden.
Varianz einer Stichprobe berechnen
Bei der Berechnung der Varianz einer Stichprobe wird die Summe der quadrierten Abweichungen durch (n-1) dividiert. Dies korrigiert eine mögliche Unterschätzung der Varianz bei kleinen Stichproben.
Bessel-Korrektur
Die Bessel-Korrektur wird angewendet, um eine verzerrte Schätzung der Stichprobenvarianz zu korrigieren. Sie wird verwendet, wenn die Stichprobenvarianz dazu neigt, die wahre Varianz der Grundgesamtheit zu unterschätzen. Die Varianz wird dabei durch n geteilt, anstatt durch (n-1).
Varianz einer diskreten Zufallsvariablen berechnen
Die Varianz einer diskreten Zufallsvariablen wird durch das Quadrieren der Differenz jedes Werts zur Erwartungswert multipliziert mit der Wahrscheinlichkeit des Auftretens dieses Werts berechnet.
Standardabweichung
Die Standardabweichung ist ein Maß für die durchschnittliche Entfernung aller Messwerte vom arithmetischen Mittelwert. Je größer die Streuung, desto höher ist die Standardabweichung.
Unterschied Standardabweichung und Varianz
Die Standardabweichung ist das Quadratwurzel der Varianz. Sie wird bevorzugt verwendet, da sie die eigentlichen Einheiten der gemessenen Werte verwendet.
Auswirkung von “Ausreißern”
“Ausreißer” können die Standardabweichung stark beeinflussen, da sie weit von den anderen Werten entfernt liegen.
Standardfehler
Der Standardfehler (SEM) gibt an, wie weit die Stichprobenstandardabweichung von der Standardabweichung der Grundgesamtheit abweicht. Er wird verwendet, um den Mittelwert einer Stichprobe zu schätzen.
Unterschied Standardabweichung und Standardfehler
Die Standardabweichung misst die durchschnittliche Abweichung der Messwerte vom Mittelwert, während der Standardfehler die mittlere Abweichung des Mittelwerts einer Stichprobe von der wahren Grundgesamtheit misst.