Population vs. Sample Standardabweichung
In der Statistik werden mehrere Indizes verwendet, um einen Datensatz zu beschreiben, der seiner zentralen Tendenz, Streuung und Schiefe entspricht. Die Standardabweichung ist eines der häufigsten Maßstäbe für die Streuung von Daten von der Mitte des Datensatzes.
Aufgrund praktischer Schwierigkeiten ist es nicht möglich, Daten aus der gesamten Bevölkerung zu verwenden, wenn eine Hypothese getestet wird. Daher verwenden wir Datenwerte aus Stichproben, um Rückschlüsse auf die Population zu ziehen. In einer solchen Situation werden diese als Schätzer bezeichnet, da sie die Populationsparameterwerte schätzen.
Es ist äußerst wichtig, unverzerrte Schätzer für die Inferenz zu verwenden. Ein Schätzer wird als unvoreingenommen bezeichnet, wenn der erwartete Wert dieses Schätzers gleich dem Populationsparameter ist. Zum Beispiel verwenden wir den Stichprobenmittelwert als unvoreingenommenen Schätzer für den Populationsmittelwert. (Mathematisch kann gezeigt werden, dass der erwartete Wert des Stichprobenmittelwerts gleich dem Populationsmittelwert ist). Bei der Schätzung der Populationsstandardabweichung ist die Stichprobenstandardabweichung ebenfalls ein unvoreingenommener Schätzer.
Was ist die Populationsstandardabweichung?
Wenn Daten aus der gesamten Bevölkerung berücksichtigt werden können (z. B. bei einer Volkszählung), kann die Standardabweichung der Bevölkerung berechnet werden. Um die Standardabweichung der Population zu berechnen, werden zunächst die Abweichungen der Datenwerte vom Populationsmittel berechnet. Der quadratische Mittelwert (quadratischer Mittelwert) der Abweichungen wird als Populationsstandardabweichung bezeichnet.
In einer Klasse von 10 Schülern können Daten über die Schüler leicht gesammelt werden. Wenn eine Hypothese für diese Studentenpopulation getestet wird, müssen keine Stichprobenwerte verwendet werden. Zum Beispiel wird das Gewicht der 10 Schüler (in Kilogramm) mit 70, 62, 65, 72, 80, 70, 63, 72, 77 und 79 gemessen. Dann beträgt das Durchschnittsgewicht der zehn Personen (in Kilogramm) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, was 71 (in Kilogramm) entspricht. Dies ist der Bevölkerungsdurchschnitt.
Um nun die Populationsstandardabweichung zu berechnen, berechnen wir Abweichungen vom Mittelwert. Die jeweiligen Abweichungen vom Mittelwert betragen (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 und (79 - 71) = 8. Die Summe der Abweichungsquadrate ist (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Die Populationsstandardabweichung ist √ (366/10) = 6,05 (in Kilogramm). 71 ist das genaue Durchschnittsgewicht der Schüler der Klasse und 6,05 ist die genaue Standardabweichung des Gewichts von 71.
Was ist die Standardabweichung der Stichprobe?
Wenn Daten aus einer Stichprobe (Größe n) verwendet werden, um Parameter der Population zu schätzen, wird die Standardabweichung der Stichprobe berechnet. Zunächst werden die Abweichungen der Datenwerte vom Stichprobenmittelwert berechnet. Da der Stichprobenmittelwert anstelle des Populationsmittelwerts (der unbekannt ist) verwendet wird, ist die Verwendung des quadratischen Mittelwerts nicht angemessen. Um die Verwendung des Stichprobenmittelwerts zu kompensieren, wird die Summe der Abweichungsquadrate durch (n-1) anstelle von n geteilt. Die Standardabweichung der Stichprobe ist die Quadratwurzel davon. In mathematischen Symbolen ist S = √ {∑ (x i - ẍ) 2 / (n - 1)}, wobei S die Standardabweichung der Stichprobe ist, ẍ der Stichprobenmittelwert ist und x i die Datenpunkte sind.
Nehmen wir nun an, dass im vorherigen Beispiel die Bevölkerung die Schüler der gesamten Schule sind. Dann ist die Klasse nur eine Stichprobe. Wenn diese Stichprobe für die Schätzung verwendet wird, beträgt die Standardabweichung der Stichprobe √ (366/9) = 6,38 (in Kilogramm), da 366 durch 9 anstelle von 10 (Stichprobengröße) geteilt wurde. Zu beachten ist, dass dies nicht garantiert der exakte Populationsstandardabweichungswert ist. Es ist nur eine Schätzung dafür.
Was ist der Unterschied zwischen der Populationsstandardabweichung und der Stichprobenstandardabweichung? • Die Populationsstandardabweichung ist der genaue Parameterwert, der zur Messung der Streuung vom Zentrum verwendet wird, während die Standardabweichung der Stichprobe ein unvoreingenommener Schätzer dafür ist. • Die Populationsstandardabweichung wird berechnet, wenn alle Daten zu jedem Individuum der Population bekannt sind. Andernfalls wird die Standardabweichung der Stichprobe berechnet. • Die Populationsstandardabweichung ist gegeben durch σ = √ {∑ (xi-µ) 2 / n}, wobei µ der Populationsmittelwert und n die Populationsgröße ist, die Standardabweichung der Stichprobe jedoch gegeben ist durch S = √ {∑ (xi-ẍ)) 2 / (n-1)} wobei ẍ der Stichprobenmittelwert und n die Stichprobengröße ist. |