Mittelwert gegen Median gegen Modus
Mittelwert, Median und Modus sind die Hauptmaße der zentralen Tendenz, die in der deskriptiven Statistik verwendet werden. Sie unterscheiden sich vollständig voneinander, und auch die Fälle, in denen sie zur Zusammenfassung der Daten verwendet werden, sind unterschiedlich.
Bedeuten
Das arithmetische Mittel ist die Summe der Datenwerte geteilt durch die Anzahl der Datenwerte, dh
Wenn die Daten aus einem Probenraum stammen, spricht man von einem Stichprobenmittelwert (
), der eine beschreibende Statistik der Stichprobe darstellt. Obwohl es das am häufigsten verwendete beschreibende Maß für eine Stichprobe ist, ist es keine robuste Statistik. Es ist sehr empfindlich gegenüber Ausreißern und Schwingungen.
Betrachten Sie beispielsweise das durchschnittliche Einkommen der Bürger einer bestimmten Stadt. Da alle Datenwerte summiert und dann geteilt werden, wirkt sich das Einkommen einer äußerst wohlhabenden Person erheblich auf den Mittelwert aus. Daher sind die Mittelwerte nicht immer eine gute Darstellung der Daten.
Auch im Fall eines Wechselsignals variiert der Strom, der durch ein Element fließt, periodisch von der positiven Richtung zur negativen Richtung und umgekehrt. Wenn wir den durchschnittlichen Strom nehmen, der in einer einzelnen Periode durch das Element fließt, ergibt dies eine 0, was bedeutet, dass kein Strom durch das Element geflossen ist, was offensichtlich nicht wahr ist. Daher ist auch in diesem Fall das arithmetische Mittel kein gutes Maß.
Das arithmetische Mittel ist ein guter Indikator, wenn die Daten gleichmäßig verteilt sind. Bei einer Normalverteilung ist der Mittelwert gleich dem Modus und dem Median. Es hat auch die niedrigsten Residuen, wenn der quadratische Mittelwertfehler berücksichtigt wird; Daher die beste beschreibende Maßnahme, wenn ein Datensatz durch eine einzelne Zahl dargestellt werden muss.
Median
Die Werte des mittleren Datenpunkts nach dem Anordnen aller Datenwerte in aufsteigender Reihenfolge werden als Median des Datensatzes definiert. Der Median ist das 2. Quartil, 5. Dezil und 50. Perzentil.
• Wenn die Anzahl der Beobachtungen (Datenpunkte) ungerade ist, ist der Median die Beobachtung genau in der Mitte der geordneten Liste.
• Wenn die Anzahl der Beobachtungen (Datenpunkte) gerade ist, ist der Median der Mittelwert der beiden mittleren Beobachtungen in der geordneten Liste.
Der Median teilt die Beobachtung in zwei Gruppen ein; dh eine Gruppe (50%) von Werten höher und eine Gruppe (50%) von Werten niedriger als der Median. Mediane werden speziell in verzerrten Verteilungen verwendet und repräsentieren Daten ziemlich besser als das arithmetische Mittel.
Modus
Der Modus ist die am häufigsten vorkommende Zahl in einer Reihe von Beobachtungen. Der Modus eines Datensatzes wird berechnet, indem die Häufigkeit jedes Elements innerhalb des Datensatzes ermittelt wird.
• Wenn kein Wert mehr als einmal vorkommt, hat der Datensatz keinen Modus.
• Andernfalls ist jeder Wert, der mit der größten Frequenz auftritt, ein Modus des Datensatzes.
In einem Satz können mehrere Modi vorhanden sein. Daher ist mode keine eindeutige Statistik eines Datensatzes. In einer gleichmäßigen Verteilung gibt es einen Modus. Der Modus einer diskreten Wahrscheinlichkeitsverteilung ist der Punkt, an dem die Wahrscheinlichkeitsmassenfunktion ihren höchsten Punkt erreicht. Ausgehend von den obigen Interpretationen können wir sagen, dass globale Maxima Modi sind.
Betrachten Sie die Anwendung aller drei Maßnahmen auf den folgenden Datensatz.
DATEN: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, fünfzehn}
Mittelwert = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15+ 15) / 25 = 8,12
Median = 9 (13. Element)
Modus = 9 (Frequenz von 9 = 5)
Was ist der Unterschied zwischen Mittelwert, Median und Modus?
• Das arithmetische Mittel ist die Summe der Werte (Beobachtungen) geteilt durch die Anzahl der Beobachtungen. Es handelt sich nicht um eine robuste Statistik, die stark von der Normalverteilung innerhalb der betrachteten Verteilung abhängt. Ein einzelner Ausreißer kann eine signifikante Verschiebung des Mittelwerts verursachen und relativ irreführende Werte ergeben. Das Konzept kann auf den geometrischen Mittelwert, den harmonischen Mittelwert, den gewichteten Mittelwert usw. erweitert werden.
• Der Median ist der Mittelwert der Beobachtungen und wird von Ausreißern relativ wenig beeinflusst. Es kann eine gute Schätzung als zusammenfassende Statistik in stark verzerrten Fällen geben.
• Der Modus ist der häufigste Beobachtungswert im Datensatz. Wenn die Verteilung positiv verzerrt ist, liegt der Modus links vom Median, und wenn er negativ verzerrt ist, liegt der Modus rechts vom Median.
• Wenn der Wert positiv verzerrt ist, stimmt der Mittelwert mit dem Median überein. Wenn der negativ verzerrte Mittelwert links vom Median liegt.
• In der Normalverteilung sind alle drei, Mittelwert, Modus und Median gleich.