Kategoriale Daten vs Numerische Daten
Daten sind die Fakten oder Informationen, die zu Referenz- oder Analysezwecken gesammelt wurden. Oft werden diese Daten als Attribut des betroffenen Subjekts gesammelt. Dieses Attribut kann von einem zum anderen variieren, daher kann dieses variierende Attribut als Variable betrachtet werden. Die Variablen können unterschiedliche Werte annehmen und diese sind in den gesammelten Daten enthalten.
Variablen können entweder qualitativ oder quantitativ sein; dh wenn die Variable quantitativ ist, sind die Antworten Zahlen und die Größe des gemessenen Attributs kann mit einem gewissen Grad an Genauigkeit angegeben werden. Der andere Typ, die qualitativen Variablen, messen die qualitativen Attribute und die von den Variablen angenommenen Werte können nicht in Bezug auf Größe oder Größe angegeben werden. Die Variablen selbst werden als kategoriale Variablen bezeichnet, und die mittels einer kategorialen Variablen gesammelten Daten sind kategoriale Daten.
Weitere Informationen zu numerischen Daten
Numerische Daten sind im Grunde die quantitativen Daten, die aus einer Variablen erhalten werden, und der Wert hat einen Sinn für Größe / Größe. Die erhaltenen numerischen Daten werden basierend auf der von Stanley Smith Stevens entwickelten Theorie weiter in drei weitere Kategorien unterteilt. Numerische Daten können entweder Ordnungszahlen, Intervalle oder Verhältnisse sein. Der Datentyp wird durch die Messmethode der Werte bestimmt, und die Typen werden als Messniveaus bezeichnet.
Das Gewicht einer Person, der Abstand zwischen zwei Punkten, die Temperatur und der Preis einer Aktie sind Beispiele für numerische Daten.
In der Statistik werden die meisten Methoden zur Analyse numerischer Daten abgeleitet. Grundlegende deskriptive Statistiken und Regressionen sowie andere Inferenzmethoden werden hauptsächlich zur Analyse numerischer Daten verwendet.
Weitere Informationen zu kategorialen Daten
Kategoriale Daten sind Werte für eine qualitative Variable, häufig eine Zahl, ein Wort oder ein Symbol. Sie zeigen, dass die Variable im betrachteten Fall zu einer der verschiedenen verfügbaren Optionen gehört. Daher gehören sie zu einer der Kategorien; daher der Name kategorisch.
Die politische Zugehörigkeit einer Person, die Nationalität einer Person, die Lieblingsfarbe einer Person und die Blutgruppe eines Patienten sind qualitative Attribute. Manchmal kann eine Zahl als kategorialer Wert erhalten werden, aber die Zahl selbst repräsentiert nicht die Größe des gemessenen Attributs. Die Postleitzahl ist ein Beispiel.
Außerdem gehören alle kategorialen Werte zum nominalen Datentyp, einem anderen Typ, der auf den Messniveaus basiert. Die zur Analyse kategorialer Daten verwendeten Methoden unterscheiden sich von denen numerischer Daten, das zugrunde liegende Prinzip kann jedoch dasselbe sein.
Was ist der Unterschied zwischen kategorialen und numerischen Daten?
• Numerische Daten sind Werte, die für eine quantitative Variable erhalten werden, und weisen einen Größenunterschied auf, der sich auf den Kontext der Variablen bezieht (daher sind sie immer Zahlen oder Symbole, die einen numerischen Wert tragen). Kategoriale Daten sind Werte, die für eine qualitative Variable erhalten wurden. kategoriale Datennummern haben keinen Sinn für Größe.
• Numerische Daten gehören immer entweder zum Ordnungs-, Verhältnis- oder Intervalltyp, während kategoriale Daten zum Nominaltyp gehören.
• Die zur Analyse quantitativer Daten verwendeten Methoden unterscheiden sich von den für kategoriale Daten verwendeten Methoden, auch wenn die Prinzipien gleich sind, zumindest weist die Anwendung erhebliche Unterschiede auf.
• Numerische Daten werden mit statistischen Methoden in deskriptiven Statistiken, Regressionen, Zeitreihen und vielem mehr analysiert.
• Für kategoriale Daten werden normalerweise beschreibende und grafische Methoden verwendet. Einige nicht parametrische Tests werden ebenfalls verwendet.