Datentypen in Statistiken | Qualitative vs. quantitative Daten

Inhalt

Dieser Artikel wurde im Rahmen der Data Science Blogathon

Einführung

In Datenwissenschaft, Unser Ziel ist es, verschiedene Experimente mit Rohdaten durchzuführen und einige gute Erkenntnisse aus den Daten zu gewinnen. Um jedes Unternehmen auf den richtigen Weg zu bringen, die Daten sind sehr wichtig oder wir können das sagen “Daten sind der Treibstoff”. Sie können zumindest nützliche Informationen bereitstellen, die helfen können:

  • Aktuelle Kampagnenstrategien,
  • Organisieren Sie ganz einfach neue Produkteinführungen oder
  • Probieren Sie verschiedene Experimente aus.

In all den oben genannten Dingen, die einzige gemeinsame Antriebskomponente sind Daten. Wir treten in das digitale Zeitalter ein, in dem wir täglich große Datenmengen produzieren.

Zum Beispiel, Täglich, ein Unternehmen wie Flipkart produziert mehr als 2 Daten TB.

Aufgrund der großen Bedeutung von Daten in unserem Leben, Es wird sehr wichtig, diese Daten korrekt und fehlerfrei zu speichern und zu verarbeiten. Beim Umgang mit Datensätzen, die Art der Daten oder die Kategorie der Daten spielt eine wichtige Rolle bei der Beantwortung der folgenden Fragen:

  • Welche Vorverarbeitungsstrategie würde für einen bestimmten Satz funktionieren, um die richtigen Ergebnisse zu erhalten?, Ö
  • Welche Art von statistischer Analyse sollte angewendet werden, um die besten Ergebnisse zu erzielen.

Dann, In diesem Artikel, Wir werden die verschiedenen Arten von Daten in Statistiken besprechen, die Sie kennen müssen Explorative Datenanalyse (EDA), was eine der wichtigsten Komponenten in der Pipeline eines Machine-Learning-Projekts ist.

37_1-4323362

Bildquelle: Google Bilder

Inhaltsverzeichnis

1. Einführung in Datentypen in der Statistik und ihre Bedeutung

2. Qualitative vs. quantitative Daten

3. Qualitative Daten

  • Nenndaten
  • Ordnungsdaten

4. Quantitative Daten

  • Diskrete Daten
  • Kontinuierliche Daten
  • Intervalldaten
  • Beziehungsdaten

Einführung in Datentypen in der Statistik

In der Statistik, Datentypen spielen eine sehr entscheidende und wichtige Rolle, was soll verstanden werden, um statistische Messungen korrekt auf Ihre Daten anzuwenden, damit wir bestimmte Annahmen über die Daten richtig treffen können.

Ähnlich, Wir müssen wissen, an welcher Datenanalyse und welcher Art Sie arbeiten, um die richtige Wahrnehmungstechnik auszuwählen, da verschiedene Arten von Daten als Ansatz zur Organisation verschiedener Arten von Variablen betrachtet werden.

Währenddessen Explorative Datenanalyse (EDA) In einem allgemeinen Data-Science-Projekt, ein gutes Verständnis der verschiedenen Datentypen ist entscheidend, da wir bestimmte statistische Maße nur für bestimmte Datentypen verwenden können.

Es ist auch als bekannt Messskala.

Beim Umgang mit einem der Datentypen, wir müssen auch wissen, welche Anzeigemethode zum jeweiligen Datentyp passt.

Wir können uns Datentypen als eine Möglichkeit vorstellen, verschiedene Typen von Variablen zu kategorisieren.

Quantitative vs. qualitative Daten

Quantitative Daten

1. Diese Datentypen scheinen am einfachsten zu erklären zu sein. Versuchen Sie, Antworten auf Fragen zu finden wie

  • “Viele,
  • “Wie viele” Ja
  • “Wie oft”

2. Kann als Zahl ausgedrückt werden, damit es quantifiziert werden kann. In einfachen Worten, kann durch numerische Variablen gemessen werden.

3. Diese lassen sich leicht für statistische Manipulationen öffnen und können durch eine Vielzahl von statistischen Arten von Grafiken und Tabellen dargestellt werden, wie z Liniendiagramme, Balkendiagramme, Streudiagrammetc.

Beispiele für quantitative Daten:

  • Test- und Prüfungsergebnisse, P. Nicht. 74, 67, 98, etc.
  • Das Gewicht einer Person.
  • Die Temperatur in einem Raum.

Es gibt 2 allgemeine Arten quantitativer Daten:

  • Diskrete Daten
  • Kontinuierliche Daten

Qualitative Daten

1. Qualitative Daten können nicht als Zahl ausgedrückt werden, Sie können also nicht gemessen werden. Es besteht hauptsächlich aus Wörtern, Bilder und Symbole, aber keine Zahlen.

2. Es ist auch bekannt als Kategoriale Daten da die Informationen nach Kategorien sortiert werden können, nicht nach nummer.

3. Diese können Fragen beantworten wie:

  • “Wie ist das passiert”, Ö
  • "Warum ist das passiert".

Qualitative Datenbeispiele:

  • Farben, zum Beispiel, die Farbe des Meeres.
  • Beliebte Urlaubsziele wie die Schweiz, Neuseeland, Südafrika, etc.
  • Ethnizität als Indianer, asiatisch, etc.

Allgemein, existieren 2 qualitative Datentypen:

  • Nenndaten
  • Ordnungsdaten.


Qualitative Daten

Nenndaten

1. Dieser Datentyp wird nur verwendet, um Variablen zu beschriften, ohne einen quantitativen Wert zu haben. Hier, der Begriff "nominal"’ kommt vom lateinischen Wort “kein Mann” Bedeutung 'Name’.

2. Nennen Sie einfach eine Sache, ohne nach einer bestimmten Reihenfolge zu fragen. Nominale Daten werden manchmal als . bezeichnet “Etiketten”.

Beispiele für Nenndaten:

  • Geschlecht (Frauen, Herren)
  • Haarfarbe (rubio, Kastanie, mehrno, rot, etc.)
  • Familienstand (verheiratet, Einzel, Witwer)

Wie Sie in den Beispielen sehen können, es gibt keine intrinsische Ordnung für die Variablen.

Die Augenfarbe ist eine nominale Variable mit einigen Stufen oder Kategorien wie Blau, Verde, Braun, etc. und es gibt keine Möglichkeit, diese Kategorien hierarchisch zu ordnen, nämlich, vom höchsten zum niedrigsten oder umgekehrt.

slide_16-8593825

Bildquelle: Google Bilder

Ordnungsdaten

1. Der entscheidende Unterschied zu nominalen Datentypen besteht darin, dass Ordinaldaten zeigen, wo eine Zahl in einer bestimmten Reihenfolge vorhanden ist.

2. Diese Art von Daten wird basierend auf ihrer Position auf einer Skala in eine bestimmte Reihenfolge gebracht. Ordinale Daten können auf Überlegenheit hinweisen.

3. Wir können keine arithmetischen Operationen mit ordinalen Daten durchführen, da sie nur die Folge zeigen.

4. Ordinale Variablen gelten als qualitative und quantitative „Zwischen“-Variablen..

5. In einfachen Worten, wir können Ordinaldaten als qualitative Daten verstehen, für die die Werte geordnet sind.

6. Im Vergleich zu Nenndaten, die zweite sind qualitative Daten, deren Werte nicht in eine Bestellung aufgenommen werden können.

7. Nach der relativen Position, Wir können Ordinaldaten auch Zahlen zuordnen. Aber mit diesen Zahlen können wir nicht rechnen. Zum Beispiel, “Zuerst, Sekunde, Dritter … etc.”

Beispiele für Ordinaldaten:

  • Ranking der Nutzer in einem Wettbewerb: Zuerst, zweite und dritte, etc.
  • Bewertung eines Produkts vom Unternehmen auf einer Skala von 1 al 10.
  • Ökonomische Situation: baja, mittel und hoch.

Umfragen zur Mitarbeiterzufriedenheit und Ordnungsdaten |  Umfragedatentypen in Statistiken anpassen

Bildquelle: Google Bilder

Quantitative Daten

Diskrete Daten

1. Gibt die Zählung mit nur ganzen Zahlen zurück und wir können die diskreten Werte nicht in Teile unterteilen.

Zum Beispiel, Die Anzahl der Schüler in einer Klasse ist ein Beispiel für diskrete Daten, da wir zwar ganze Individuen zählen können, aber nicht zählen können als 2.5, 3.75, Kinder.

2. In einfachen Worten, diskrete Daten können nur bestimmte Werte annehmen und Datenvariablen können nicht in kleinere Teile unterteilt werden.

3. Hat eine begrenzte Anzahl möglicher Werte zum Beispiel, Tage des Monats.

Beispiele für diskrete Daten:

  • Die Anzahl der Schüler in einer Klasse.
  • Die Anzahl der Arbeitnehmer in einem Unternehmen.
  • Die Anzahl der Testfragen, die Sie richtig beantwortet haben.

allrtsfordiscretedata-5402025

Bildquelle: Google Bilder

Kontinuierliche Daten

1. Stellt Informationen dar, die auf ihren feinsten Ebenen erheblich aufgeschlüsselt werden könnten. Es kann auf einer Skala oder kontinuierlich gemessen werden und kann fast jeden Zahlenwert haben.

Zum Beispiel, Wir können unsere Körpergröße auf sehr präzisen Skalen in verschiedenen Einheiten wie Metern messen, Zentimeter, Millimeter, etc.

2. Der Hauptunterschied zwischen kontinuierlichen und diskreten Datentypen besteht darin, dass im ersteren, wir können kontinuierliche Daten in so vielen verschiedenen Maßen wie Breite aufzeichnen, Temperatur, Wetter, etc.

3. Stetige Variablen können jeden Wert zwischen zwei Zahlen annehmen. Zum Beispiel, zwischen dem Bereich von 60 Ja 82 Zoll, es gibt Millionen von möglichen Höhen wie 62.04762 Zoll, 79.948376 Zoll, etc.

4. Eine gute Faustregel für die Definition, ob die Daten kontinuierlich oder diskret sind, ist, ob der Messpunkt halbiert werden kann und es dennoch Sinn macht, Daten sind kontinuierlich.

Beispiele für kontinuierliche Daten:

  • Der Zeitaufwand für die Fertigstellung eines Projekts.
  • Kindergröße.
  • Geschwindigkeit von Autos.

kontinuierliches Datenbalkendiagramm-Beispiel-3808905 Bildquelle: Google Bilder

Intervalldaten

1. Diese Datentypen können mit den nächsten Elementen gemessen und geordnet werden, aber sie haben keine signifikante Null.

Lassen Sie uns die Bedeutung von verstehen “Intervall-Skala”:

Auf der Intervallskala, der Begriff "Intervall"’ bedeutet Platz in der Mitte, das ist eine wichtige Sache, an die man sich erinnern sollte, da uns Intervallskalen nicht nur über die Ordnung aufklären, aber auch Informationen über den Wert zwischen den einzelnen Elementen bereitstellen.

2. Grundsätzlich, wir können die Intervalldaten auf die gleiche Weise wie die Verhältnisdaten anzeigen, aber was wir berücksichtigen müssen, sind die gekennzeichneten Nullpunkte.

3. Deswegen, mit Hilfe von Intervalldaten, Wir können die Grade der Daten leicht korrelieren und die Werte auch addieren oder subtrahieren.

4. Es gibt einige deskriptive Statistiken, die wir für Intervalldaten berechnen können, wie z:

  • Zentrale Trendmaßnahmen (Medien, Median, Mode)
  • Rang (Minimum, maximal)
  • Ausbreitung (Perzentile, Interquartilsabstand und Standardabweichung).

Dies sind nicht die einzigen statistischen Dinge, die berechnet werden müssen, aber wir können auch mehr berechnen.

Beispiele für Intervalldaten:

  • Temperatur (° C oder F, aber nicht Kelvin)
  • Termine (1055, 1297, 1976, etc.)
  • Zeitintervall auf einer Uhr 12 Std (6 ein. M., 6 P. M.)

Beziehungsdaten

1. Diese Daten sind auch in den bestellten Einheiten, die den gleichen Unterschied haben.

2. Die Verhältniswerte sind die gleichen wie die Intervallwerte, aber der einzige Unterschied besteht darin, dass die Verhältnisdaten einen absoluten Nullpunkt haben. Zum Beispiel, Höhe, Last, Länge, etc.

3. Diese werden mit äquidistanten Elementen mit einer signifikanten Null gemessen und geordnet und sind niemals negativ wie Intervalldaten.

Lassen Sie uns das an einem herausragenden Beispiel verstehen: Höhenmessung.

Die Höhe kann in Einheiten wie Zentimetern gemessen werden, Zoll, Meter oder Fuß und ein negativer Höhenwert ist nicht möglich.

4. Es klärt uns über die Reihenfolge der Variablen auf, die kontraste zwischen ihnen, und sie haben absolut null.

5. Die Verhältnisdaten sind grundsätzlich die gleichen wie die Intervalldaten, abgesehen von null bedeutet keine.

6. Die deskriptiven Statistiken, die wir für die Verhältnisdaten berechnen können, sind die gleichen wie die Intervalldaten wie:

  • Zentrale Trendmaßnahmen (Medien, Median, Mode)
  • Rang (Minimum, maximal)
  • Ausbreitung (Perzentile, Interquartilsabstand und Standardabweichung).

Beispiel für Beziehungsdaten:

  • Alter (von 0 Jahre bis 100+)
  • Temperatur (in Kelvin, aber nicht in °C oder F)
  • Zeitintervall (gemessen mit Stoppuhr oder ähnlichem)

Für die obigen Beispiele für Verhältnisdaten, Wir sehen, dass es einen echten und signifikanten Nullpunkt wie das Alter einer Person gibt, Absoluter Nullpunkt, die berechnete Entfernung von einem bestimmten Punkt oder Zeitpunkt, sie haben alle echte Nullen.

HINWEIS:

Wenn wir den Nullpunkt der Skala subjektiv wählen, dann können die Daten zu diesem Zeitpunkt keine Verhältnisdaten sein und sollten Intervalldaten sein.

Abschließende Anmerkungen

Danke fürs Lesen!

Ich hoffe, Ihnen hat der Artikel gefallen und Sie haben Ihr Wissen über Datentypen in der Statistik erweitert.

Zögern Sie nicht, mich zu kontaktieren Über Email

Alles was nicht erwähnt wurde oder du deine Gedanken teilen möchtest? Fühlen Sie sich frei, unten einen Kommentar zu hinterlassen und ich melde mich bei Ihnen.

Für die restlichen Artikel, Frag die Verknüpfung.

Über den Autor

Aashi Goyal

Heutzutage, Ich studiere meinen Bachelor of Technology (B.Tech) in Elektro- und Nachrichtentechnik von Universidad Guru Jambheshwar (GJU), Hisar. Ich bin sehr begeistert von Statistik und Data Science.

Die in diesem Artikel zu Datentypen in Statistiken gezeigten Medien sind nicht Eigentum von Analytics Vidhya und werden nach Ermessen des Autors verwendet.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.