Statistik in Excel | 10 Statistikfunktionen in Microsoft Excel

Inhalt

Überblick

  • Microsoft Excel ist ein hervorragendes Werkzeug zum Erlernen und Ausführen statistischer Funktionen
  • Hier gibt es 12 Statistikfunktionen in Excel, die Sie für eine erfolgreiche Analytics-Karriere beherrschen müssen

Wir werden in Statistik überragen!

“Statistik ist die Grammatik der Wissenschaft”. – Karl Pearson

Machen wir es ein bisschen relevanter für uns: Statistik ist die Grammatik der Datenwissenschaft. Sie werden feststellen, dass fast alle erfolgreichen Data Science- oder Analytics-Profis ein solides Verständnis von Statistik haben., aber bedeutet das, dass Sie einen Master-Abschluss in dem Fach benötigen??

Absolut nicht!

giphy-9522744

Wir werden uns diesem Artikel mit dem berühmten Pareto-Prinzip nähern: das 80% Konsequenzen kommen von 20% der Ursachen. Deswegen, wir konzentrieren uns hauptsächlich auf die 20% der Konzepte und Funktionen, die nützlich sind 80% Wetter. Jetzt, die frage als analytiker ist, So starten Sie die Implementierung von Statistiken?

Natürlich, Sie können diese Konzepte in Programmiersprachen wie Python und R . implementieren und üben. Aber warte eine Sekunde und denk nach: Was ist das am häufigsten verwendete Tool in den meisten Organisationen??

Es ist Microsoft Excel! Mal ehrlich, Excel ist das Schweizer Taschenmesser für Analytics-Profis, mit dem Sie sich auf das Wesentliche konzentrieren können (Statistik in unserem Fall) und erledigt den Rest der Berechnungen und Anpassungen selbst.

Dieser Artikel richtet sich an alle, die ihre Reise in Richtung Statistik mit Excel beginnen.. wir werden verwenden 10 Wichtige statistische Funktionen in Excel zur Beantwortung von Fragen für ein fiktives Sportunternehmen, Khelo, während wir Ihre Daten prüfen.

Wenn Sie ein Anfänger in der Welt der Analytik und Excel sind, Ich empfehle Ihnen dringend, diese kostenlosen Kurse zu besuchen:

Wie wir diese statistischen Funktionen zuerst in Excel angehen

Ich habe diese statistischen Funktionen in Excel in zwei Kategorien unterteilt:

  • Grundlegende statistische Funktionen
  • Statistische Zwischenfunktionen

Lasst uns beginnen!

Die Daten verstehen und das Problem stellen

Wir werden einige wichtige Fragen zu unserem fiktiven Sportbekleidungs- und Ausrüstungsunternehmen lösen: Khelo. Das sind die Spalten, die wir haben:

  • Team
  • Anzahl der verkauften Artikel
  • Kosten für jeden Artikel
  • % aus
  • Einkommen

pexels-jopwell-1325735-300x200-9491425

Im Zuge dieses Artikels, wir werden diese fragen beantworten:

  1. Wie viele Artikel haben Rabatt?
  2. Wie viele Artikel / Ausrüstung verkauft den Laden?
  3. Wie viele Produkte werden ohne Rabatt verkauft??
  4. Werden Produkte verkauft, die mehr kosten als 2000 zusammen mit einem Diskontsatz höher als 50%?
  5. Was ist die durchschnittliche Anzahl der verkauften Produkte??
  6. Wie hoch ist die durchschnittliche Anzahl verkaufter Produkte??
  7. Was ist der häufigste Rabattprozentsatz?
  8. Was ist die Standardabweichung der Anzahl der verkauften Produkte??
  9. Gibt es einen Zusammenhang zwischen der Anzahl der verkauften Produkte und dem Rabattprozentsatz??

Grundlegende statistische Funktionen in Excel

MS Excel bietet eine Vielzahl nützlicher Statistikfunktionen. Beginnen wir mit einigen der grundlegenden, aber äußerst leistungsstarken Funktionen. Mal ehrlich, Sie werden feststellen, dass Sie die grundlegenden statistischen Funktionen auf 90% der Zeit und 10% die restliche Zeit wird von mittleren und fortgeschrittenen Funktionen beansprucht.

Wir werden hier hauptsächlich über die verschiedenen Arten von Zählfunktionen sprechen. Sie sind anderen Funktionen wie Summe sehr ähnlich, maximal, Minimum, Durchschnitt.

1. Zählfunktion

Wir verwenden die Zählfunktion, wenn wir die Anzahl der Zellen zählen müssen, die eine Zahl enthalten. Erinnern NUR ZAHLEN! Sehen wir uns die Funktion an:

  • ZÄHLEN (Tapferkeit1, [Wert2],…)

Dann, Versuchen wir, die Antwort auf unsere erste Frage zu finden: Auf wie viele Artikel gab es einen Rabatt?

Excel-Anzahl-8779758

Es gibt 11 reduzierte Produkte.

2. Zählfunktion

Während die Zählfunktion nur Zahlenwerte zählt, die COUNT-Funktion zählt alle Zellen in einem Bereich, die nicht leer sind. Die Funktion ist nützlich zum Zählen von Zellen, die jede Art von Informationen enthalten, inklusive Fehlerwerten und Leertext.

  • ERZÄHLEN (Tapferkeit1, [Wert2],…)
Die zweite Frage beantworten wir mit der countta-Funktion, da es alle Werte zählen kann, die nicht leer sind: Wie viele Artikel / Ausrüstung verkauft den Laden?
excel-counta-3754656
Die Gesamtzahl der vom Geschäft verkauften Artikel beträgt 13.

3. Countblank

das COUNTBLANK Die Funktion zählt die Anzahl der leeren Zellen in einem Zellbereich. Zellen mit Formeln, die leeren Text zurückgeben, werden hier ebenfalls gezählt, aber Zellen mit Nullwerten werden nicht gezählt. Dies ist eine großartige Funktion, um leere Zellen zusammenzufassen, während die Daten analysiert werden.

Das Zusammenfassen der leeren Zellen ist die Voraussetzung für unsere dritte Frage: Welche Produkte sind nicht im Rabattbereich? Wenden wir die Funktion an!
excel-countblamk-6550682

Da ist nur 2 nicht rabattierte Artikel.

4. Countifs-Funktion

Countifs ist eine der am häufigsten verwendeten statistischen Funktionen in Excel. Die ZÄHLENWENN-Funktion wendet eine oder mehrere Bedingungen auf die Zellen im angegebenen Bereich an und gibt nur die Zellen zurück, die alle Bedingungen erfüllen.

  • ZÄHLER (Kriterien_Bereich1, Kriterien1, [Kriterien_Bereich2, Kriterien2]…)
Notiz: Jeder neue Bereich muss dieselbe Anzahl von Zeilen und Spalten haben wie der Kriterien_Bereich1 Streit. Bereiche müssen nicht nebeneinander liegen.
Diese Funktion scheint perfekt, um die vierte Frage zu beantworten: Werden Produkte verkauft, die mehr kosten als 2000 zusammen mit einem Diskontsatz höher als 50%?
Excel-Countifs-8271563
Die Fragen schienen komplex, aber es war sehr einfach, die Antwort in Excel zu finden. Solo 1 Produkt, nämlich, Schuhe, es kostet mehr als 2000 und wird zu einem höheren Diskontsatz verkauft als 20%.
Fabelhaft, Nein? Wir haben bisher einige grundlegende statistische Funktionen in MS Excel analysiert. Dann, Werfen wir einen Blick auf die statistischen Zwischenfunktionen.

Statistische Zwischenfunktionen in Excel

Hier werden wir einige der statistischen Zwischenfunktionen in MS Excel im Zusammenhang mit zentraler Tendenz und Streuung diskutieren. Diese Funktionen sind in unserem Alltag als Analyst sehr nützlich.

5. Durchschnittsfunktion

Die häufigste Funktion, die wir in unserem täglichen Leben gewöhnlich verwenden, ist der Durchschnitt (oder Durchschnitt). Die AVERAGE-Funktion gibt einfach das arithmetische Mittel aller Zellen in einem bestimmten Bereich zurück:

  • DURCHSCHNITT (Nummer 1, [Nummer 2],…)
Aber es gibt einen einfachen Nachteil bei der Verwendung von Durchschnittswerten: sind anfällig für Ausreißer. Deswegen, kann in unserer Analyse ein sehr unrealistisches Bild zeichnen. Lassen Sie uns die durchschnittliche Menge der verkauften Waren herausfinden: verstreut
excel-avg-6923148
Der Durchschnitt ist ~ 365,2. Wir werden auch ähnliche Berechnungen für die Kosten durchführen.
Durchschnitt-7471306

6. Medianfunktion

Das Ausreißerproblem kann mit einer anderen Funktion für die zentrale Tendenz gelöst werden: der Median. Die Medianfunktion gibt den Mittelwert des angegebenen Zellbereichs zurück. Die Syntax ist ganz einfach:

  • MEDIAN (Nummer 1, [Nummer 2],…)
Lassen Sie uns die durchschnittliche Anzahl der in unserem Sportgeschäft verkauften Produkte ermitteln und sehen, wie nahe sie an unserem Durchschnittswert liegt:
Excel-Median-7966583
Wir sehen, dass der Median ~ . ist 320, was ziemlich nahe am Durchschnittswert liegt. Das bedeutet, dass unsere Daten nicht viel schwanken. Mal sehen, ob das bei den Warenkosten der Fall ist:
Median-3867810
Die Median- und Durchschnittskosten jedes Artikels variieren stark. Zum Beispiel, Die Kosten für einen Ball betragen 50 aber eine Fledermaus kostet 2000, was zu einer hohen Dispersion führt.

7. Modusfunktion

Für Zahlenwerte, Mittelwert und Median sind in der Regel ausreichend, aber was ist mit kategorialen Werten?? Hier, der Modus betritt die Szene. Der Modus gibt den häufigsten und wiederholten Wert im angegebenen Wertebereich zurück:

  • MODE.SNGL (Nummer 1,[Nummer 2],…)
Notiz: MODE.SNGL gibt nur einen Wert zurück, während MODE.MULT ein Array der gebräuchlichsten Werte zurückgibt.

Gut, das ist einfach. Finden wir den häufigsten Rabattwert des Sportgeschäfts:

Excel-Modus-5221583
Dieser Rabattwert beträgt 10%.

8. Standardabweichungsfunktion

Die Standardabweichung ist eine der Möglichkeiten, die Streuung zu quantifizieren. Es ist ein Maß für die Streuung der Werte des Mittelwertes.

Hier, Wir verwenden die Funktion STDEV.P, die verwendet wird, um die Standardabweichung basierend auf der gesamten als Argument angegebenen Grundgesamtheit zu berechnen:

  • STABW.P (Nummer 1,[Nummer 2],…)
Notiz: Die Funktion STDEV.P geht davon aus, dass ihre Argumente die gesamte Population sind. Wenn dies nicht der Fall ist, Sie können die STDEV.S-Funktion verwenden ().
Für eine große Stichprobengröße, die Standardabweichung der Grundgesamtheit und der Stichproben ergibt ungefähr ähnliche Werte. Vorher, wir haben den Mittelwert und Median berechnet, um eine Vorstellung von der zentralen Tendenz zu bekommen. Lassen Sie uns die Standardabweichung herausfinden, um den Grad der Streuung zu sehen:
excel-stdev-5719843stdev-5699933
Wie erwartet, die Standardabweichung der verkauften Menge ist kleiner, was bedeutet, dass die Streuung kleiner ist, während die Standardabweichung der Produktkosten hoch ist.

9. Quartilfunktionen

Dies ist eine weitere Funktion mit zahlreichen Anwendungen in der Industrie.. Hilft uns, die Bevölkerung in Gruppen einzuteilen. QUARTILES.INC gibt das Quartil eines Datensatzes zurück, basierend auf Perzentilwerten von 0 ein 1, inklusive.

Zum Beispiel, Sie können diese Funktion verwenden, um die 25% Spitze Ihres Kundenstamms.

  • CUARTIL.INC (Hauptquartier, Zimmer)

10. Korrelationsfunktion

Die CORREL-Funktion () es ist mein persönlicher Favorit. Bietet wirklich aussagekräftige Informationen, die mit bloßem Auge nicht zu erkennen sind. das KORREL Die Funktion gibt den Korrelationskoeffizienten von zwei Zellbereichen zurück. Aber was ist das?? Grundsätzlich, sagt uns, wie stark die Beziehung zwischen den beiden Variablen ist.

Notiz: Zeigt keine Ursache-Wirkungs-Beziehung.

Der Korrelationswertebereich liegt zwischen -1 Ja 1.

Kommen wir zu unserer letzten und interessantesten Frage: Besteht ein Zusammenhang zwischen der verkauften Warenmenge und dem Rabattprozentsatz??

excel-korrel-3765448

Gut, die Korrelation ist ~ 0.8, was ziemlich hoch ist. Diese scheinen positiv verwandt zu sein, was bedeutet mehr rabatt, mehr verkaufte Menge.

Abschließende Anmerkungen

In diesem Artikel, wir analysieren mehr als 10 Statistikfunktionen für Anfänger und Fortgeschrittene in MS Excel, von einfacher Zählung () bis zum fortgeschrittenen Lauf (). Statistik ist eines der wichtigsten Werkzeuge in einem Analysten-Kit und Sie können viele Ihrer statistischen Ziele einfach mit Excel erreichen..

Ich empfehle, dass Sie sich die folgenden zusätzlichen Ressourcen in Excel ansehen:

Ich werde in Zukunft erweiterte statistische Funktionen behandeln.. Teilen Sie mir einige Ihrer bevorzugten statistischen Funktionen mit und ich werde versuchen, sie in meine nächsten Artikel zu integrieren..

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.