Überblick
- Microsoft Excel ist ein hervorragendes Werkzeug zum Erlernen und Ausführen statistischer Funktionen
- Hier gibt es 12 Statistikfunktionen in Excel, die Sie für eine erfolgreiche Analytics-Karriere beherrschen müssen
Wir werden in Statistik überragen!
“Statistik ist die Grammatik der Wissenschaft”. – Karl Pearson
Machen wir es ein bisschen relevanter für uns: Statistik ist die Grammatik der Datenwissenschaft. Sie werden feststellen, dass fast alle erfolgreichen Data Science- oder Analytics-Profis ein solides Verständnis von Statistik haben., aber bedeutet das, dass Sie einen Master-Abschluss in dem Fach benötigen??
Absolut nicht!
Wir werden uns diesem Artikel mit dem berühmten Pareto-Prinzip nähern: das 80% Konsequenzen kommen von 20% der Ursachen. Deswegen, wir konzentrieren uns hauptsächlich auf die 20% der Konzepte und Funktionen, die nützlich sind 80% Wetter. Jetzt, die frage als analytiker ist, So starten Sie die Implementierung von Statistiken?
Natürlich, Sie können diese Konzepte in Programmiersprachen wie Python und R . implementieren und üben. Aber warte eine Sekunde und denk nach: Was ist das am häufigsten verwendete Tool in den meisten Organisationen??
Es ist Microsoft Excel! Mal ehrlich, Excel ist das Schweizer Taschenmesser für Analytics-Profis, mit dem Sie sich auf das Wesentliche konzentrieren können (Statistik in unserem Fall) und erledigt den Rest der Berechnungen und Anpassungen selbst.
Dieser Artikel richtet sich an alle, die ihre Reise in Richtung Statistik mit Excel beginnen.. wir werden verwenden 10 Wichtige statistische Funktionen in Excel zur Beantwortung von Fragen für ein fiktives Sportunternehmen, Khelo, während wir Ihre Daten prüfen.
Wenn Sie ein Anfänger in der Welt der Analytik und Excel sind, Ich empfehle Ihnen dringend, diese kostenlosen Kurse zu besuchen:
Wie wir diese statistischen Funktionen zuerst in Excel angehen
Ich habe diese statistischen Funktionen in Excel in zwei Kategorien unterteilt:
- Grundlegende statistische Funktionen
- Statistische Zwischenfunktionen
Lasst uns beginnen!
Die Daten verstehen und das Problem stellen
Wir werden einige wichtige Fragen zu unserem fiktiven Sportbekleidungs- und Ausrüstungsunternehmen lösen: Khelo. Das sind die Spalten, die wir haben:
- Team
- Anzahl der verkauften Artikel
- Kosten für jeden Artikel
- % aus
- Einkommen
Im Zuge dieses Artikels, wir werden diese fragen beantworten:
- Wie viele Artikel haben Rabatt?
- Wie viele Artikel / Ausrüstung verkauft den Laden?
- Wie viele Produkte werden ohne Rabatt verkauft??
- Werden Produkte verkauft, die mehr kosten als 2000 zusammen mit einem Diskontsatz höher als 50%?
- Was ist die durchschnittliche Anzahl der verkauften Produkte??
- Wie hoch ist die durchschnittliche Anzahl verkaufter Produkte??
- Was ist der häufigste Rabattprozentsatz?
- Was ist die Standardabweichung der Anzahl der verkauften Produkte??
- Gibt es einen Zusammenhang zwischen der Anzahl der verkauften Produkte und dem Rabattprozentsatz??
Grundlegende statistische Funktionen in Excel
MS Excel bietet eine Vielzahl nützlicher Statistikfunktionen. Beginnen wir mit einigen der grundlegenden, aber äußerst leistungsstarken Funktionen. Mal ehrlich, Sie werden feststellen, dass Sie die grundlegenden statistischen Funktionen auf 90% der Zeit und 10% die restliche Zeit wird von mittleren und fortgeschrittenen Funktionen beansprucht.
Wir werden hier hauptsächlich über die verschiedenen Arten von Zählfunktionen sprechen. Sie sind anderen Funktionen wie Summe sehr ähnlich, maximal, Minimum, Durchschnitt.
1. Zählfunktion
Wir verwenden die Zählfunktion, wenn wir die Anzahl der Zellen zählen müssen, die eine Zahl enthalten. Erinnern NUR ZAHLEN! Sehen wir uns die Funktion an:
- ZÄHLEN (Tapferkeit1, [Wert2],…)
Dann, Versuchen wir, die Antwort auf unsere erste Frage zu finden: Auf wie viele Artikel gab es einen Rabatt?
Es gibt 11 reduzierte Produkte.
2. Zählfunktion
Während die Zählfunktion nur Zahlenwerte zählt, die COUNT-Funktion zählt alle Zellen in einem Bereich, die nicht leer sind. Die Funktion ist nützlich zum Zählen von Zellen, die jede Art von Informationen enthalten, inklusive Fehlerwerten und Leertext.
- ERZÄHLEN (Tapferkeit1, [Wert2],…)
3. Countblank
das COUNTBLANK Die Funktion zählt die Anzahl der leeren Zellen in einem Zellbereich. Zellen mit Formeln, die leeren Text zurückgeben, werden hier ebenfalls gezählt, aber Zellen mit Nullwerten werden nicht gezählt. Dies ist eine großartige Funktion, um leere Zellen zusammenzufassen, während die Daten analysiert werden.
Da ist nur 2 nicht rabattierte Artikel.
4. Countifs-Funktion
Countifs ist eine der am häufigsten verwendeten statistischen Funktionen in Excel. Die ZÄHLENWENN-Funktion wendet eine oder mehrere Bedingungen auf die Zellen im angegebenen Bereich an und gibt nur die Zellen zurück, die alle Bedingungen erfüllen.
- ZÄHLER (Kriterien_Bereich1, Kriterien1, [Kriterien_Bereich2, Kriterien2]…)
Statistische Zwischenfunktionen in Excel
Hier werden wir einige der statistischen Zwischenfunktionen in MS Excel im Zusammenhang mit zentraler Tendenz und Streuung diskutieren. Diese Funktionen sind in unserem Alltag als Analyst sehr nützlich.
5. Durchschnittsfunktion
Die häufigste Funktion, die wir in unserem täglichen Leben gewöhnlich verwenden, ist der Durchschnitt (oder Durchschnitt). Die AVERAGE-Funktion gibt einfach das arithmetische Mittel aller Zellen in einem bestimmten Bereich zurück:
- DURCHSCHNITT (Nummer 1, [Nummer 2],…)
6. Medianfunktion
Das Ausreißerproblem kann mit einer anderen Funktion für die zentrale Tendenz gelöst werden: der Median. Die Medianfunktion gibt den Mittelwert des angegebenen Zellbereichs zurück. Die Syntax ist ganz einfach:
- MEDIAN (Nummer 1, [Nummer 2],…)
7. Modusfunktion
Für Zahlenwerte, Mittelwert und Median sind in der Regel ausreichend, aber was ist mit kategorialen Werten?? Hier, der Modus betritt die Szene. Der Modus gibt den häufigsten und wiederholten Wert im angegebenen Wertebereich zurück:
- MODE.SNGL (Nummer 1,[Nummer 2],…)
Gut, das ist einfach. Finden wir den häufigsten Rabattwert des Sportgeschäfts:
8. Standardabweichungsfunktion
Die Standardabweichung ist eine der Möglichkeiten, die Streuung zu quantifizieren. Es ist ein Maß für die Streuung der Werte des Mittelwertes.
Hier, Wir verwenden die Funktion STDEV.P, die verwendet wird, um die Standardabweichung basierend auf der gesamten als Argument angegebenen Grundgesamtheit zu berechnen:
- STABW.P (Nummer 1,[Nummer 2],…)
Wie erwartet, die Standardabweichung der verkauften Menge ist kleiner, was bedeutet, dass die Streuung kleiner ist, während die Standardabweichung der Produktkosten hoch ist.
9. Quartilfunktionen
Dies ist eine weitere Funktion mit zahlreichen Anwendungen in der Industrie.. Hilft uns, die Bevölkerung in Gruppen einzuteilen. QUARTILES.INC gibt das Quartil eines Datensatzes zurück, basierend auf Perzentilwerten von 0 ein 1, inklusive.
Zum Beispiel, Sie können diese Funktion verwenden, um die 25% Spitze Ihres Kundenstamms.
- CUARTIL.INC (Hauptquartier, Zimmer)
10. Korrelationsfunktion
Die CORREL-Funktion () es ist mein persönlicher Favorit. Bietet wirklich aussagekräftige Informationen, die mit bloßem Auge nicht zu erkennen sind. das KORREL Die Funktion gibt den Korrelationskoeffizienten von zwei Zellbereichen zurück. Aber was ist das?? Grundsätzlich, sagt uns, wie stark die Beziehung zwischen den beiden Variablen ist.
Notiz: Zeigt keine Ursache-Wirkungs-Beziehung.
Der Korrelationswertebereich liegt zwischen -1 Ja 1.
Kommen wir zu unserer letzten und interessantesten Frage: Besteht ein Zusammenhang zwischen der verkauften Warenmenge und dem Rabattprozentsatz??
Gut, die Korrelation ist ~ 0.8, was ziemlich hoch ist. Diese scheinen positiv verwandt zu sein, was bedeutet mehr rabatt, mehr verkaufte Menge.
Abschließende Anmerkungen
In diesem Artikel, wir analysieren mehr als 10 Statistikfunktionen für Anfänger und Fortgeschrittene in MS Excel, von einfacher Zählung () bis zum fortgeschrittenen Lauf (). Statistik ist eines der wichtigsten Werkzeuge in einem Analysten-Kit und Sie können viele Ihrer statistischen Ziele einfach mit Excel erreichen..
Ich empfehle, dass Sie sich die folgenden zusätzlichen Ressourcen in Excel ansehen:
Ich werde in Zukunft erweiterte statistische Funktionen behandeln.. Teilen Sie mir einige Ihrer bevorzugten statistischen Funktionen mit und ich werde versuchen, sie in meine nächsten Artikel zu integrieren..