Was ist Predictive Analytics?? Ein Einführungsleitfaden

Inhalt

Dieser Artikel wurde im Rahmen der Data Science Blogathon

Einführung

Statistiken, maschinelles Lernen, mathematische Modellierung und künstliche Intelligenz sind bekannt als prädiktive Analytik. Mit Hilfe vergangener Daten, macht Vorhersagen. Wir verwenden Predictive Analytics in unserem Alltag, ohne viel darüber nachzudenken. Zum Beispiel, den Verkauf eines Artikels vorhersagen (zum Beispiel, flores) auf einem Markt für einen bestimmten Tag. Wenn Valentinstag ist, Rosenverkauf wäre hoch! Wir können leicht sagen, dass der Blumenverkauf an Feiertagen höher wäre als an normalen Tagen.

In Predictive Analytics, Wir finden die verantwortlichen Faktoren, wir sammeln daten, Wir wenden maschinelle Lerntechniken an, Data-Mining, prädiktive Modellierung und andere analytische Techniken zur Vorhersage der Zukunft. Dateneinblicke beinhalten Muster, die Beziehung zwischen verschiedenen Faktoren, die zuvor möglicherweise unbekannt waren. Dieses verborgene Wissen zu enträtseln ist mehr wert, als Sie denken. Unternehmen nutzen Predictive Analytics, um ihre Prozesse zu verbessern und ihre Ziele zu erreichen. Informationen aus strukturierten und unstrukturierten Daten können für Predictive Analytics verwendet werden.

Wie Datenstatistiken helfen?

In den vergangenen Jahren, Organisationen haben sich dafür entschieden, große Datenmengen zu sammeln unter der Annahme, dass, wenn sie eine ausreichende Menge sammeln, führt schließlich zu relevanten Geschäftsinformationen. Sogar Instagram und Facebook liefern Informationen zu Geschäftskonten. Aber, Daten in ihrer Rohform sind nutzlos, egal wie groß. Je mehr Daten zu analysieren sind, schwieriger ist es, wertvolle Geschäftsinformationen von irrelevanten zu trennen. Eine Data-Insight-Strategie baut auf dem wahren Potenzial der Daten auf, Sie müssen zunächst feststellen, warum Sie sie verwenden und welchen Geschäftswert Sie von ihnen erwarten. Dann, erklärt, wie man aus den Daten wertvolle Informationen gewinnt und wie man diese nutzt.

1. Definition der Problemstellung / Unternehmensziel.

Definieren Sie die Projektergebnisse, Die Leistungen, der Umfang der Bemühungen, Geschäftsziele, Erstellung eines Fragebogens für die zu erhebenden Daten basierend auf dem Geschäftsziel.

2. Datenerhebung basierend auf den Antworten auf die Fragen, die basierend auf der Problemstellung erstellt wurden.

Basierend auf dem Fragebogen, Antworten als Datensätze sammeln.

3. Integrieren Sie Daten aus mehreren Quellen.

Data Mining für Predictive Analytics bereitet Daten aus mehreren Quellen für die Analyse auf. Dies bietet einen umfassenden Überblick über die Kundeninteraktionen.

4. Datenanalyse mit Tools / Analysesoftware. Wir können die Daten visualisieren, um Muster und Beziehungen zwischen verschiedenen Faktoren zu beobachten.

Datenanalyse ist der Prozess der Inspektion, Aufräumen, transformieren und modellieren Sie Daten, um nützliche Informationen zu entdecken, um eine Schlussfolgerung zu ziehen.

5. Annahmen validieren, Hypothesen aufstellen und mit statistischen Modellen testen.

Statistische Analyse ermöglicht die Validierung der Annahmen, Hypothesen aufstellen und mit statistischen Modellen testen. Die Annahmen basieren auf der Problemstellung, gebildet während der EDA.

6. Generierung von Modellen

Das Modell wird mit Algorithmen generiert, um den Prozess mit den neuen Daten in Kombination mit den vorhandenen Daten zu automatisieren. Für bessere Ergebnisse können auch mehrere Modelle kombiniert werden.

7. Implementieren Sie das Modell, um Vorhersagen zu generieren und seine Genauigkeit zu überwachen.

Die Implementierung des Vorhersagemodells bietet die Möglichkeit, die Analyseergebnisse in den täglichen Entscheidungsprozess zu implementieren, um Ergebnisse zu erhalten, Berichte und Ausgaben durch Automatisierung modellierungsbasierter Entscheidungen.

Was ist mehr, Wir verwalten und überwachen die Leistung des Modells, um sicherzustellen, dass es die erwarteten Ergebnisse liefert.

prädiktive Analytik

Falsche oder unvollständige Daten können zu schlechten Modellen und Genauigkeit führen und Chaos verursachen. Aus diesem Grund ist es äußerst wichtig, über einen adäquaten Datensatz zu verfügen, um Informationen zu erhalten und das Modell zu trainieren.. Predictive Analytics hat seine eigenen Herausforderungen, aber es kann zu unschätzbaren Geschäftsergebnissen führen, einschließlich Kundenakquise vor der Abreise, Optimierung des Handelsbudgets und Befriedigung der Kundennachfrage.

Modelle und Algorithmen

Verschiedene Domänentechniken, einschließlich maschinellem Lernen, Data-Mining, die Statistiken, Analyse und Modellierung, werden in Predictive Analytics verwendet. Vorhersagealgorithmen lassen sich grob in zwei Gruppen einteilen: Machine-Learning-Modelle und Deep-Learning-Modelle. Einige davon werden in diesem Artikel beschrieben. Obwohl sie ihre eigenen Vor- und Nachteile haben, ein großes Verdienst von allen ist, dass sie wiederverwendbar sind und mit Algorithmen mit spezifischen Regeln des Unternehmens trainiert werden können. Predictive Analytics ist ein iterativer Prozess, der das Sammeln beinhaltet, Vorverarbeitung, Modellieren und Implementieren von Daten, um Ergebnisse zu erzielen. Wir können den Prozess automatisieren, um uns basierend auf den neuen Daten, die im Laufe der Zeit regelmäßig zugeführt werden, neue Vorhersagen zu liefern..

Sobald ein Modell trainiert ist, Wir können neue Daten eingeben, um Vorhersagen zu erhalten und müssen nicht immer wieder trainieren, aber ein Nachteil ist, dass es viele Daten braucht, um trainiert zu werden. Da Predictive Analytics auf maschinellen Lernalgorithmen basiert, erfordert eine korrekte Klassifizierung der Daten auf den Etiketten, was, andererseits, würde zu schlechter Leistung und Genauigkeit führen. Generalisierung ist ein Problem, da das Modell wenig Kapazität hat, seine Ergebnisse von einem Fall auf einen anderen zu übertragen. Obwohl es einige Anwendbarkeitsprobleme gibt, wenn es um Erkenntnisse geht, die aus einem Predictive-Analytics-Modell abgeleitet wurden, kann mit bestimmten Methoden gelöst werden, wie Transferlernen.

Predictive Analytics-Modelle

  1. Klassifizierungsmodell

Es ist eines der einfachsten Modelle. Klassifizieren Sie neue Daten basierend auf dem, was Sie aus historischen Daten gelernt haben. Sie eignen sich am besten für die binäre Klassifizierung bei der Beantwortung binärer Fragen wie Ja / Nein, Wahr / Gefälscht, Sie können aber auch für die Mehrklassenklassifizierung verwendet werden. Entscheidungsbäume, Support Vector Machines sind einige Klassifikationsalgorithmen.

P.ej. : Die Kreditgenehmigung ist ein klassischer Anwendungsfall eines Klassifizierungsmodells. Ein weiteres Beispiel sind die Nachrichten / Spam-Erkennungs-E-Mails.

789891_sxautv4lcotjlxxc8q3kyw-9160995
  1. Clustering-Modell

Ein Clustering-Modell klassifiziert Datenpunkte in Gruppen basierend auf der Ähnlichkeit der Attribute. Es gibt viele Clustering-Algorithmen, aber kein Algorithmus kann für alle Anwendungsfälle als der beste angesehen werden. Es ist ein unüberwachter Lernalgorithmus, im Gegensatz zur überwachten Klassifizierung.

Zum Beispiel: Gruppieren Sie Schüler einer Schule nach ihrem Standort in einer Stadt für Transportdienste. Gruppieren Sie Kunden basierend auf ihren Artikelpräferenzen, um Produkte zu empfehlen, die ihren Interessen entsprechen.

  1. Prognosemodell

Als eines der am weitesten verbreiteten Predictive Analytics-Modelle, beschäftigt sich mit der Vorhersage von metrischen Werten, Schätzen eines numerischen Wertes für neue Daten basierend auf den Erkenntnissen aus historischen Daten. Kann angewendet werden, wenn numerische Daten verfügbar sind.

Nicht .: Vorhersage des Verkehrs auf der Hauptstraße einer Stadt zu verschiedenen Zeiten. Geschäfte, die die Verfügbarkeit von Produkten in ihrem Lager schätzen.

  1. Ausreißermodell

Wie der Name schon sagt, verlässt sich auf anomale Dateneinträge in Ihrem Datensatz. Ein Ausreißer könnte ein Dateneingabefehler sein, Messfehler, Fehler experimentell, absichtlich, Datenverarbeitungsfehler, Stichprobenfehler oder natürlicher Fehler. Obwohl Ausreißer zu schlechter Leistung und Genauigkeit führen können, einige helfen uns, Neues zu finden oder neue Schlussfolgerungen zu beobachten.

Nicht .: Kreditkartendiebstahl / Schuld.

945300_r9u16eecszhpjh4o_-460x324-5522126
  1. Zeitreihenmodell

Es kann für jede beliebige Folge von Datenpunkten mit einer Zeitperiode als Eingabeparameter verwendet werden. Verwenden Sie vergangene Daten, um eine numerische Metrik zu entwickeln und zukünftige Daten anhand dieser Metrik vorherzusagen.

Nicht .: Wettervorhersage, Aktienmarkt / Kryptowährungspreisvorhersage.

Einige gängige Vorhersagealgorithmen sind Random Forests, verallgemeinertes lineares Modell, verstärktes Verlaufsmuster, Gruppierung von K-Mitteln und Prophet. Der Random Forest ist eine Kombination von Entscheidungsbäumen, in dem sie versuchen, den kleinstmöglichen Fehler zu erzielen, indem sie die Technik von “embolsado” Ö “Impuls”. Das generalisierte lineare Modell ist eine komplexere Variante des allgemeinen linearen Modells, die sehr schnell trainiert. Die Antwortvariable kann jede Form einer exponentiellen Verteilung aufweisen, die ein klares Verständnis dafür bietet, wie die Prädiktoren das Ergebnis beeinflussen..

Obwohl sie gegen Überanpassung resistent sind, erfordern einen großen Datensatz für das Training und sind anfällig für Ausreißer. Das Gradient Boosted Model ist ein Vorhersagemodell, das auf einer Reihe von Entscheidungsbäumen basiert. Im Gegensatz zu zufälligen Wäldern, Bauen Sie einen Baum nach dem anderen und korrigieren Sie frühere Fehler, während Sie einen neuen Baum erstellen. K-Means ist nützlich, wenn Sie einen benutzerdefinierten Plan für einen großen Datensatz implementieren möchten. Wird beim Gruppieren von Modellen verwendet. Der Prophet ist ein Algorithmus, der in Zeitreihen und Prognosemodellen verwendet wird. Es ist nicht nur automatisch, enthält auch nützliche Heuristiken und Annahmen. Es ist beliebt, weil es schnell ist, zuverlässig und robust.

Einige dich

Predictive Analytics hat wie gesagt bereits viele Anwendungen in verschiedenen Domänen. Um ein paar zu nennen,

  1. Gesundheitsvorsorge
  2. Sammlungsanalyse
  3. Entdeckung eines Betruges
  4. Risikomanagement
  5. Direktmarketing
  6. Cruz-

Dann, Wie genau helfen sie in Ihren Domains? Wir erhalten Benachrichtigungen, wenn wir uns von einem neuen Gerät aus bei unserem Gmail-Konto anmelden. Wir erhalten Benachrichtigungen, wenn wir unsere Kreditkarten verwenden / Abbuchung an neuen Orten. Wie erkennen sie es? Mit Predictive Analytics, Betrugsprüfer nehmen einige Sätze vorbestimmter Variablen, von denen bekannt ist, dass sie an vergangenen Betrugsereignissen beteiligt sind, und setzen diese Variablen in Prozesse ein, um die Wahrscheinlichkeit zu bestimmen, dass zukünftige Ergebnisse oder Ereignisse Betrug sind oder nicht. Angenommen, Sie verwenden Ihre Kreditkarten regelmäßig in Kerala, Wenn Ihre Kreditkarte in Neu-Delhi verwendet wird, ist dies ein möglicher Betrugsfall. Die Commonwealth Bank verwendet Analysen, um die Wahrscheinlichkeit betrügerischer Aktivitäten für eine bestimmte Transaktion vorherzusagen, bevor diese autorisiert wird., innerhalb des 40 Millisekunden nach dem Start der Transaktion.

Zusätzlich zur Aufdeckung von Schadensbetrug, die Krankenversicherungsbranche unternimmt Schritte, um Patienten mit dem höchsten Risiko für chronische Krankheiten zu identifizieren und die besten Interventionen zu finden. Express-Skripte, ein großes Pharmaunternehmen, verwendet Tests, um diejenigen zu identifizieren, die sich nicht an die vorgeschriebenen Behandlungen halten, was zu erheblichen Einsparungen führt. Predictive Analytics-Apps analysieren Ausgaben, Nutzung und sonstiges Kundenverhalten, Dies führt zu einem effizienten Cross-Selling oder Verkauf zusätzlicher Produkte an bestehende Kunden für ein Unternehmen, das mehrere Produkte anbietet.

Über den Autor

ich bin keerthana, ein Student der Datenwissenschaften, der von Mathematik und ihren Anwendungen in anderen Bereichen fasziniert ist. Ich bin auch daran interessiert, Artikel zu Mathematik und Data Science zu schreiben.. Du kannst dich mit mir verbinden unter LinkedIn Ja Instagram. Schauen Sie sich meine anderen Artikel an hier.

Die in diesem Artikel gezeigten Medien sind nicht Eigentum von DataPeaker und werden nach Ermessen des Autors verwendet.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.