Wort
Beschreibung
Mahout-Funktionen:
- Mahout bietet ein Framework zum Ausführen von Data-Mining-Aufgaben für große Datenmengen
- Mahout ermöglicht Anwendungen die effiziente und schnelle Analyse großer Datensätze
- Es bietet auch verteilte Fitnessfunktionsfunktionen für die evolutionäre Programmierung..
- Umfasst mehrere MapReduce-fähige Cluster-Implementierungen, como k-means, Fuzzy-K-Mittel, Dirichlet y Mean-Shift
Ein MapReduce-Framework besteht im Allgemeinen aus drei Operationen:
- Karte: jeder Worker-Knoten wendet die Map-Funktion auf lokale Daten an und schreibt die Ausgabe in den temporären Speicher. Ein Masterknoten sorgt dafür, dass nur eine Kopie der redundanten Eingangsdaten verarbeitet wird.
- Mischen: Worker-Knoten verteilen Daten basierend auf Ausgabeschlüsseln neu (erzeugt durch die Kartenfunktion), damit sich alle zu einem Schlüssel gehörenden Daten im selben Worker-Knoten befinden.
- Reduzieren: Worker-Knoten verarbeiten jetzt jede Gruppe von Ausgabedaten, per Schlüssel, parallel zu.
Um mehr über MapReduce zu erfahren, Besuch hier.
Beim Kauf von zwei oder mehr Produkten, die Analyse des Warenkorbs wird durchgeführt, um zu überprüfen, ob der Kauf eines Produkts die Wahrscheinlichkeit erhöht, andere Produkte zu kaufen. Dieses Wissen ist ein Werkzeug für Vermarkter, um Produkte zu gruppieren oder eine Strategie zum Cross-Selling von Produkten an einen Kunden zu entwickeln..
Angenommen, der Gesamtverkauf beträgt 100 $, diese Summe kann in Unterkomponenten unterteilt werden, Mit anderen Worten, 60 $ Basisverkauf, 20 $ Preis, 18 $ kann Verteilung sein und 2 $ kann auf Werbeaktivitäten zurückzuführen sein. Diese Zahlen können mit verschiedenen logischen Methoden erreicht werden. Jede Methode kann zu einem anderen Bruch führen. Deswegen, Es ist sehr wichtig, das Verfahren für die Aufgliederung des Gesamtumsatzes in diese Komponenten zu standardisieren. Diese formale Technik ist offiziell als MMM oder Market Mix Modeling bekannt..
Als Beispiel, wenn Sie die Noten der Schüler einer Klasse haben und fragen, wie gut die Klasse abschneidet. Es wäre irrelevant, die Noten der einzelnen Schüler zu nennen, jedoch, kannst du den Mittelwert der Klasse finden?, wer wird ein Vertreter der Klassenleistung sein.
Um das Mittel zu finden, addiere alle Zahlen und dividiere dann durch die Anzahl der Gegenstände im Set.
Als Beispiel, wenn die Zahlen sind 1, 2, 3, 4, 5, 6, 7, 8, 8, dann wäre das mittel 44/9 = 4,89.
Den Median einer Reihe von Zahlen ermitteln, folgen Sie den unteren Schritten:
- Ordne die Zahlen in aufsteigender oder absteigender Reihenfolge an
- Finden Sie den Mittelwert, was wird n sein / 2 (wobei n die Zahlen der Menge sind)
Ziele von MIS:
- Um die Entscheidungsfindung voranzutreiben, Bereitstellung genauer und aktueller Daten zu einer Reihe von Unternehmensressourcen.
- Korrelieren Sie mehrere Datenpunkte, um Strategien zu entwickeln, um den Betrieb voranzutreiben.
- Microsoft Azure Machine Learning-Studie
- AWS-Maschinelles Lernen
- IBM Watson Machine Learning
- Google Cloud Machine Learning Engine
- BigML
Der Modus kann durch die folgenden Schritte berechnet werden:
- Zählen Sie, wie oft jeder Wert erscheint
- Nimm den Wert, der am häufigsten vorkommt
Lass es uns mit einem Beispiel verstehen:
Angenommen, wir haben einen Datensatz mit 10 Datenpunkte, nachfolgend aufgeführten:
4,5,2,8,4,7,6,4,6,3
Jetzt berechnen wir, wie oft jeder Wert aufgetreten ist.
Wert | Erzählen |
2 | 1 |
3 | 1 |
4 | 3 |
5 | 1 |
6 | 2 |
7 | 1 |
8 | 1 |
Wir sehen also, dass der Wert 4 wiederholt sich am häufigsten, Mit anderen Worten, 3 mal. Dann, der Modus dieses Datensatzes ist 4.
- Explorative Datenanalyse
- Wissenschaftliche Methoden
Einige der Kriterien für die Auswahl des Modells können sein::
- Akaike Informationskriterien (AIC)
- R angepasst2
- Bayessches Informationskriterium (BIC)
- Likelihood-Ratio-Test
Als Beispiel, wenn das Ziel darin besteht, die Qualität eines Produkts vorherzusagen, was ausgezeichnet sein kann, gut, Durchschnitt, regulär, gering. Für diesen Fall, die Variable hat 5 Lektionen, es ist also ein Hindernis für die Klassifizierung von 5 Lektionen.
Als Beispiel, Wir können eine bivariate Analyse der Kombination zweier kontinuierlicher Merkmale durchführen und eine Verbindung zwischen ihnen finden.
Betrachten Sie das Beispiel: für einen bestimmten Satz von Details über die Interessen eines Schülers, vorherige Punktzahl nach Thema, etc., möchten GPA für alle Semester vorhersagen (GPA1, GPA2,….). Diese Problemstellung kann durch multivariate Regression angegangen werden, da wir mehr als eine abhängige Variable haben.