Empfehlungssystem: die Grundlagen verstehen

Einführung

In diesem Blog, Ich werde verschiedene Dinge über das Empfehlungssystem besprechen, Wie ist das Empfehlungssystem?? Was sind Ihre Anwendungsfälle? Wie viele Arten von Empfehlungssystemen und Metriken werden dafür verwendet.

Im Bild oben von Amazon, Sie haben diese Seite vielleicht schon oft gesehen, wenn Sie versucht haben, etwas bei Amazon zu kaufen. Dies sind die Empfehlungen des Produkts, das Sie kaufen möchten, und Sie werden überrascht sein, dass die 35% des Umsatzes von Amazon stammt aus diesen Empfehlungs-Engines. Jetzt haben Sie vielleicht die Leistungsfähigkeit der Empfehlungsmaschine bemerkt. Heutzutage, alle kleinen und großen Unternehmen verwenden eine Empfehlungsmaschine. Also lass mich das jetzt besprechen.

Was ist das Empfehlungssystem?

Ein Empfehlungssystem ist eine Unterklasse von Informationsfiltersystemen, die versucht, die Bewertung oder Präferenz, die ein Benutzer einem Beitrag geben könnte, vorherzusagen. In einfachen Worten, ist ein Algorithmus, der Benutzern relevante Elemente vorschlägt. Als Beispiel: im Fall von Netflix, Welcher Film soll ich sehen, im Falle des elektronischen Geschäftsverkehrs, Welches Produkt kaufen, oder bei kindle, welches buch soll ich lesen, etc.

Anwendungsfälle des Empfehlungssystems

Es gibt viele Anwendungsfälle. Einige sind

EIN. Personalisierte Inhalte: Hilft, die Website-Erfahrung zu verbessern, indem dynamische Empfehlungen für verschiedene Arten von Zielgruppen erstellt werden, wie es Netflix tut.

B. Bessere Produktsuche: Hilft, das Produkt anhand seiner Eigenschaften zu kategorisieren. Als Beispiel: Material, Jahreszeit, etc.

ARTEN VON EMPFEHLUNGSSYSTEMEN

1. Inhaltsbasierte Filterung

Bei dieser Art von Empfehlungssystem, relevante Artikel werden mit dem Inhalt von Artikeln angezeigt, die zuvor von Benutzern gesucht wurden. Hier bezieht sich der Inhalt auf das Attribut / Etikett des Produkts, das dem Benutzer gefällt. Bei dieser Art von System, Produkte werden mit bestimmten Schlüsselwörtern markiert, später versucht das System zu verstehen, was der Benutzer will und durchsucht seine Datenbank und versucht schließlich, verschiedene Produkte zu empfehlen, die der Benutzer möchte.

Nehmen wir ein Beispiel für das Filmempfehlungssystem, bei dem jeder Film seinen Genres zugeordnet ist, was im vorigen Fall als Etikett bezeichnet wird / Attribute. Nehmen wir nun an, dass Benutzer A kommt und das System zunächst keine Daten über Benutzer A hat. daher zunächst, das System versucht, den Benutzern beliebte Filme zu empfehlen, oder das System versucht, Informationen vom Benutzer zu erhalten, indem es ein vom Benutzer ausgefülltes Formular erhält. Nach einer Weile, Benutzer könnten einigen der Filme eine Bewertung gegeben haben, da es Filmen, die auf dem Action-Genre basieren, eine gute Bewertung und Filmen, die auf dem Anime-Genre basieren, eine schlechte Bewertung gibt. Daher empfiehlt das System hier den Nutzern Actionfilme. Aber hier kann nicht gesagt werden, dass der Benutzer Animationsfilme nicht mag, weil der Benutzer diesen Film vielleicht aus anderen Gründen wie Schauspielerei oder Geschichte nicht mag, aber eigentlich magst du Animationsfilme und benötigst unter diesen Umständen mehr Daten.

Vorteil

Das Modell benötigt keine Daten von anderen Benutzern, da die Empfehlungen für einen einzelnen Benutzer spezifisch sind.
Erleichtert die Skalierung für eine große Anzahl von Benutzern.
Das Modell kann die spezifischen Interessen des Nutzers erfassen und Artikel empfehlen, die nur sehr wenige Nutzer interessieren..

Nachteil

Die Darstellung von Artikelmerkmalen wird zum Teil von Hand entworfen, Diese Technologie erfordert viel Domänenwissen.
Das Modell kann nur Empfehlungen basierend auf dem bestehenden Interesse eines Benutzers abgeben. Mit anderen Worten, das Modell hat eine begrenzte Fähigkeit, die bestehenden Interessen des Benutzers zu erweitern.

2. Zusammenarbeitsbasierte Filterung

Das Empfehlen neuer Artikel an Benutzer basierend auf dem Interesse und den Vorlieben anderer ähnlicher Benutzer ist einfach eine Filterung basierend auf Zusammenarbeit. Als Beispiel: – Wenn wir bei Amazon kaufen, empfiehlt neue Produkte, die sagen “Der Kunde, der das mitgebracht hat, hat auch mitgebracht” Wie nachfolgend dargestellt.

Dies überwindet die Kehrseite der inhaltsbasierten Filterung, da Benutzerinteraktion anstelle des Inhalts von Elementen verwendet wird, die von Benutzern verwendet werden. Dafür, Sie brauchen nur die historische Leistung der Benutzer. Basierend auf historischen Daten, unter der Annahme, dass der Benutzer, der in der Vergangenheit zugestimmt hat, tendenziell auch in Zukunft zustimmt.

Es gibt 2 Arten der kollaborativen Filterung: –

EIN. Kollaborative benutzerbasierte Filterung

Die Bewertung des Beitrags erfolgt anhand der Bewertung benachbarter Nutzer. Knapp, basiert auf dem Begriff der Benutzerähnlichkeit.

Sehen wir uns ein Beispiel an. Auf der linken Seite, Sie können ein Bild sehen, wo 3 Kinder namens A, B, C ja 4 Früchte, Mit anderen Worten, Trauben, Erdbeere, Wassermelone und Orange, beziehungsweise.

Basierend auf dem Bild, Angenommen, A kaufte die 4 Früchte, B kaufte nur Erdbeere und C kaufte Erdbeere und Wassermelone. Hier ein & C sind ähnliche Benutzertypen, da C Trauben und Orange empfohlen werden, wie auf der gestrichelten Linie gezeigt.

B. Kollaboratives Filtern basierend auf Elementen

Die Bewertung des Artikels wird anhand der eigenen Bewertung des Benutzers für benachbarte Artikel vorhergesagt. In einfachen Worten, basiert auf dem Konzept der Artikelähnlichkeit.

Sehen wir uns ein Beispiel an, wie es zuvor über Benutzer und Elemente gesagt wurde. Hier ist der einzige Unterschied, dass wir ähnliche Beiträge sehen, keine ähnlichen Benutzer, als ob du trauben und wassermelonen siehst, Sie werden feststellen, dass die Wassermelone von allen gekauft wird, aber die Trauben werden von den Kindern A und B gekauft. Deswegen, Kinder C sind empfehlenswerte Trauben.

Jetzt, nachdem ich beides verstanden habe, Sie fragen sich vielleicht, welches Sie wann verwenden sollen. Dies ist die Antwort, wenn die Anzahl der Elemente größer ist als die Anzahl der Benutzer, da es die Rechenleistung reduziert und wenn die Anzahl der Benutzer größer ist als die Anzahl der Elemente, Wählen Sie kollaborative artikelbasierte Filterung. . Als Beispiel, Amazon hat Hunderte Millionen von Posts auf den Markt, aber es hat Hunderte von Millionen von Kunden. Deswegen, Amazon verwendet kollaborative artikelbasierte Filterung aufgrund weniger Nein. von Produkten im Vergleich zu Ihren Kunden.

Vorteil

Funktioniert gut, auch wenn die Daten klein sind.
Dieses Modell hilft Benutzern, ein neues Interesse an einem bestimmten Beitrag zu entdecken., aber es ist möglich, dass das Modell es trotzdem empfiehlt, weil ähnliche Benutzer an diesem Beitrag interessiert sind.
Keine Domänenkenntnisse erforderlich

Nachteil

Es kann keine neuen Elemente verarbeiten, da das Modell nicht mit den neu hinzugefügten Elementen in der Datenbank trainiert. Dieses Problem wird als Kaltstartproblem bezeichnet..
Sekundäre Eigenschaft Nicht sehr relevant. Hier, sekundäre Merkmale können der Name des Schauspielers oder das Erscheinungsjahr im Rahmen der Filmempfehlung sein.

AUSWERTUNGSMETRIKEN

Wie wir verschiedene Arten von Empfehlungssystemen diskutiert haben, seine Vor- und Nachteile, aber wie können wir untersuchen, ob das gegebene Modell die richtigen Dinge empfiehlt oder nicht und wie viele relevante Dinge dieses System vorhersagt und hier kommen die Bewertungsmetriken. Es gibt mehrere Metriken, um das Modell zu untersuchen, aber hier werden wir diskutieren 4 Hauptkennzahlen.

1. Durchschnitt Durchschnittliche Genauigkeit in K

Geben Sie an, wie relevant die Liste der empfohlenen Elemente ist. Hier bedeutet die Genauigkeit in K empfohlene Items in den wichtigsten k-Mengen, die relevant sind..

2. Abdeckung

Dies ist der Prozentsatz der Elemente im Trainingsdatenmodell, die in Testsätzen empfohlen werden können. Oder einfach, den Prozentsatz, den ein durchführbares Empfehlungssystem vorhersagen kann.

3. Personalisierung

Einfach, es geht darum, wie viele der gleichen Artikel das Modell verschiedenen Benutzern empfiehlt. Oder der Unterschied zwischen Nutzerlisten und Empfehlungen.

4. Intralistische Ähnlichkeit

Es ist eine Ähnlichkeit des durchschnittlichen Kosinus aller Elemente in einer Liste von Empfehlungen.

FAZIT

In diesem Blog wurden viele Themen rund um Empfehlungsmaschinen behandelt, z. B. was sie sind und ihre Anwendungsfälle. Abgesehen davon, verschiedene Arten von Empfehlungssystemen wie Content-based Filtering und Collaboration-based Filtering und Collaborative Filtering sowie User-based sowie Item-based mit ihren Beispielen, Vorteile und Nachteile, und schließlich die Bewertungsmetriken zur Untersuchung des Modells.

Die in diesem Beitrag gezeigten Medien sind nicht Eigentum von DataPeaker und werden nach Ermessen des Autors verwendet.