Python-Wortwolke | So erstellen Sie Word Cloud in Python?

Teilen auf Facebook
Teilen auf twittern
Teilen auf verlinktin
Teilen auf Telegramm
Teilen auf WhatsApp

Inhalt

Wortwolken erwiesen sich als revolutionäre Visualisierungstechnik zum Verständnis und zur Bestimmung sich entwickelnder Muster und Trends.. Ob es darum geht, die politischen Agenden der aufstrebenden Wahlkandidaten eines Landes zu entdecken oder Kundenmeinungen zu dem kürzlich eingeführten Produkt zu analysieren, eine visuelle Darstellung kann durch Verfolgen der Wortwolke erhalten werden.

In den folgenden Zeilen, Wir werden etwas über Wortwolken lernen, Ihre Anwendungen und wie man sie in Python erstellt.

Einführung

Word Cloud oder Tag Clouds ist eine Textanzeigetechnik, die nativ verwendet wird, um die Tags oder Schlüsselwörter von Websites anzuzeigen. Wie gewöhnlich, Diese Schlüsselwörter sind einzelne Wörter, die den Kontext der Webseite darstellen, aus der die Wortwolke erstellt wird. Diese Wörter werden zu einer Wortwolke zusammengefasst..

Jedes Wort in dieser Wortwolke hat eine variable Schriftgröße und einen variablen Farbton. Deswegen, diese Darstellung hilft, hervorgehobene Wörter zu bestimmen. Eine größere Schriftgröße eines Wortes zeigt seine Hervorhebung relativ zu anderen Wörtern in der Gruppe. Word Cloud kann je nach Vision der Ersteller in verschiedenen Formen und Größen erstellt werden. Die Anzahl der Wörter spielt eine wichtige Rolle bei der Erstellung einer Wortwolke. Mehr Wörter bedeuten nicht immer eine bessere Wortwolke, da es chaotisch und schwer zu lesen wird. Eine Wortwolke sollte immer semantisch aussagekräftig sein und darstellen, wofür sie gedacht ist..

Selbst wenn, Es gibt verschiedene Möglichkeiten, wie Wortwolken erstellt werden können, Der am häufigsten verwendete Typ ist jedoch die Verwendung Worthäufigkeit in unserem Korpus. Und so, Wir werden unsere Wortwolke mit dem Häufigkeitstyp erstellen.

33978Wortwolke-679937_1280-3645359

Geschichte

Die Geschichte der Wortwolken reicht bis zurück 1976 als ein amerikanischer Sozialpsychologe Stanley Milgram eine psychologische Studie durchführte und Leute nach den Orten in Paris befragte. Die Hauptidee war, eine mentale Karte von Paris zu erstellen, wenn Leute nach der Stadt gefragt wurden. Analysierte und zeichnete eine Karte basierend auf den Antworten von Personen und behielt eine größere Schriftgröße für häufig erhaltene Antworten bei.

Tag Clouds rückten ins Rampenlicht, als Flickr, eine Foto-Sharing-Website, In 2006 begann mit der Verwendung von Tag-Clouds für die Website-Navigation. Am Ende des ersten Jahrzehnts des 21. Jahrhunderts, Word Cloud wurde zu einem sehr beliebten Tool unter Textminern.

Aber, der Tag Cloud-Trend schwächelt weiter und, Schließlich, begann mit der Zeit abzunehmen. Und so, Wortwolken werden in der heutigen Welt häufig verwendet.

63368word20vs20tag20trend-4852295
Word Cloud vs. Tag Cloud Trend von Google Trends (Quelle – Persönlicher Computer)

Anwendungen

Word Cloud findet seinen Weg in zahlreiche Anwendungen in mehreren Domänen. Einige der beliebtesten Anwendungen von Word Clouds sind:

1. Kundenkommentare

Wortwolken werden von Stakeholdern aus allen Branchen häufig verwendet, um Feedback von Endbenutzern zu analysieren. Angenommen, ein Unternehmen bringt ein Produkt auf den Markt und möchte das Feedback von Kunden wissen.. Nehmen wir an, das Unternehmen erhielt 1000 Kommentare von verschiedenen Benutzern. Es wäre für interessierte Parteien sehr schwierig, alle Kommentare zu lesen und zur Kenntnis zu nehmen. Deswegen, Word Cloud würde eine Schlüsselrolle dabei spielen, die besten Schlüsselwörter unter den Kommentaren zu finden. Dies würde dem Unternehmen helfen, festzustellen, ob das Feedback positiv oder negativ ist, und die jeweiligen Verbesserungsbereiche zu ermitteln.. Zum Beispiel, ein ABC-Unternehmen’ startete einen neuen Fernseher und, basierend auf erhaltenem Feedback, Das Unternehmen kann in der nächsten TV-Serie entsprechende Änderungen vornehmen.

2. Politische Agenda der Kandidaten

Häufig, Wahlkandidaten führen eine Agenda-Checkliste, über die sie während der Wahlkämpfe sprechen können. Deswegen, Das Kandidatenunterstützungsteam würde die Rede des Kandidaten analysieren und eine Wortwolke erstellen, um Wörter für die nächste Rede auszuwählen, um ein Gleichgewicht auf der Agenda-Checkliste zu wahren. Analysten erstellen oft eine Wortwolke aus den Reden von Kandidaten verschiedener Parteien, um sie zu analysieren und Ergebnisse zu erzielen, damit die Leute wissen, welcher Kandidat sich auf welche Bereiche der Improvisation konzentriert.. Zum Beispiel, bei der US-Wahl 2021, Analysten konnten leicht auf die Wortwolken der Reden der Kandidaten der Republikanischen Partei und der Demokratischen Partei zugreifen, damit die Menschen entscheiden konnten.

3. Aktuelle Probleme

Werbeagenturen müssten oft wissen, was die Trends sind, um die nächste Anzeige im Kontext der Trendthemen zu erstellen.. Zum Beispiel, Amul erstellt eine kreative Anzeige basierend auf dem aktuellen Thema oder Trend.

So erstellen Sie eine Wortwolke in Python

Eine Wortwolke kann in Python in den folgenden Schritten erstellt werden:

1. Importieren Sie die erforderlichen Bibliotheken

Importieren Sie die folgenden Bibliotheken, die zum Erstellen einer Wortwolke erforderlich sind

Importieren Sie Pandas als pd importieren Sie matplotlib.pyplot als plt aus wordcloud importieren Sie WordCloud

2. Auswählen des Datensatzes

Für dieses Beispiel, wir verwenden Popular Dataset Die besten Spiele im Google Play Store de Kaggle.

Laden Sie das Dataset herunter und speichern Sie es in Ihrem aktuellen Arbeitsverzeichnis, um eine reibungslose Codebereitstellung zu ermöglichen..

Importieren Sie den Datensatz in eine Variable Ihrer Wahl. Hier werden unsere Daten in variable df.

Text der Wortwolke muss nicht aus einem Dataset stammen. Um mit weniger Aufwand aussagekräftigen Text zu erhalten, Wir verwenden den Datensatz für unser Beispiel.

df = pd.read_csv("Android-Spiele.csv")

3. Auswählen von Text und Textmenge für Word Cloud

Das Auswählen von Text zum Erstellen einer Wortwolke ist eine wichtige Aufgabe. Für die Textauswahl müssen mehrere Faktoren überprüft werden, wie zum Beispiel:

  • Haben wir eine Problemstellung??
  • Hat der ausgewählte Text eine Bedeutung?
  • Können wir die erstellte Wortwolke schließen??
  • Hat unser Text eine ausreichende Textmenge??

Word Cloud erfordert Text in ausreichender Menge. Eine große Anzahl von Wörtern würde das optische Erscheinungsbild von Word Cloud behindern und eine kleinere Anzahl von Wörtern wäre nicht sinnvoll.

Wir können die .head-Methode verwenden () von DataFrame, um die Spalten und den darin enthaltenen Datentyp zu überprüfen. In unserem Beispiel, wir haben die Spalte genommen Kategorie als Text.

Da die Spaltenkategorie das Präfix ABSPIELEN vor jedem Kategoriespiel, unsere Wortwolke würde am Ende entstehen ABSPIELEN da das häufigste Wort und die Wortwolke in int keine Bedeutung haben. Deswegen, Wir führen einen Filter durch, während wir die hinzufügen Kategorie Spalte zu Text.

4. Auf NULL-Werte prüfen

Wir müssen in unserem Datensatz nach Nullwerten suchen, seit der Erstellung der Wortwolke, würde keinen Text mit akzeptieren Jaja Werte.

df.isna().Summe()

Wenn unser Datensatz NaN-Werte hätte, fehlende Werte müssen wir entsprechend behandeln. Glücklicherweise, Dieser Datensatz hat keine NaN-Werte, damit wir zum nächsten Schritt gehen können.

Wenn nur sehr wenige NaN-Werte vorhanden sind, Es ist immer ratsam, diese Zeilen zu löschen, da es Word Cloud nicht in größerem Umfang betreffen würde.

4. Text zu einer Variablen hinzufügen

Gemäß den Parametern des Schrittes 3, Fügen Sie die Textdaten einer Variablen Ihrer Wahl hinzu. Hier, Wir fügen die Daten der Variablen hinzu Text.

Text = " ".beitreten(cat.split()[1] für Katze in df.Kategorie)

Da müssen wir die filtern ABSPIELEN der Kategorie, Wir haben den Wert jeder Zeile dividiert und das zweite Element genommen, nämlich, der Name der Kategorie Kategorie Säule.

5. Erstellen der Wortwolke

Erstellen Sie ein Objekt der Klasse WordCloud mit dem Namen Ihrer Wahl und rufen Sie die Methode generate auf (). Hier haben wir das Objekt mit dem Namen erstellt Wortwolke.

WordCloud () nimmt bei Bedarf mehrere Argumente an. Hier fügen wir zwei Argumente hinzu:

1. Kollokationen = Falsch, wodurch die Platzierungswörter des Textes ignoriert werden

2. background_color = „Weiß“, das lässt die Worte klarer erscheinen

Die .generate-Methode () nimmt ein argument aus Text Wir erstellen. In unserem Fall, wir geben die Text Variable als Argument für .generate ().

word_cloud = Wortwolke(Kollokationen = Falsch, background_color="Weiß").generieren(Text)

6. Die Wortwolke verfolgen

Verwendung der .imshow () matplotlib.pyplot-Methode, um die Wortwolke als Bild anzuzeigen.

.imshow () nimmt mehrere Argumente an, aber in unserem Beispiel, Wir nehmen zwei Argumente:

1. Wortwolke im Schritt erstellt 5

2. Interpolation = 'bilinear’

Da wir ein Bild mit .imshow erstellen (), Bild-Resampling wird durchgeführt, weil die Bildpixelgröße und die Bildschirmauflösung nicht übereinstimmen. Dieses Resampling wird durch die gesteuert Interpolation Argument, je nach Bedarf weichere oder schärfere Bilder zu erzeugen. Es stehen mehrere Interpolationsarten zur Verfügung, wie Gauß, quadratisch, bikubisch. Hier verwenden wir binaural Interpolation.

Plotten des Bildes mit ausgeschalteter Achse, da wir keine Achsenmarkierungen auf unserem Bild wollen.

plt.imshow(Wortwolke, interpolation='bilinear')
plt.achse("aus")
plt.zeigen()

7. der komplette Code

#Importieren von Bibliotheken importieren pandas als pd import matplotlib.pyplot as plt %matplotlib inline from wordcloud import WordCloud #Importing Dataset df = pd.read_csv("Android-Spiele.csv")
#Überprüfen der Daten df.head()
#Überprüfen auf NaN-Werte df.isna().Summe()
#Entfernen von NaN-Werten #df.dropna(inplace = wahr)
#Erstellen der Textvariablen text = " ".beitreten(cat.split()[1] für Katze in df.Kategorie)
# Erstellen von word_cloud mit Text als Argument in .generate() Methode word_cloud = WordCloud(Kollokationen = Falsch, background_color="Weiß").generieren(Text)
# Anzeigen der generierten Word Cloud plt.imshow(Wortwolke, interpolation='bilinear')
plt.achse("aus")
plt.zeigen()
711281-8602837

Nube de palabras de Kategorie Säule (Bildquelle – Persönlicher Computer) * El tamaño de la imagen adjunta es independiente del tamaño de la imagen de salida

Auf die gleiche Weise, creemos Word Cloud para Qualifikation columna del conjunto de datos importado.

#Importieren von Bibliotheken importieren pandas als pd import matplotlib.pyplot as plt %matplotlib inline from wordcloud import WordCloud #Importing Dataset df = pd.read_csv("1.csv")

#Überprüfen der Daten df.head()

#Erstellen der Textvariablen text2 = " ".beitreten(Titel für Titel in df.title)

# Erstellen von word_cloud mit Text als Argument in .generate() Methode word_cloud2 = WordCloud(Kollokationen = Falsch, background_color="Weiß").generieren(Text2)

# Anzeigen der generierten Word Cloud plt.imshow(word_cloud2, interpolation='bilinear')

plt.achse("aus")

plt.zeigen()
225102-9751593

Titelspalte Wortwolke (Bildquelle – Persönlicher Computer) * El tamaño de la imagen adjunta es independiente del tamaño de la imagen de salida

Schlussfolgerungen

Zuvor erstellte Wortwolken können durch Hinzufügen erweiterter Funktionen wie Maskierung weiter angepasst werden., Cloud-Konturierung und Größenänderung.

Las nubes de palabras se pueden crear no solo con Python, aber auch mit anderen Tools wie Microsoft Word, herramientas de inteligencia empresarial como Malen. Heutzutage, Es gibt zahlreiche Tools im Internet, die eine Wortwolke erstellen, indem Sie einfach den Eingabetext bereitstellen. Da der Trend zur Wortwolke zunimmt, Auch die Zahl der Formulare und Werkzeuge nimmt zu.

Wortwolke Puede ser engañoso a veces. in einigen Szenarien, Es kann vorkommen, dass viele Wörter in unserer Wortwolke die gleiche Größe haben, daher kann es schwierig sein zu sagen, welches häufiger vorkommt als das andere. Wir können fortgeschrittenere Techniken anwenden, um dem Problem entgegenzuwirken.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.