Le nuvole di parole si sono rivelate una tecnica di visualizzazione rivoluzionaria per comprendere e determinare modelli e tendenze in evoluzione.. Che si tratti di scoprire le agende politiche degli aspiranti candidati elettorali di un paese o di analizzare le opinioni dei clienti sul prodotto lanciato di recente, una rappresentazione visiva può essere ottenuta tracciando la nuvola di parole.
Nelle righe seguenti, impareremo a conoscere le nuvole di parole, le tue applicazioni e come costruirle in python.
introduzione
Word Cloud o Tag Clouds è una tecnica di visualizzazione del testo che viene utilizzata in modo nativo per visualizzare i tag o le parole chiave dei siti Web. Generalmente, queste parole chiave sono singole parole che rappresentano il contesto della pagina web da cui viene creata la nuvola di parole. Queste parole sono raggruppate per formare una nuvola di parole.
Ogni parola in questa nuvola ha una dimensione del carattere e una tonalità di colore variabili. Perciò, questa rappresentazione aiuta a determinare le parole importanti. Una dimensione del carattere più grande di una parola ritrae la sua importanza più in relazione alle altre parole del gruppo. Word Cloud può essere costruito in diverse forme e dimensioni a seconda della visione dei creatori. Il numero di parole gioca un ruolo importante quando si crea una nuvola di parole. Più parole non sempre significano una nuvola di parole migliore, in quanto diventa disordinato e difficile da leggere. Una nuvola di parole deve essere sempre semanticamente significativa e deve rappresentare ciò a cui è destinata.
Sebbene, ci sono diversi modi in cui è possibile creare nuvole di parole, ma il tipo più usato è using Frequenza delle parole nel nostro corpus. E così, creeremo il nostro word cloud utilizzando il tipo di frequenza.
Storia
La storia di Word Clouds risale a 1976 quando uno psicologo sociale americano Stanley Milgram ha condotto uno studio psicologico e ha chiesto alla gente dei luoghi di Parigi. L'idea principale era quella di costruire una mappa mentale di Parigi quando alle persone veniva chiesto della città. Analizzato e mappato in base alle risposte ricevute dalle persone e mantenuto una dimensione del carattere più grande per le risposte ricevute di frequente.
Le nuvole di tag sono diventate sotto i riflettori quando Flickr, un sito di condivisione di foto, Su 2006 iniziato a utilizzare le nuvole di tag per l'esplorazione del sito. Alla fine del primo decennio del 21° secolo, Word Cloud è diventato uno strumento molto popolare tra i minatori di testo.
Ma, La tendenza Tag Cloud continua a vacillare e, Finalmente, ha iniziato a diminuire nel tempo. E così, Le nuvole di parole vengono usate comunemente nel mondo di oggi.
Applicazioni
Word Cloud trova la sua strada in numerose applicazioni su più domini. Alcune delle applicazioni popolari di Word Clouds sono:
1. Commenti del cliente
Le nuvole di parole sono ampiamente utilizzate dalle parti interessate nei settori per analizzare il feedback ricevuto dagli utenti finali. Supponiamo che un'azienda lanci un prodotto e voglia conoscere il feedback dei clienti. Diciamo che l'azienda ha ricevuto 1000 commenti di diversi utenti. Sarebbe molto difficile per le parti interessate leggere e prendere nota di tutti i commenti. Perciò, Word Cloud giocherebbe un ruolo chiave nell'ottenere le migliori parole chiave tra i commenti. Ciò aiuterebbe l'azienda a determinare se il feedback è positivo o negativo e le rispettive aree di miglioramento.. Ad esempio, una "società ABC"’ ha lanciato una nuova TV e, in base ai commenti ricevuti, l'azienda può apportare modifiche di conseguenza nella prossima serie di televisori.
2. Agenda politica dei candidati
Spesso, i candidati alle elezioni mantengono un elenco di controllo dell'agenda con cui parlare durante le campagne. Perciò, il team di supporto del candidato analizzerà il discorso del candidato e creerà una nuvola di parole per selezionare le parole per il discorso successivo per mantenere un equilibrio nell'elenco di controllo dell'agenda. Gli analisti spesso creano una nuvola di parole dei discorsi dei candidati di diversi partiti per analizzare e produrre risultati in modo che le persone sappiano quale candidato si sta concentrando su quali aree di improvvisazione.. Ad esempio, alle elezioni americane del 2021, gli analisti sono stati in grado di accedere facilmente alla parola Nuvole dai discorsi dei candidati del Partito Repubblicano e del Partito Democratico affinché le persone decidessero.
3. Problemi attuali
Le agenzie pubblicitarie avrebbero spesso bisogno di sapere quali sono le tendenze per creare il prossimo annuncio nel contesto degli argomenti di tendenza.. Ad esempio, Amul crea un annuncio creativo basato sul tema o tendenza attuale.
Come creare una nuvola di parole in Python
Puoi creare una nuvola di parole in Python nei seguenti passaggi:
1. Importa le librerie richieste
Importare le seguenti librerie necessarie per creare un word cloud
importa panda come pd importa matplotlib.pyplot come plt da wordcloud importa WordCloud
2. Selezionare il set di dati
Per questo esempio, estamos usando Popular Datasetun "set di dati" o dataset è una raccolta strutturata di informazioni, che può essere utilizzato per l'analisi statistica, Apprendimento automatico o ricerca. I set di dati possono includere variabili numeriche, categorico o testuale, e la loro qualità è fondamentale per ottenere risultati affidabili. Il suo utilizzo si estende a varie discipline, come la medicina, Economia e scienze sociali, facilitare il processo decisionale informato e lo sviluppo di modelli predittivi.... I migliori giochi su Google Play Store de Kaggle.
Scaricare il set di dati e salvarlo nella directory di lavoro corrente per una distribuzione fluida del codice.
Importe el conjunto de datos en una variabileIn statistica e matematica, un "variabile" è un simbolo che rappresenta un valore che può cambiare o variare. Esistono diversi tipi di variabili, e qualitativo, che descrivono caratteristiche non numeriche, e quantitativo, che rappresentano quantità numeriche. Le variabili sono fondamentali negli esperimenti e negli studi, poiché consentono l'analisi delle relazioni e dei modelli tra elementi diversi, facilitare la comprensione di fenomeni complessi.... de su elección. Qui i nostri dati vengono importati in variabile df.
Non è necessario che il testo del cloud di Word provenga da un set di dati. Per ottenere un testo significativo con meno sforzo, Usiamo il set di dati per il nostro esempio.
df = pd.read_csv("Android-giochi.csv")
3. Selezionare la quantità di testo e testo per Word Cloud
La selezione del testo per creare una nuvola di parole è un compito importante. Diversi fattori devono essere verificati per la selezione del testo, come:
- Abbiamo una dichiarazione di problema??
- Il testo selezionato ha significato??
- Possiamo concludere la nuvola di parole creata??
- Il nostro testo ha una quantità adeguata di testo??
Word Cloud richiede testo in una quantità appropriata. Un gran numero di parole ostacolerebbe l'aspetto visivo di Word Cloud e un minor numero di parole non avrebbe senso.
Possiamo usare il metodo .head () di DataFrame per verificare le Colonne e il tipo di dati presenti in esse. Nel nostro esempio, abbiamo preso la colonna categoria come testo.
Poiché la categoria della colonna ha un prefisso di GIOCARE A prima di ogni partita di categoria, la nostra nuvola di parole finirebbe per creare GIOCARE A poiché la parola e Word Cloud più frequenti non avranno significato in int. Perciò, filtreremo aggiungendo il categoria colonna a Testo.
4. Compruebe los valores NULLOIl termine "NULLO" Viene utilizzato nella programmazione e nei database per rappresentare un valore nullo o inesistente. La sua funzione principale è quella di indicare che a una variabile non è assegnato un valore o che un dato non è disponibile. e SQL, ad esempio, Utilizzato per gestire i record che mancano di informazioni in determinate colonne. Comprendere l'uso di "NULLO" È essenziale evitare errori nella manipolazione dei dati e...
I valori null devono essere controllati nel nostro set di dati, da quando ho creato la nuvola di parole, non accetterebbe il testo con yaya valori.
df.isna().somma()
Se il nostro set di dati avesse valori NaN, dobbiamo trattare i valori mancanti di conseguenza. fortunatamente, questo set di dati non ha valori NaN, così possiamo passare al passaggio successivo.
Se ci sono troppo pochi valori di NaN, è sempre consigliabile eliminare quelle righe, ya que no afectaría a Word Cloud en mayor misuraIl "misura" È un concetto fondamentale in diverse discipline, che si riferisce al processo di quantificazione delle caratteristiche o delle grandezze degli oggetti, fenomeni o situazioni. In matematica, Utilizzato per determinare le lunghezze, Aree e volumi, mentre nelle scienze sociali può riferirsi alla valutazione di variabili qualitative e quantitative. L'accuratezza della misurazione è fondamentale per ottenere risultati affidabili e validi in qualsiasi ricerca o applicazione pratica.....
4. Aggiungi testo a una variabile
Según los parametriIl "parametri" sono variabili o criteri che vengono utilizzati per definire, misurare o valutare un fenomeno o un sistema. In vari campi come la statistica, Informatica e Ricerca Scientifica, I parametri sono fondamentali per stabilire norme e standard che guidano l'analisi e l'interpretazione dei dati. La loro corretta selezione e gestione sono fondamentali per ottenere risultati accurati e pertinenti in qualsiasi studio o progetto.... del passo 3, aggiungi i dati di testo a una variabile di tua scelta. Qui, stiamo aggiungendo i dati alla variabile testo.
testo = " ".aderire(cat.split()[1] per gatto in df.category)
Dal momento che abbiamo bisogno di filtrare il GIOCARE A dalla categoria, abbiamo diviso il valore di ogni riga e abbiamo preso il secondo elemento, vale a dire, il nome della categoria del categoria colonna.
5. Creare la nuvola di parole
Crea un oggetto della classe WordCloud con il nome che preferisci e chiama il metodo generate (). Qui abbiamo creato l'oggetto con il nome word_cloud.
WordCloud () prendi vari argomenti secondo necessità. Qui stiamo aggiungendo due argomenti:
1. collocazioni = False, che ignorerà le parole di posizionamento del testo
2. background_color = 'Bianco', che renderà le parole più chiare
Il metodo .generate () prendere un argomento da testo noi creiamo. Nel nostro caso, daremo il testo variabile come argomento per .generate ().
word_cloud = WordCloud(collocazioni = False, background_color="bianco").creare(testo)
6. Tracciando la nuvola di parole
Usando il .imshow () matplotlib.pyplot per visualizzare la nuvola di parole come immagine.
.imshow () accetta diversi argomenti, ma nel nostro esempio, prendiamo due argomenti:
1. word_cloud creato al passo 5
2. interpolazione = 'biliale'’
Dal momento che stiamo creando un'immagine con .imshow (), el remuestreo de la imagen se realiza porque el tamaño de píxel de la imagen y la risoluzioneIl "risoluzione" si riferisce alla capacità di prendere decisioni ferme e raggiungere gli obiettivi prefissati. In contesti personali e professionali, Implica la definizione di obiettivi chiari e lo sviluppo di un piano d'azione per raggiungerli. La risoluzione è fondamentale per la crescita personale e il successo in vari ambiti della vita, In quanto ti permette di superare gli ostacoli e mantenere la concentrazione su ciò che conta davvero.... de la pantalla no coinciden. Questo ricampionamento è controllato con il interpolazione argomento per produrre immagini più uniformi o più nitide in base alle nostre necessità. Sono disponibili diversi tipi di interpolazione, come gaussiano, quadrica, bicubica. Qui stiamo usando binaurale interpolazione.
Tracciare l'immagine con l'asse disattivato, dal momento che non vogliamo i segni degli assi sulla nostra immagine.
plt.imshow(nuvola di parole, interpolazione='bilineare') asse.plt("spento") plt.mostra()
7. El código completo
#Importazione di librerie importa panda come pd importa matplotlib.pyplot come plt %matplotlib inline da wordcloud importa WordCloud #Importing Dataset df = pd.read_csv("Android-giochi.csv") #Controllo dei dati df.head() #Verifica dei valori NaN df.isna().somma() #Rimozione dei valori NaN #df.dropna(al posto = vero) #Creazione della variabile di testo text = " ".aderire(cat.split()[1] per gatto in df.category) # Creazione di word_cloud con testo come argomento in .generate() metodo word_cloud = WordCloud(collocazioni = False, background_color="bianco").creare(testo) # Visualizzare il Word Cloud generato plt.imshow(nuvola di parole, interpolazione='bilineare') asse.plt("spento") plt.mostra()
Nube de palabras de categoria colonna (Fonte immagine – Personal computer) * El tamaño de la imagen adjunta es independiente del tamaño de la imagen de salida
Nello stesso modo, creemos Word Cloud para qualificazione columna del conjunto de datos importado.
#Importazione di librerie importa panda come pd importa matplotlib.pyplot come plt %matplotlib inline da wordcloud importa WordCloud #Importing Dataset df = pd.read_csv("1.csv") #Controllo dei dati df.head() #Creazione della variabile di testo text2 = " ".aderire(titolo per titolo in df.title) # Creazione di word_cloud con testo come argomento in .generate() metodo word_cloud2 = WordCloud(collocazioni = False, background_color="bianco").creare(testo2) # Visualizzare il Word Cloud generato plt.imshow(word_cloud2, interpolazione='bilineare') asse.plt("spento") plt.mostra()
Nuvola di parole della colonna del titolo (Fonte immagine – Personal computer) * El tamaño de la imagen adjunta es independiente del tamaño de la imagen de salida
Conclusioni
Le nuvole di parole create in precedenza possono essere ulteriormente personalizzate aggiungendo funzionalità avanzate come il mascheramento, rimodellamento e ridimensionamento delle nuvole.
Las nubes de palabras se pueden crear no solo con Pitone, ma anche con altri strumenti come Microsoft Word, herramientas de inteligencia empresarial como Quadro. Attualmente, ci sono numerosi strumenti disponibili su Internet che creano una nuvola di parole semplicemente fornendo il testo di input. Dal momento che la tendenza del cloud di parole è in aumento, anche il numero di forme e strumenti è in aumento.
Nuvola di Parole puede ser engañoso a veces. In alcuni scenari, può succedere che molte parole nella nostra nuvola di parole abbiano la stessa dimensione, quindi può essere difficile dire quale di loro è più frequente dell'altro. Possiamo usare tecniche più avanzate per contrastare il problema.