introduzione
Ho le competenze necessarie per partecipare alle gare di Kaggle?
Hai mai affrontato questa domanda?? almeno l'ho fatto, quando ero al secondo anno, quando temevo Kaggle solo immaginando il livello di difficoltà che offriva. Questa paura era simile alla mia paura dell'acqua. La mia paura dell'acqua non mi ha permesso di prendere lezioni di nuoto. tuttavia, dopo ho imparato: “Fino al momento in cui non calpesti l'acqua, non vedi quanto è profondo?”. Una filosofia simile si applica a Kaggle. Non concludere finché non lo provi!!
Kaggle, la casa della scienza dei dati, fornisce una piattaforma globale per le competenze, soluzioni per clienti e banca del lavoro. Ecco lo screenshot di Kaggle, queste competizioni non ti fanno solo pensare fuori dagli schemi, offrono anche un interessante premio in denaro.
tuttavia, le persone esitano a partecipare a questi concorsi. Alcuni dei motivi principali sono elencati di seguito:
- Guardano dall'alto in basso il tuo livello di abilità, conoscenze e tecniche acquisite.
- Indipendentemente dal tuo livello di abilità, scegli il problema che offre il premio in denaro più alto.
- Non riescono a confondere il loro livello di abilità con il livello di difficoltà del problema.
Penso che questo problema derivi dallo stesso Kaggle. Kaggle.com non fornisce alcuna informazione che possa aiutare le persone a scegliere il problema più appropriato che corrisponde alle loro competenze.. Di conseguenza, è diventato un lavoro ingrato per i principianti / gli intermedi decidono qual è il problema giusto da cui iniziare.
Cosa imparerai in questo articolo?
In questo articolo, abbiamo aperto la situazione di stallo per scegliere il problema di kaggle appropriato in base al tuo set di abilità, strumenti e tecniche. Qui, abbiamo illustrato ogni problema di Kaggle con il livello di difficoltà e il livello di abilità necessarie per risolverlo.
Nell'ultima parte, abbiamo definito l'approccio corretto per affrontare un problema di kaggle per i seguenti casi:
Caso 1: ho esperienza di programmazione, ma sono nuovo nell'apprendimento automatico.
Elenco dei problemi di Kaggle
1. Titanic: apprendimento automatico dai disastri
obbiettivo: Un classico problema popolare per iniziare il tuo viaggio con l'apprendimento automatico. Ti viene data una serie di attributi dei passeggeri a bordo e devi prevedere chi sarebbe sopravvissuto dopo l'affondamento della nave.
Livello di difficoltà
un) Capacità di apprendimento automatico: facile
B) Abilità di programmazione: facile
C) Acquisisci abilità di maestria: facile
D) Tutorial disponibili – Molto completo
2. Primo passo con Julia
obbiettivo: Questo è un problema per identificare i caratteri nell'immagine di Google Street View utilizzando uno strumento imminente, Giulia.
Livello di difficoltà in ciascuno degli attributi:
un) Capacità di apprendimento automatico: facile
B) Abilità di programmazione – Metà
C) Acquisisci abilità di maestria: facile
D) Tutorial disponibile – Completo
3. Riconoscitore di cifre
obbiettivo: Ti viene dato un dato con pixel in cifre scritte a mano e devi dire in modo conclusivo di quale cifra si tratta. Questo è un problema classico per il modello di Markov latente.
Livello di difficoltà in ciascuno degli attributi:
un) Capacità di apprendimento automatico: metà
B) Abilità di programmazione – Metà
C) Acquisisci abilità di maestria: facile
D) Tutorial disponibile: disponibile ma senza impugnatura
4. Sacchetto di parole con sacchetto di popcorn
obbiettivo: Ti viene data una serie di recensioni di film e devi trovare il sentimento nascosto in questa affermazione. Lo scopo di questa dichiarazione del problema è presentarti il pacchetto Google – Parola2Vec.
Es un paquete fantástico que le ayuda a convertir palabras en un espacio de dimensione"Dimensione" È un termine che viene utilizzato in varie discipline, come la fisica, Matematica e filosofia. Si riferisce alla misura in cui un oggetto o un fenomeno può essere analizzato o descritto. In fisica, ad esempio, Si parla di dimensioni spaziali e temporali, mentre in matematica può riferirsi al numero di coordinate necessarie per rappresentare uno spazio. Comprenderlo è fondamentale per lo studio e... finita. In questo modo possiamo costruire analogie semplicemente guardando il vettore. Un esempio molto semplice è che il tuo algoritmo può generare analogie come: Rey – Uomo + La donna ti darà la regina.
Livello di difficoltà in ciascuno degli attributi:
un) Capacità di apprendimento automatico – Duro
B) Abilità di programmazione – Metà
C) Acquisisci abilità di maestria: facile
D) Tutorial disponibile – Disponibile ma senza impugnatura
5. Rimozione rumore documenti sporchi
obbiettivo: Potresti avere familiarità con una tecnologia nota come OCR. Converti semplicemente documenti scritti a mano in documenti digitali. tuttavia, Non è perfetto. Il tuo compito qui è utilizzare l'apprendimento automatico per renderlo perfetto..
Livello di difficoltà in ciascuno degli attributi:
un) Capacità di apprendimento automatico – Duro
B) Abilità di programmazione – Duro
C) Acquisisci abilità di maestria: duro
D) Tutorial disponibile – No
6. Classificazione criminale di San Francisco
obbiettivo: Prevedi la categoria dei crimini che si sono verificati nella città della baia.
Livello di difficoltà in ciascuno degli attributi:
un) Capacità di apprendimento automatico: molto difficile
B) Abilità di programmazione: molto difficile
C) Acquisisci abilità di maestria: duro
D) Tutorial disponibile – No
7. Tempo metereologico / posizione di previsione della traiettoria del taxi
obbiettivo: Ci sono due problemi basati sugli stessi set di dati. Ti viene fornito un tassista e dovresti prevedere dove sta andando il taxi o quanto tempo impiegherà per completare il viaggio.
Livello di difficoltà in ciascuno degli attributi:
un) Capacità di apprendimento automatico: facile
B) Abilità di programmazione – Duro
C) Acquisisci abilità di maestria: metà
D) Tutorial disponibile: alcuni codici di riferimento disponibili
8. Reclutamento Facebook: umano il bot
obbiettivo: Se hai problemi a capire un nuovo dominio, deve risolvere questo. Ti vengono forniti i dettagli dell'offerta e sei tenuto a classificare l'offerente come bot o umano. Esta tiene la Origine datiUN "Origine dati" si riferisce a qualsiasi luogo o supporto in cui è possibile ottenere informazioni. Queste fonti possono essere sia primarie che, come sondaggi ed esperimenti, come secondario, come banche dati, articoli accademici o rapporti statistici. La scelta corretta di una fonte di dati è fondamentale per garantire la validità e l'affidabilità delle informazioni nella ricerca e nell'analisi.... más rica disponible de todos los problemas en Kaggle.
Livello di difficoltà in ciascuno degli attributi:
un) Capacità di apprendimento automatico: metà
B) Abilità di programmazione – Metà
C) Acquisisci abilità di maestria: metà
D) Tutorial disponibile: nessun supporto disponibile in quanto è un concorso di reclutamento
Nota: Non ho trattato i concorsi Kaggle che offrono premi in denaro in questo articolo., poiché sono tutti relativi a un dominio specifico. Fatemi sapere i vostri pensieri su di loro nella sezione commenti qui sotto..
Ora cercheremo l'approccio giusto per le persone che hanno diversi set di abilità nelle diverse fasi della vita per iniziare il loro viaggio in Kaggle!!
Caso 1: ho esperienza di programmazione, ma sono nuovo nell'apprendimento automatico.
passo 1: Il primo problema di Kaggle che devi affrontare è: Previsione della traiettoria del taxi. La razón es que el problema tiene un conjunto de datos complejo que incluye un formato JSONJSON, o Notazione degli oggetti JavaScript, Si tratta di un formato di scambio dati leggero e facile da leggere e scrivere per gli esseri umani, e facile da analizzare e generare per le macchine. Viene comunemente utilizzato nelle applicazioni Web per inviare e ricevere informazioni tra un server e un client. La sua struttura si basa su coppie chiave-valore, rendendolo versatile e ampiamente adottato nello sviluppo di software.. en una de las columnas que indica el conjunto de coordenadas que ha visitado el taxi. Se riesci a scomporlo, ottenere una stima iniziale sul target o sul tempo target non richiede l'apprendimento automatico. Perciò, puoi usare la tua forza di codifica per trovare il tuo valore in questo settore.
passo 2: Il tuo prossimo passo dovrebbe essere quello di prendere: Titanic. Il motivo è che ormai capirai come gestire set di dati complessi. Perciò, ora è il momento perfetto per provare a risolvere problemi di puro apprendimento automatico. Con abbondanza di soluzioni / script disponibili, sarà in grado di costruire una buona soluzione.
passo 3: Ora sei pronto per qualcosa di grande. Prova il reclutamento su Facebook. Questo ti aiuterà ad apprezzare come la comprensione del dominio può aiutarti a ottenere il massimo dal machine learning..
Una volta che hai tutti questi pezzi a posto, puoi testare qualsiasi problema su Kaggle.
Caso 2: Sono stato nel settore dell'analisi per oltre 2 anni, ma non mi sento a mio agio con R / Pitone
passo 1: Dovresti iniziare scattando una foto sul Titanic. Il motivo è che sai già come costruire un algoritmo predittivo. Ora dovresti sforzarti di imparare linguaggi come R e Python. Con un gran numero di soluzioni / script disponibili, sarai in grado di costruire diversi tipi di modelli sia in R che in Python. Questo problema ti aiuterà anche a capire alcuni algoritmi avanzati di apprendimento automatico.
passo 2: Il prossimo passo dovrebbe essere il reclutamento su Facebook. Il motivo è che, data la semplicità della struttura dei dati e la ricchezza dei contenuti, sarai in grado di unire tabelle corrette e creare un algoritmo predittivo su questo. Questo ti aiuterà anche ad apprezzare come la comprensione del dominio può aiutarti a ottenere il massimo dal machine learning..
Suggerimenti: Ora sei pronto per qualcosa di molto diverso dalla tua zona di comfort.. Leggi problemi come lo screening della retinopatia diabetica, Clic su Avinto Context Ads, Classificazione dei reati e trova il dominio di tuo interesse. Ora prova ad applicare ciò che hai imparato finora.
Ora è il momento di provare qualcosa di più complesso da codificare. Prova a prevedere la traiettoria del taxi o a eliminare il rumore dai documenti sporchi. Una volta che hai tutti questi pezzi a posto, ora puoi provare qualsiasi problema in Kaggle.
Caso 3: Sono bravo con la programmazione e l'apprendimento automatico, Ho bisogno di qualcosa di impegnativo su cui lavorare
passo 1: Hai molte opzioni in Kaggle. La prima opzione è padroneggiare una nuova lingua come Julia. Puoi iniziare con Primo passo con Julia. Il motivo è che questo ti darà ulteriore visibilità su ciò che Julia può fare oltre a Python o R.
passo 2: La seconda opzione è sviluppare abilità con ulteriore padronanza. Puoi provare Avito Context, Ricerca pertinenza su Facebook – Umano contro. bot.
Caso 4: Sono un principiante sia dell'apprendimento automatico che del linguaggio di programmazione, Ma voglio imparare
passo 1: Dovresti iniziare il tuo viaggio kaggle con Titanic. Il motivo è che il primo passo per te è imparare linguaggi come R e Python. Con un gran numero di soluzioni / script disponibili, sarai in grado di costruire diversi tipi di modelli sia in R che in Python. Questo problema ti aiuterà anche a capire alcuni algoritmi di apprendimento automatico.
passo 2: Allora dovrei prendere: Reclutamento Facebook. Il motivo è che, data la semplicità della struttura dei dati e la ricchezza dei contenuti, sarai in grado di unire tabelle corrette e creare un algoritmo predittivo su questo. Questo ti aiuterà anche ad apprezzare come la comprensione del dominio può aiutarti a ottenere il massimo dal machine learning..
Una volta che hai finito con questi, può affrontare i problemi in base al tuo interesse.
Pochi trucchi per essere una concorrenza leale in Kaggle
Questo non è un elenco completo di hack, ma è pensato per farti iniziare bene. L'elenco completo merita un nuovo post da solo:
- Assicurati di inviare una soluzione (anche l'invio del campione farà questo lavoro) prima dell'ultima data di registrazione, se vuoi partecipare al concorso in futuro.
- Comprendi il dominio prima di passare ai dati. Ad esempio, in bot contro umano, devi capire come funziona la piattaforma di offerta online prima di iniziare il viaggio con i dati.
- Crea il tuo algoritmo di valutazione in grado di imitare il punteggio del test Kaggle. Una semplice convalida incrociata di 10 i tempi generalmente funzionano bene.
- Cerca di estrarre quante più caratteristiche possibili dai dati del treno; l'ingegneria delle funzionalità è di solito la parte che ti spinge dal percentile 40 sopra percentile 10 superiore.
- Generalmente, un solo modello non lo posiziona in alto 10. Devi fare molti modelli e assemblarli. Possono essere più modelli con diversi algoritmi o diversi insiemi di variabili.
Note finali
Ci sono molti vantaggi che ho capito dopo aver lavorato sui problemi di Kaggle. ho imparato R / Python in movimento. Penso che sia il modo migliore per imparare lo stesso. Cosa c'è di più, interagire con le persone del forum di discussione su vari problemi ti aiuterà a ottenere uno scoop più approfondito sull'apprendimento e la padronanza delle macchine.
In questo articolo, Illustriamo vari problemi di Kaggle e classifichiamo i suoi attributi essenziali in base al livello di difficoltà. Abbiamo anche affrontato vari casi di vita reale e ottenuto l'approccio giusto per essere coinvolti in Kaggle.
Sei stato coinvolto in qualche problema di Kaggle?? Hai visto un beneficio significativo nel fare lo stesso?? Fateci sapere i vostri pensieri su questa guida nella sezione commenti qui sotto..