Concorso Kaggle | Elenco dei problemi di Kaggle

Contenuti

introduzione

Ho le competenze necessarie per partecipare alle gare di Kaggle?

Hai mai affrontato questa domanda?? almeno l'ho fatto, quando ero al secondo anno, quando temevo Kaggle solo immaginando il livello di difficoltà che offriva. Questa paura era simile alla mia paura dell'acqua. La mia paura dell'acqua non mi ha permesso di prendere lezioni di nuoto. tuttavia, dopo ho imparato: “Fino al momento in cui non calpesti l'acqua, non vedi quanto è profondo?”. Una filosofia simile si applica a Kaggle. Non concludere finché non lo provi!!

kaggle-logo-trasparente-300-1024x465-5658914

Kaggle, la casa della scienza dei dati, fornisce una piattaforma globale per le competenze, soluzioni per clienti e banca del lavoro. Ecco lo screenshot di Kaggle, queste competizioni non ti fanno solo pensare fuori dagli schemi, offrono anche un interessante premio in denaro.

tuttavia, le persone esitano a partecipare a questi concorsi. Alcuni dei motivi principali sono elencati di seguito:

  1. Guardano dall'alto in basso il tuo livello di abilità, conoscenze e tecniche acquisite.
  2. Indipendentemente dal tuo livello di abilità, scegli il problema che offre il premio in denaro più alto.
  3. Non riescono a confondere il loro livello di abilità con il livello di difficoltà del problema.

Penso che questo problema derivi dallo stesso Kaggle. Kaggle.com non fornisce alcuna informazione che possa aiutare le persone a scegliere il problema più appropriato che corrisponde alle loro competenze.. Di conseguenza, è diventato un lavoro ingrato per i principianti / gli intermedi decidono qual è il problema giusto da cui iniziare.

Cosa imparerai in questo articolo?

In questo articolo, abbiamo aperto la situazione di stallo per scegliere il problema di kaggle appropriato in base al tuo set di abilità, strumenti e tecniche. Qui, abbiamo illustrato ogni problema di Kaggle con il livello di difficoltà e il livello di abilità necessarie per risolverlo.

Nell'ultima parte, abbiamo definito l'approccio corretto per affrontare un problema di kaggle per i seguenti casi:

Caso 1: ho esperienza di programmazione, ma sono nuovo nell'apprendimento automatico.

Caso 2: Sono stato nel settore dell'analisi per oltre 2 anni, ma non mi sento a mio agio con R / Pitone

Caso 3: Sono bravo con la programmazione e l'apprendimento automatico, Ho bisogno di qualcosa di impegnativo su cui lavorare

Caso 4: Sono un principiante sia dell'apprendimento automatico che del linguaggio di programmazione, Ma voglio imparare

Elenco dei problemi di Kaggle

1. Titanic: apprendimento automatico dai disastri

obbiettivo: Un classico problema popolare per iniziare il tuo viaggio con l'apprendimento automatico. Ti viene data una serie di attributi dei passeggeri a bordo e devi prevedere chi sarebbe sopravvissuto dopo l'affondamento della nave.

titanico-4547234

Livello di difficoltà

un) Capacità di apprendimento automatico: facile

B) Abilità di programmazione: facile

C) Acquisisci abilità di maestria: facile

D) Tutorial disponibili – Molto completo

2. Primo passo con Julia

obbiettivo: Questo è un problema per identificare i caratteri nell'immagine di Google Street View utilizzando uno strumento imminente, Giulia.

julia-5605648

Livello di difficoltà in ciascuno degli attributi:

un) Capacità di apprendimento automatico: facile

B) Abilità di programmazione – Metà

C) Acquisisci abilità di maestria: facile

D) Tutorial disponibile – Completo

3. Riconoscitore di cifre

obbiettivo: Ti viene dato un dato con pixel in cifre scritte a mano e devi dire in modo conclusivo di quale cifra si tratta. Questo è un problema classico per il modello di Markov latente.

Livello di difficoltà in ciascuno degli attributi:

un) Capacità di apprendimento automatico: metà

B) Abilità di programmazione – Metà

C) Acquisisci abilità di maestria: facile

D) Tutorial disponibile: disponibile ma senza impugnatura

4. Sacchetto di parole con sacchetto di popcorn

obbiettivo: Ti viene data una serie di recensioni di film e devi trovare il sentimento nascosto in questa affermazione. Lo scopo di questa dichiarazione del problema è presentarti il ​​pacchetto Google – Parola2Vec.

È un pacchetto fantastico che ti aiuta a convertire le parole in uno spazio dimensionale finito. In questo modo possiamo costruire analogie semplicemente guardando il vettore. Un esempio molto semplice è che il tuo algoritmo può generare analogie come: Rey – Uomo + La donna ti darà la regina.

popcorn-3400048

Livello di difficoltà in ciascuno degli attributi:

un) Capacità di apprendimento automatico – Duro

B) Abilità di programmazione – Metà

C) Acquisisci abilità di maestria: facile

D) Tutorial disponibile – Disponibile ma senza impugnatura

5. Rimozione rumore documenti sporchi

obbiettivo: Potresti avere familiarità con una tecnologia nota come OCR. Converti semplicemente documenti scritti a mano in documenti digitali. tuttavia, Non è perfetto. Il tuo compito qui è utilizzare l'apprendimento automatico per renderlo perfetto..

documenti-3979703

Livello di difficoltà in ciascuno degli attributi:

un) Capacità di apprendimento automatico – Duro

B) Abilità di programmazione – Duro

C) Acquisisci abilità di maestria: duro

D) Tutorial disponibile – No

6. Classificazione criminale di San Francisco

obbiettivo: Prevedi la categoria dei crimini che si sono verificati nella città della baia.

san-francisco-4992579

Livello di difficoltà in ciascuno degli attributi:

un) Capacità di apprendimento automatico: molto difficile

B) Abilità di programmazione: molto difficile

C) Acquisisci abilità di maestria: duro

D) Tutorial disponibile – No

7. Tempo metereologico / posizione di previsione della traiettoria del taxi

obbiettivo: Ci sono due problemi basati sugli stessi set di dati. Ti viene fornito un tassista e dovresti prevedere dove sta andando il taxi o quanto tempo impiegherà per completare il viaggio.

taxi-1-6609405

Livello di difficoltà in ciascuno degli attributi:

un) Capacità di apprendimento automatico: facile

B) Abilità di programmazione – Duro

C) Acquisisci abilità di maestria: metà

D) Tutorial disponibile: alcuni codici di riferimento disponibili

8. Reclutamento Facebook: umano il bot

obbiettivo: Se hai problemi a capire un nuovo dominio, deve risolvere questo. Ti vengono forniti i dettagli dell'offerta e sei tenuto a classificare l'offerente come bot o umano. Questo ha la più ricca fonte di dati disponibile di tutti i problemi in Kaggle.

fb-7912754

Livello di difficoltà in ciascuno degli attributi:

un) Capacità di apprendimento automatico: metà

B) Abilità di programmazione – Metà

C) Acquisisci abilità di maestria: metà

D) Tutorial disponibile: nessun supporto disponibile in quanto è un concorso di reclutamento

Nota: Non ho trattato i concorsi Kaggle che offrono premi in denaro in questo articolo., poiché sono tutti relativi a un dominio specifico. Fatemi sapere i vostri pensieri su di loro nella sezione commenti qui sotto..

Ora cercheremo l'approccio giusto per le persone che hanno diversi set di abilità nelle diverse fasi della vita per iniziare il loro viaggio in Kaggle!!

Caso 1: ho esperienza di programmazione, ma sono nuovo nell'apprendimento automatico.

passo 1: Il primo problema di Kaggle che devi affrontare è: Previsione della traiettoria del taxi. Il motivo è che il problema ha un set di dati complesso che include un formato JSON in una delle colonne che indica l'insieme di coordinate che il taxi ha visitato. Se riesci a scomporlo, ottenere una stima iniziale sul target o sul tempo target non richiede l'apprendimento automatico. Perciò, puoi usare la tua forza di codifica per trovare il tuo valore in questo settore.

passo 2: Il tuo prossimo passo dovrebbe essere quello di prendere: Titanic. Il motivo è che ormai capirai come gestire set di dati complessi. Perciò, ora è il momento perfetto per provare a risolvere problemi di puro apprendimento automatico. Con abbondanza di soluzioni / script disponibili, sarà in grado di costruire una buona soluzione.

passo 3: Ora sei pronto per qualcosa di grande. Prova il reclutamento su Facebook. Questo ti aiuterà ad apprezzare come la comprensione del dominio può aiutarti a ottenere il massimo dal machine learning..

Una volta che hai tutti questi pezzi a posto, puoi testare qualsiasi problema su Kaggle.

Caso 2: Sono stato nel settore dell'analisi per oltre 2 anni, ma non mi sento a mio agio con R / Pitone

passo 1: Dovresti iniziare scattando una foto sul Titanic. Il motivo è che sai già come costruire un algoritmo predittivo. Ora dovresti sforzarti di imparare linguaggi come R e Python. Con un gran numero di soluzioni / script disponibili, sarai in grado di costruire diversi tipi di modelli sia in R che in Python. Questo problema ti aiuterà anche a capire alcuni algoritmi avanzati di apprendimento automatico.

passo 2: Il prossimo passo dovrebbe essere il reclutamento su Facebook. Il motivo è che, data la semplicità della struttura dei dati e la ricchezza dei contenuti, sarai in grado di unire tabelle corrette e creare un algoritmo predittivo su questo. Questo ti aiuterà anche ad apprezzare come la comprensione del dominio può aiutarti a ottenere il massimo dal machine learning..

Suggerimenti: Ora sei pronto per qualcosa di molto diverso dalla tua zona di comfort.. Leggi problemi come lo screening della retinopatia diabetica, Clic su Avinto Context Ads, Classificazione dei reati e trova il dominio di tuo interesse. Ora prova ad applicare ciò che hai imparato finora.

Ora è il momento di provare qualcosa di più complesso da codificare. Prova a prevedere la traiettoria del taxi o a eliminare il rumore dai documenti sporchi. Una volta che hai tutti questi pezzi a posto, ora puoi provare qualsiasi problema in Kaggle.

Caso 3: Sono bravo con la programmazione e l'apprendimento automatico, Ho bisogno di qualcosa di impegnativo su cui lavorare

passo 1: Hai molte opzioni in Kaggle. La prima opzione è padroneggiare una nuova lingua come Julia. Puoi iniziare con Primo passo con Julia. Il motivo è che questo ti darà ulteriore visibilità su ciò che Julia può fare oltre a Python o R.

passo 2: La seconda opzione è sviluppare abilità con ulteriore padronanza. Puoi provare Avito Context, Ricerca pertinenza su Facebook – Umano contro. bot.

Caso 4: Sono un principiante sia dell'apprendimento automatico che del linguaggio di programmazione, Ma voglio imparare

passo 1: Dovresti iniziare il tuo viaggio kaggle con Titanic. Il motivo è che il primo passo per te è imparare linguaggi come R e Python. Con un gran numero di soluzioni / script disponibili, sarai in grado di costruire diversi tipi di modelli sia in R che in Python. Questo problema ti aiuterà anche a capire alcuni algoritmi di apprendimento automatico.

passo 2: Allora dovrei prendere: Reclutamento Facebook. Il motivo è che, data la semplicità della struttura dei dati e la ricchezza dei contenuti, sarai in grado di unire tabelle corrette e creare un algoritmo predittivo su questo. Questo ti aiuterà anche ad apprezzare come la comprensione del dominio può aiutarti a ottenere il massimo dal machine learning..

Una volta che hai finito con questi, può affrontare i problemi in base al tuo interesse.

Pochi trucchi per essere una concorrenza leale in Kaggle

Questo non è un elenco completo di hack, ma è pensato per farti iniziare bene. L'elenco completo merita un nuovo post da solo:

  1. Assicurati di inviare una soluzione (anche l'invio del campione farà questo lavoro) prima dell'ultima data di registrazione, se vuoi partecipare al concorso in futuro.
  2. Comprendi il dominio prima di passare ai dati. Ad esempio, in bot contro umano, devi capire come funziona la piattaforma di offerta online prima di iniziare il viaggio con i dati.
  3. Crea il tuo algoritmo di valutazione in grado di imitare il punteggio del test Kaggle. Una semplice convalida incrociata di 10 i tempi generalmente funzionano bene.
  4. Cerca di estrarre quante più caratteristiche possibili dai dati del treno; l'ingegneria delle funzionalità è di solito la parte che ti spinge dal percentile 40 sopra percentile 10 superiore.
  5. Generalmente, un solo modello non lo posiziona in alto 10. Devi fare molti modelli e assemblarli. Possono essere più modelli con diversi algoritmi o diversi insiemi di variabili.

Note finali

Ci sono molti vantaggi che ho capito dopo aver lavorato sui problemi di Kaggle. ho imparato R / Python in movimento. Penso che sia il modo migliore per imparare lo stesso. Cosa c'è di più, interagire con le persone del forum di discussione su vari problemi ti aiuterà a ottenere uno scoop più approfondito sull'apprendimento e la padronanza delle macchine.

In questo articolo, Illustriamo vari problemi di Kaggle e classifichiamo i suoi attributi essenziali in base al livello di difficoltà. Abbiamo anche affrontato vari casi di vita reale e ottenuto l'approccio giusto per essere coinvolti in Kaggle.

Sei stato coinvolto in qualche problema di Kaggle?? Hai visto un beneficio significativo nel fare lo stesso?? Fateci sapere i vostri pensieri su questa guida nella sezione commenti qui sotto..

Se ti piace quello che hai appena letto e vuoi continuare a imparare l'analisi, iscriviti alle nostre email, Seguici su Twitter o come il nostro pagina Facebook.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.