Come ho iniziato a vincere concorsi di scienza dei dati

Contenuti

Panoramica

  • Vincere concorsi di scienza dei dati può essere una procedura complessa, ma può raggiungere la cima 3 se hai un quadro da seguire.
  • Ascolta un esperto di hackathon di data science e come è passato da zero a vincere concorsi di data science

introduzione

Non c'è alternativa all'apprendimento attraverso l'esperienza. Soprattutto nel settore della scienza dei dati!!

Di recente ho vinto il primo premio nella sfida di raccomandazione assicurativa Zimnat di Zindi, un risultato che è al primo posto tra i risultati di tutti i miei concorsi di scienza dei dati di tutti i tempi.

in numeri puri, questo non è stato il mio primo risultato top, ma solo uno dei più di 30 risultati tra 3 i primi che ho avuto nel mio viaggio di competizione nella scienza dei dati. Durante questo periodo di ricominciare da zero e classificarsi ai vertici delle classifiche degli hackathon di machine learning, Ho capito l'importanza di imparare dall'esperienza e non posso sottolineare abbastanza quanto sia importante la citazione di cui sopra.

Vincere un concorso di scienza dei dati è una corsa accidentata. Stai gareggiando contro le migliori menti della scienza dei dati di tutto il mondo!, stai lavorando su un ostacolo di data science che non è stato risolto prima e stai facendo tutto questo con una scadenza difficile per l'avvio!

Ma posso assicurarti che ottenendo il 3 i primi posti in classifica sono assolutamente raggiungibili, se sai cosa stai facendo.

Non vuole essere una pubblicazione tecnica. Riguarda il mio viaggio verso le competizioni di data science. E, Certo, come e perché dovresti iniziare subito. Come principiante, non vorrai certo perderti di leggere questo. I post tecnici appariranno presto per i lettori più avanzati, quindi resta sintonizzato!

Come ho già detto, non c'è modo migliore per imparare la scienza dei dati che farlo. Ti incoraggio a unirti a noi in questo fine settimana prolungato per un hackathon guidato della community in cui esperti di gare di data science ti guideranno attraverso l'intero hackathon LIVE:

E puoi sempre visitare il Piattaforma DataHack per mettere in pratica le tue abilità di data science o partecipare ad hackathon.

Il mio viaggio nella competizione per la scienza dei dati: zero ad esperto

Uno dei nostri professori mi ha introdotto alla scienza dei dati all'inizio del mio terzo semestre al college.. Stava usando l'apprendimento automatico per scoprire pianeti simili alla Terra e l'opportunità di vita extraterrestre..

La curiosità mi ha seguito e mi ha portato a tuffarmi nel famoso corso sull'apprendimento automatico di Andrew Ng. Sono stato introdotto a varie applicazioni dell'apprendimento automatico, come le previsioni del prezzo di borsa e le auto a guida autonoma, per dirne alcuni.

Cercando di più nel motore di ricerca di Google sulle potenziali possibilità in questo campo, Ho scoperto piattaforme come Kaggle e DataPeaker. Ha aggiunto più carburante al mio crescente interesse per la scienza dei dati. La sfida successiva era la costante competizione e il miglioramento contro il tempo e una classifica; sì, Sto parlando di hackathon di scienza dei dati!!

La maggior parte dei principianti con cui ho interagito sente di dover prima imparare i dettagli dell'apprendimento automatico. Solo allora puoi iniziare a competere in Data Science.

È un grosso errore.

“Partecipare a concorsi di data science, hai solo bisogno della spinta per imparare e migliorare costantemente. Otterrai una buona classifica “.

la mia prima gara: La sfida di previsione del malware Microsoft di Kaggle

Permettetemi di parlare velocemente della mia prima competizione seria su Kaggle: Concorso per la previsione di malware Microsoft. Ciò è avvenuto mesi dopo aver fallito in una serie di concorsi di scienza dei dati.. Ma l'esperienza maturata in tutte le competizioni fino a quel momento aveva aiutato.

In solo 2 settimane e con alcune presentazioni in mano, Sono saltato in cima 20 di graduatoria pubblica.

Col passare del tempo, Ho collaborato con uno studente di Singapore, un maestro di Kaggle e due leader del settore londinesi, New York e Pune. Lavorare insieme in diversi fusi orari è stata di per sé una sfida, ma riusciamo a discutere e attuare strategie e modelli giorno e notte in Slack.

e in conclusione, con me che guida la squadra, siamo finiti nel post 25 nella classifica privata. Questo era abbastanza vicino alla nostra classifica di valutazione pubblica di 21. È stato un ottimo risultato, mentre solo 10 squadre tra 100 primi nella graduatoria pubblica hanno potuto mantenere la loro posizione nella graduatoria privata.

Avanti veloce al giorno corrente, Ho finito tra 3 primo in più di 30 hackathon di data science su varie piattaforme. Questo include il numero 1 su quasi tutte le principali piattaforme su cui sono stato. (cosa succede se, due primi posti nella serie JantaHack di DataPeaker).

Questo è un breve riassunto del mio viaggio per conquistare le competenze di data science da zero.. Prossimo, facci capire come puoi, come principiante, inizia a partecipare a concorsi di scienza dei dati.

Come posso iniziare le competizioni di data science se sono un principiante?

Ecco un consiglio che vorrei che qualcuno mi avesse dato quando ho iniziato a competere negli hackathon di scienza dei dati.: partecipa a qualsiasi competizione con cui ti senti a tuo agio. La cosa più importante è che inizi.

L'analisi di Vidhya Janata Hack è una serie di gare per principianti che si tengono ogni settimana. Alla fine, molti vincitori sono anche così gentili da pubblicare le loro soluzioni.

Chiunque abbia appena iniziato dovrebbe essere sicuro di trovare soluzioni vincenti per i precedenti concorsi di scienza dei dati. Quando ti imbatti in una nuova idea o concetto, cercalo nella ricerca su google e prenditi il ​​tempo per capirlo. Se non riesci a trasferire il tuo apprendimento da una competenza all'altra, non hai usato bene il tuo tempo.

Il trasferimento dell'apprendimento è molto importante, dall'apprendimento profondo all'apprendimento.

Come affronto i concorsi di scienza dei dati?

Qui, Ho scritto alcuni suggerimenti chiave a cui dovresti prestare attenzione quando inizi una nuova competenza di scienza dei dati.

  1. Di solito inizio con a semplice modello di riferimento. Basta dare un'occhiata ai dati, quindi creare un modello senza alcuna pulizia dei dati o ingegneria delle funzionalità
  2. Prossimo, diventa il bersaglio comprendere il problema e i dati per creare un buon set di validazione. Una buona suite di convalida è un must. Solo allora puoi fidarti dei tuoi risultati locali. Caso opposto, preparati per una riorganizzazione della classifica privata.
  3. Ingegneria delle caratteristiche è il prossimo passo fondamentale. Le buone caratteristiche differenziano sempre tra un vincitore e un top 100
  4. Mentre la fine della competizione si avvicina, Di solito provo a costruire una gamma di modelli come i modelli con aumento del gradiente, reti neurali, eccetera. Quindi segue lo stacking o la combinazione di questi risultati. Assemblea ti dà il vantaggio di vincere una competizione. Perché, è uno strumento che vorrai sempre avere a portata di mano.
  5. Una cosa di cui molte persone non parlano è l'importanza di a codice base. Il tempo è un fattore molto importante in qualsiasi competizione di data science. Non c'è bisogno di perdere tempo a scrivere gli stessi frammenti da zero più e più volte in più competizioni. Anziché, concentra il tuo tempo prezioso nel fare qualcosa di nuovo e migliore

Quali sono i vantaggi della partecipazione a concorsi di scienza dei dati?

questa è una domanda valida! I concorsi di scienza dei dati richiedono una notevole quantità di tempo, poi, ne valgono la pena? Consentitemi di condividere alcuni vantaggi della mia esperienza in questa sezione.

1. competere e imparare

Impara molto durante le competizioni di scienza dei dati, dalla risoluzione dei problemi alla costruzione di modelli. Se vuoi imparare qualcosa di nuovo, i concorsi sono il modo migliore per farlo. Prossimamente, studierà e sperimenterà molto, e ti ritroverai costantemente alla ricerca di alternative migliori per migliorare il tuo modello.

2. Rete

Ad oggi, Mi sono associato con più di 25 persone diverse dall'India, Singapore, EE. UU., Inghilterra, Francia e Africa in diverse competizioni di data science. Queste persone vanno dagli studenti ai leader del settore.

Onestamente, il networking è uno dei maggiori vantaggi della partecipazione a questi hackathon. Incontrare e interagire con persone che la pensano allo stesso modo è senza dubbio una grande risorsa per la tua futura carriera..

Ho ottenuto il mio attuale lavoro in DataPeaker grazie al networking!!

3. Creazione del profilo / Riprendi la creazione

Immagina uno scenario in cui stai assumendo un data scientist e hai selezionato due ottimi candidati. Entrambi gli individui hanno background simili nella scienza dei dati. La prima persona ha completato alcuni progetti nella scienza dei dati, mentre la seconda persona ha completato progetti simili, così come “raggiunto il grado” X “in una competizione di data science in competizione contro centinaia di persone”.

Quindi, A quale vorresti dare più preferenza?? In qualità di responsabile delle assunzioni, la maggior parte delle persone preferirebbe la seconda opzione.

Questo non deve minare la pertinenza di un buon progetto, Ma classificarsi bene in una competizione di data science ti dà sicuramente un vantaggio rispetto alla concorrenza.. Attualmente, molte aziende preferiscono candidati con esperienza nelle competenze di data science. Come aspirante alla scienza dei dati, è ora che inizi anche tu!

4. Guadagna premi e vinci fantastici premi

Finalmente, ma non meno importante, concorrenti esperti di scienza dei dati hanno molto da guadagnare e da vincere. Solo durante questo lockdown, Ho fatto abbastanza soldi per comprare una macchina. Piattaforme come Kaggle hanno molto in serbo per te se pensi di avere la capacità di risolvere i problemi di scienza dei dati più interessanti del mondo.. che cosa stai aspettando ancora?

HackLive – Hackathon guidato della comunità!

E se ci fosse una sessione dal vivo che potrebbe incoraggiare e aiutare i principianti a partecipare agli hackathon di scienza dei dati e migliorare la loro classifica? non sarebbe fantastico?

dal suo inizio, DataPeaker ha cercato di decodificare i problemi che la comunità della scienza dei dati deve affrontare e trovare una soluzione praticabile per loro.. E l'impossibilità di iniziare a partecipare a Data Science Hackathon è stata frequente. Quindi, come un passo per affrontare questo problema, mi permetta di introdurre: HackLive 2 – Hackathon guidato della comunità!

I data scientist di DataPeaker uniranno tutta la loro esperienza e conoscenza del settore per aiutare la comunità a rispondere 3 domande:

  • È importante distinguersi se ho una minima possibilità di vincere?
  • Come inizio?
  • Come posso migliorare il mio grado in futuro?

Quindi, Che cosa state aspettando? Vai e registrati al link qui sotto:

Note finali

Spero di averti dato abbastanza motivazione per iniziare il tuo viaggio verso le competizioni di scienza dei dati.. Altri post tecnici sui prossimi concorsi di scienza dei dati saranno pubblicati presto. Sono entusiasta di condividerli con te! Fino ad allora, puoi iniziare con alcune delle mie soluzioni di hackathon su Github qui.

Sei un principiante alla ricerca di un posto dove iniziare il tuo viaggio nella scienza dei dati?? Ecco un corso completo, pieno di conoscenza e apprendimento della scienza dei dati, selezionato solo per farti imparare la scienza dei dati:

Hai già partecipato a hackathon di data science? Com'è stata la tua esperienza? Condividi i tuoi pensieri con noi nella sezione commenti qui sotto e sceglieremo i migliori!!

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.