Como comecei a ganhar concursos de ciência de dados

Conteúdo

Visão geral

  • Ganhar concursos de ciência de dados pode ser um procedimento complexo, mas pode chegar ao topo 3 se você tem uma estrutura para seguir.
  • Ouça um especialista em hackathon de ciência de dados e como ele passou de zero a vencer concursos de ciência de dados

Introdução

Não há alternativa para aprender através da experiência. Especialmente na indústria de ciência de dados!!

Recentemente, ganhei o primeiro prêmio no Zindi's Zimnat Insurance Recommendation Challenge, uma conquista que ocupa o primeiro lugar entre meus resultados de todos os tempos na competição de ciência de dados.

em números puros, esse não foi meu primeiro resultado top, mas apenas um dos mais de 30 resultados entre 3 primeiros que tive em minha própria jornada de competição de ciência de dados. Durante esse período de começar do zero e se classificar nos escalões mais altos das tabelas de classificação de hackathon de aprendizado de máquina, Percebi a importância de aprender com a experiência e não posso enfatizar o suficiente o quão importante é a citação acima.

Ganhar um concurso de ciência de dados é uma jornada atribulada. Você está competindo contra as principais mentes da ciência de dados de todo o mundo!, você está trabalhando em um obstáculo de ciência de dados que não foi resolvido antes e está fazendo tudo isso com um prazo difícil para inicializar!

Mas posso assegurar-lhe que obter o 3 primeiros lugares na tabela de classificação é absolutamente alcançável, se você sabe o que está fazendo.

Não pretende ser uma publicação técnica. É sobre minha jornada para competições de ciência de dados. E, desde já, como e por que você deve começar agora. Como um iniciante, você certamente não vai querer deixar de ler isso. Postagens técnicas aparecerão em breve para leitores mais avançados, então fique ligado!

Como eu mencionei, não há melhor maneira de aprender ciência de dados do que fazendo isso. Convido você a se juntar a nós neste fim de semana prolongado para um hackathon comunitário guiado, onde especialistas em competição de ciência de dados o guiarão por todo o hackathon AO VIVO:

E você sempre pode visitar o Plataforma DataHack para praticar suas habilidades de ciência de dados ou participar de hackathons.

Minha jornada na competição de ciência de dados: zero a especialista

Um de nossos professores me apresentou à ciência de dados no início do meu terceiro semestre na faculdade.. Ele estava usando Machine Learning para descobrir planetas semelhantes à Terra e a oportunidade de vida extraterrestre..

A curiosidade me seguiu e me levou a mergulhar no famoso curso de Andrew Ng sobre aprendizado de máquina. Fui apresentado a várias aplicações de aprendizado de máquina, como a previsão de preços do mercado de ações e carros autônomos, para nomear alguns.

Pesquisando mais no mecanismo de pesquisa do Google sobre possibilidades potenciais neste campo, Descobri plataformas como Kaggle e DataPeaker. Adicionado mais combustível ao meu crescente interesse em ciência de dados. Competir constantemente e melhorar contra o tempo e uma tabela de classificação foi o próximo desafio; sim, Estou falando de hackathons de ciência de dados!!

A maioria dos iniciantes com os quais interagi sentem que precisam aprender os prós e contras do aprendizado de máquina primeiro. Só assim você poderá começar a competir em Data Science.

Isso é um grande erro.

“Participar de concursos de ciência de dados, você só precisa do impulso para aprender e melhorar constantemente. Você terá uma boa classificação “.

minha primeira competição: Desafio de previsão de malware da Microsoft da Kaggle

Deixe-me falar rapidamente sobre minha primeira competição séria no Kaggle: Competição de previsão de malware da Microsoft. Isso ocorreu meses depois de falhar em uma série de competições de ciência de dados.. Mas a experiência adquirida em todas as competições até então ajudou.

Em solo 2 semanas e com algumas apresentações em mãos, eu pulei para o topo 20 de classificação pública.

Com o passar do tempo, Eu me juntei a um estudante de Cingapura, um mestre Kaggle e dois líderes da indústria de Londres, Nova York e Pune. Trabalhar juntos em diferentes fusos horários foi um desafio em si, mas conseguimos discutir e implementar estratégias e modelos dia e noite no Slack.

e em conclusão, comigo liderando a equipe, acabamos no post 25 no ranking privado. Isso foi muito próximo do nosso ranking de classificação pública de 21. foi um resultado muito bom, considerando que apenas 10 equipes entre 100 primeiros no ranking público conseguiram manter sua posição no ranking privado.

Avanço rápido para o dia atual, eu terminei entre 3 primeiro em mais de 30 hackathons de ciência de dados em várias plataformas. Isso inclui o número 1 em quase todas as principais plataformas em que estive. (e sim, dois primeiros lugares na série JantaHack da DataPeaker).

Este é um breve resumo da minha jornada para conquistar competências em ciência de dados do zero.. A seguir, vamos entender como você pode, como iniciante, comece a participar de concursos de ciência de dados.

Como faço para iniciar as competições de ciência de dados se sou iniciante?

Aqui está um conselho que eu gostaria que alguém tivesse me dado quando comecei a competir em hackathons de ciência de dados.: entre em qualquer competição com a qual você se sinta confortável. O mais importante é que você comece.

Análise de Vidhya Janata Hack é uma série de competições para iniciantes realizadas todas as semanas. Ao final, muitos vencedores também têm a gentileza de publicar suas soluções.

Qualquer pessoa que esteja começando deve garantir soluções vencedoras para concursos anteriores de ciência de dados. Quando você se depara com alguma nova ideia ou conceito, procure na pesquisa do google e reserve um tempo para entendê-lo. Se você não puder transferir seu aprendizado de uma competência para outra, você não usou seu tempo corretamente.

A transferência de aprendizado é muito importante, do aprendizado profundo ao aprendizado.

Como abordar concursos de ciência de dados?

Aqui, Eu escrevi algumas dicas importantes que você deve prestar atenção ao iniciar uma nova competência de ciência de dados.

  1. Eu costumo começar com um modelo de linha de base simples. Basta dar uma olhada nos dados, em seguida, crie um modelo sem qualquer limpeza de dados ou engenharia de recursos
  2. A seguir, o alvo torna-se entender o problema e os dados para criar um bom conjunto de validação. Um bom conjunto de validação é obrigatório. Só então você pode confiar em seus resultados locais. Caso contrário, prepare-se para uma reviravolta privada no placar de líderes.
  3. Engenharia de recursos é o próximo passo chave. Boas características sempre diferenciam entre um vencedor e um top 100
  4. À medida que o fim da competição se aproxima, Eu costumo tentar construir uma variedade de modelos, como modelos de aumento de gradiente, redes neurais, etc. Em seguida, segue o empilhamento ou combinação desses resultados. conjunto dá-lhe a vantagem de ganhar uma competição. Por isso, é uma ferramenta que você sempre vai querer ter à mão.
  5. Uma coisa que muita gente não fala é a relevância de um base de código. O tempo é um fator muito importante em qualquer competição de ciência de dados. Não há necessidade de perder tempo escrevendo os mesmos trechos do zero repetidamente em várias competições. Em seu lugar, concentre seu precioso tempo em fazer algo novo e melhor

Quais são os benefícios de participar de concursos de ciência de dados?

essa é uma pergunta válida! Os concursos de ciência de dados exigem uma quantidade significativa do seu tempo, então, valem a pena? Deixe-me compartilhar alguns benefícios da minha experiência nesta seção.

1. competir e aprender

Aprenda muito durante as competições de ciência de dados, da resolução de problemas à construção de modelos. Se você quer aprender algo novo, concursos são a melhor maneira de fazer isso. Em pouco tempo, vai estudar e experimentar muito, e você se encontrará constantemente procurando melhores alternativas para melhorar seu modelo.

2. Networking

Até hoje, Eu me associei a mais de 25 pessoas diferentes da Índia, Cingapura, EE. UU., Inglaterra, França e África em diferentes competições de ciência de dados. Essas pessoas variam de estudantes a líderes da indústria.

Honestamente, networking é um dos maiores benefícios de participar desses hackathons. Conhecer e interagir com pessoas afins é, sem dúvida, um grande trunfo para sua futura carreira..

Consegui meu emprego atual na DataPeaker graças ao networking!!

3. Criação de perfil / Criação de currículo

Imagine um cenário em que você está contratando um cientista de dados e selecionou dois ótimos candidatos. Ambos os indivíduos têm experiências semelhantes em ciência de dados. A primeira pessoa concluiu alguns projetos em ciência de dados, enquanto a segunda pessoa completou projetos semelhantes, assim como “alcançou a classificação” X “em uma competição de ciência de dados competindo contra centenas de pessoas”.

Então, Qual você gostaria de dar mais preferência?? Como gerente de contratação, a maioria das pessoas preferiria a segunda opção.

Isso não é para minar a relevância de um bom projeto, Mas classificar bem em uma competição de ciência de dados definitivamente lhe dá uma vantagem em relação à sua concorrência.. Na atualidade, muitas empresas preferem candidatos com experiência em competências de ciência de dados. Como aspirante a Data Science, é hora de você começar também!

4. Ganhe recompensas e ganhe prêmios emocionantes

Por último, mas não menos importante, concorrentes experientes em ciência de dados têm muito a ganhar e ganhar. Somente durante este bloqueio, Ganhei dinheiro suficiente para comprar um carro. Plataformas como Kaggle têm muito a oferecer se você acha que tem a capacidade de resolver os problemas de ciência de dados mais interessantes do mundo.. O que você ainda está esperando?

HackLive – Hackathon comunitário guiado!

E se houvesse uma sessão ao vivo que pudesse incentivar e ajudar os iniciantes a participar de hackathons de ciência de dados e melhorar sua classificação? isso não seria ótimo?

desde o seu início, O DataPeaker vem tentando decodificar os problemas enfrentados pela comunidade de ciência de dados e encontrar uma solução viável para eles.. E a incapacidade de começar a participar de Data Science Hackathons tem sido frequente. Então, como um passo para resolver este problema, deixe-me apresentar: HackLive 2 – Hackathon comunitário guiado!

Os cientistas de dados do DataPeaker combinarão toda a sua experiência e conhecimento do setor para ajudar a comunidade a responder 3 perguntas:

  • É importante me destacar se eu tiver uma chance mínima de ganhar?
  • Como eu começo?
  • Como posso melhorar minha classificação no futuro?

Então, Você espera? Acesse e cadastre-se no link abaixo:

Notas finais

Espero ter lhe dado motivação suficiente para iniciar sua própria jornada em direção às competições de ciência de dados.. Mais postagens técnicas sobre as próximas competições de ciência de dados serão publicadas em breve. Estou animado para compartilhá-los com você! Até então, você pode começar com algumas das minhas soluções de hackathon no Github aqui.

Você é um iniciante procurando um lugar para começar sua jornada de ciência de dados?? Aqui está um curso completo, cheio de conhecimento e aprendizado de ciência de dados, selecionado apenas para você aprender ciência de dados:

Você já participou de hackathons de ciência de dados antes? Como foi sua experiência? Compartilhe seus pensamentos conosco na seção de comentários abaixo e escolheremos os melhores!!

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.