Visão geral
- Ganhar concursos de ciência de dados pode ser um procedimento complexo, mas pode chegar ao topo 3 se você tem uma estrutura para seguir.
- Ouça um especialista em hackathon de ciência de dados e como ele passou de zero a vencer concursos de ciência de dados
Introdução
Não há alternativa para aprender através da experiência. Especialmente na indústria de ciência de dados!!
Recentemente, ganhei o primeiro prêmio no Zindi's Zimnat Insurance Recommendation Challenge, uma conquista que ocupa o primeiro lugar entre meus resultados de todos os tempos na competição de ciência de dados.
em números puros, esse não foi meu primeiro resultado top, mas apenas um dos mais de 30 resultados entre 3 primeiros que tive em minha própria jornada de competição de ciência de dados. Durante esse período de começar do zero e se classificar nos escalões mais altos das tabelas de classificação de hackathon de aprendizado de máquina, Percebi a importância de aprender com a experiência e não posso enfatizar o suficiente o quão importante é a citação acima.
Ganhar um concurso de ciência de dados é uma jornada atribulada. Você está competindo contra as principais mentes da ciência de dados de todo o mundo!, você está trabalhando em um obstáculo de ciência de dados que não foi resolvido antes e está fazendo tudo isso com um prazo difícil para inicializar!
Mas posso assegurar-lhe que obter o 3 primeiros lugares na tabela de classificação é absolutamente alcançável, se você sabe o que está fazendo.
Não pretende ser uma publicação técnica. É sobre minha jornada para competições de ciência de dados. E, desde já, como e por que você deve começar agora. Como um iniciante, você certamente não vai querer deixar de ler isso. Postagens técnicas aparecerão em breve para leitores mais avançados, então fique ligado!
Como eu mencionei, não há melhor maneira de aprender ciência de dados do que fazendo isso. Convido você a se juntar a nós neste fim de semana prolongado para um hackathon comunitário guiado, onde especialistas em competição de ciência de dados o guiarão por todo o hackathon AO VIVO:
E você sempre pode visitar o Plataforma DataHack para praticar suas habilidades de ciência de dados ou participar de hackathons.
Minha jornada na competição de ciência de dados: zero a especialista
Um de nossos professores me apresentou à ciência de dados no início do meu terceiro semestre na faculdade.. Ele estava usando Machine Learning para descobrir planetas semelhantes à Terra e a oportunidade de vida extraterrestre..
A curiosidade me seguiu e me levou a mergulhar no famoso curso de Andrew Ng sobre aprendizado de máquina. Fui apresentado a várias aplicações de aprendizado de máquina, como a previsão de preços do mercado de ações e carros autônomos, para nomear alguns.
Pesquisando mais no mecanismo de pesquisa do Google sobre possibilidades potenciais neste campo, Descobri plataformas como Kaggle e DataPeaker. Adicionado mais combustível ao meu crescente interesse em ciência de dados. Competir constantemente e melhorar contra o tempo e uma tabela de classificação foi o próximo desafio; sim, Estou falando de hackathons de ciência de dados!!
A maioria dos iniciantes com os quais interagi sentem que precisam aprender os prós e contras do aprendizado de máquina primeiro. Só assim você poderá começar a competir em Data Science.
Isso é um grande erro.
“Participar de concursos de ciência de dados, você só precisa do impulso para aprender e melhorar constantemente. Você terá uma boa classificação “.
minha primeira competição: Desafio de previsão de malware da Microsoft da Kaggle
Deixe-me falar rapidamente sobre minha primeira competição séria no Kaggle: Competição de previsão de malware da Microsoft. Isso ocorreu meses depois de falhar em uma série de competições de ciência de dados.. Mas a experiência adquirida em todas as competições até então ajudou.
Em solo 2 semanas e com algumas apresentações em mãos, eu pulei para o topo 20 de classificação pública.
Com o passar do tempo, Eu me juntei a um estudante de Cingapura, um mestre Kaggle e dois líderes da indústria de Londres, Nova York e Pune. Trabalhar juntos em diferentes fusos horários foi um desafio em si, mas conseguimos discutir e implementar estratégias e modelos dia e noite no Slack.
e em conclusão, comigo liderando a equipe, acabamos no post 25 no ranking privado. Isso foi muito próximo do nosso ranking de classificação pública de 21. foi um resultado muito bom, considerando que apenas 10 equipes entre 100 primeiros no ranking público conseguiram manter sua posição no ranking privado.
Avanço rápido para o dia atual, eu terminei entre 3 primeiro em mais de 30 hackathons de ciência de dados em várias plataformas. Isso inclui o número 1 em quase todas as principais plataformas em que estive. (e sim, dois primeiros lugares na série JantaHack da DataPeaker).
Este é um breve resumo da minha jornada para conquistar competências em ciência de dados do zero.. A seguir, vamos entender como você pode, como iniciante, comece a participar de concursos de ciência de dados.
Como faço para iniciar as competições de ciência de dados se sou iniciante?
Aqui está um conselho que eu gostaria que alguém tivesse me dado quando comecei a competir em hackathons de ciência de dados.: entre em qualquer competição com a qual você se sinta confortável. O mais importante é que você comece.
AnalyticsAnalytics refere-se ao processo de coleta, Meça e analise dados para obter insights valiosos que facilitam a tomada de decisões. Em vários campos, como negócio, Saúde e esporte, A análise pode identificar padrões e tendências, Otimize processos e melhore resultados. O uso de ferramentas avançadas e técnicas estatísticas é essencial para transformar dados em conhecimento aplicável e estratégico.... de Vidhya Janata Hack é uma série de competições para iniciantes realizadas todas as semanas. Ao final, muitos vencedores também têm a gentileza de publicar suas soluções.
Qualquer pessoa que esteja começando deve garantir soluções vencedoras para concursos anteriores de ciência de dados. Quando você se depara com alguma nova ideia ou conceito, procure na pesquisa do google e reserve um tempo para entendê-lo. Se você não puder transferir seu aprendizado de uma competência para outra, você não usou seu tempo corretamente.
A transferência de aprendizado é muito importante, desde o aprendizado profundoAqui está o caminho de aprendizado para dominar o aprendizado profundo em, Uma subdisciplina da inteligência artificial, depende de redes neurais artificiais para analisar e processar grandes volumes de dados. Essa técnica permite que as máquinas aprendam padrões e executem tarefas complexas, como reconhecimento de fala e visão computacional. Sua capacidade de melhorar continuamente à medida que mais dados são fornecidos a ele o torna uma ferramenta fundamental em vários setores, da saúde... hasta el aprendizaje.
Como abordar concursos de ciência de dados?
Aqui, Eu escrevi algumas dicas importantes que você deve prestar atenção ao iniciar uma nova competência de ciência de dados.
- Eu costumo começar com um modelo de linha de base simples. Basta dar uma olhada nos dados, em seguida, crie um modelo sem qualquer limpeza de dados ou engenharia de recursos
- A seguir, o alvo torna-se entender o problema e os dados para criar um bom conjunto de validação. Um bom conjunto de validação é obrigatório. Só então você pode confiar em seus resultados locais. Caso contrário, prepare-se para uma reviravolta privada no placar de líderes.
- Engenharia de recursos é o próximo passo chave. Boas características sempre diferenciam entre um vencedor e um top 100
- UMA mediro "medir" É um conceito fundamental em várias disciplinas, que se refere ao processo de quantificação de características ou magnitudes de objetos, Fenômenos ou situações. Na matemática, Usado para determinar comprimentos, Áreas e volumes, enquanto nas ciências sociais pode se referir à avaliação de variáveis qualitativas e quantitativas. A precisão da medição é crucial para obter resultados confiáveis e válidos em qualquer pesquisa ou aplicação prática.... que se acerca el final de la competencia, por lo general trato de construir una gama de modelos como modelos de aumento de gradienteGradiente é um termo usado em vários campos, como matemática e ciência da computação, descrever uma variação contínua de valores. Na matemática, refere-se à taxa de variação de uma função, enquanto em design gráfico, Aplica-se à transição de cores. Esse conceito é essencial para entender fenômenos como otimização em algoritmos e representação visual de dados, permitindo uma melhor interpretação e análise em..., redes neurais, etc. Em seguida, segue o empilhamento ou combinação desses resultados. conjunto dá-lhe a vantagem de ganhar uma competição. Por isso, é uma ferramenta que você sempre vai querer ter à mão.
- Uma coisa que muita gente não fala é a relevância de um base de código. O tempo é um fator muito importante em qualquer competição de ciência de dados. Não há necessidade de perder tempo escrevendo os mesmos trechos do zero repetidamente em várias competições. Em seu lugar, concentre seu precioso tempo em fazer algo novo e melhor
Quais são os benefícios de participar de concursos de ciência de dados?
essa é uma pergunta válida! Os concursos de ciência de dados exigem uma quantidade significativa do seu tempo, então, valem a pena? Deixe-me compartilhar alguns benefícios da minha experiência nesta seção.
1. competir e aprender
Aprenda muito durante as competições de ciência de dados, da resolução de problemas à construção de modelos. Se você quer aprender algo novo, concursos são a melhor maneira de fazer isso. Em pouco tempo, vai estudar e experimentar muito, e você se encontrará constantemente procurando melhores alternativas para melhorar seu modelo.
2. Networking
Até hoje, Eu me associei a mais de 25 pessoas diferentes da Índia, Cingapura, EE. UU., Inglaterra, França e África em diferentes competições de ciência de dados. Essas pessoas variam de estudantes a líderes da indústria.
Honestamente, networking é um dos maiores benefícios de participar desses hackathons. Conhecer e interagir com pessoas afins é, sem dúvida, um grande trunfo para sua futura carreira..
Consegui meu emprego atual na DataPeaker graças ao networking!!
3. Criação de perfil / Criação de currículo
Imagine um cenário em que você está contratando um cientista de dados e selecionou dois ótimos candidatos. Ambos os indivíduos têm experiências semelhantes em ciência de dados. A primeira pessoa concluiu alguns projetos em ciência de dados, enquanto a segunda pessoa completou projetos semelhantes, assim como “alcançou a classificação” X “em uma competição de ciência de dados competindo contra centenas de pessoas”.
Então, Qual você gostaria de dar mais preferência?? Como gerente de contratação, a maioria das pessoas preferiria a segunda opção.
Isso não é para minar a relevância de um bom projeto, Mas classificar bem em uma competição de ciência de dados definitivamente lhe dá uma vantagem em relação à sua concorrência.. Na atualidade, muitas empresas preferem candidatos com experiência em competências de ciência de dados. Como aspirante a Data Science, é hora de você começar também!
4. Ganhe recompensas e ganhe prêmios emocionantes
Por último, mas não menos importante, concorrentes experientes em ciência de dados têm muito a ganhar e ganhar. Somente durante este bloqueio, Ganhei dinheiro suficiente para comprar um carro. Plataformas como Kaggle têm muito a oferecer se você acha que tem a capacidade de resolver os problemas de ciência de dados mais interessantes do mundo.. O que você ainda está esperando?
HackLive – Hackathon comunitário guiado!
¿Qué pasaría si hubiera una sessãoo "Sessão" É um conceito-chave no campo da psicologia e da terapia. Refere-se a uma reunião agendada entre um terapeuta e um cliente, onde os pensamentos são explorados, Emoções e comportamentos. Essas sessões podem variar em duração e frequência, e seu principal objetivo é facilitar o crescimento pessoal e a resolução de problemas. A eficácia das sessões depende da relação entre o terapeuta e o terapeuta.. en vivo que pudiera alentar y ayudar a los principiantes a participar en hackatones de ciencia de datos y mejorar su clasificación? isso não seria ótimo?
desde o seu início, O DataPeaker vem tentando decodificar os problemas enfrentados pela comunidade de ciência de dados e encontrar uma solução viável para eles.. E a incapacidade de começar a participar de Data Science Hackathons tem sido frequente. Então, como um passo para resolver este problema, deixe-me apresentar: HackLive 2 – Hackathon comunitário guiado!
Os cientistas de dados do DataPeaker combinarão toda a sua experiência e conhecimento do setor para ajudar a comunidade a responder 3 perguntas:
- É importante me destacar se eu tiver uma chance mínima de ganhar?
- Como eu começo?
- Como posso melhorar minha classificação no futuro?
Então, Você espera? Acesse e cadastre-se no link abaixo:
Notas finais
Espero ter lhe dado motivação suficiente para iniciar sua própria jornada em direção às competições de ciência de dados.. Mais postagens técnicas sobre as próximas competições de ciência de dados serão publicadas em breve. Estou animado para compartilhá-los com você! Até então, você pode começar com algumas das minhas soluções de hackathon no Github aqui.
Você é um iniciante procurando um lugar para começar sua jornada de ciência de dados?? Aqui está um curso completo, cheio de conhecimento e aprendizado de ciência de dados, selecionado apenas para você aprender ciência de dados:
Você já participou de hackathons de ciência de dados antes? Como foi sua experiência? Compartilhe seus pensamentos conosco na seção de comentários abaixo e escolheremos os melhores!!
Relacionado
Postagens Relacionadas:
- Ciência de dados em saúde | Como a ciência de dados é usada no setor de saúde?
- SQL para ciência de dados | Guia do iniciante em SQL para ciência de dados
- Aplicativos de ciência de dados | Aplicativos de ciência de dados e inteligência artificial no mundo real
- Ferramentas de ciência de dados | Ferramentas de ciência de dados 2021