Comment j'ai commencé à gagner des concours de science des données

Contenu

Vue d'ensemble

  • Gagner des concours de science des données peut être une procédure complexe, mais il peut atteindre le sommet 3 si vous avez un cadre à suivre.
  • Écoutez un expert du hackathon en science des données et comment il est passé de zéro à gagner des concours de science des données

introduction

Il n'y a pas d'alternative à l'apprentissage par l'expérience. Surtout dans l'industrie de la science des données!!

J'ai récemment remporté le premier prix du Zimnat Insurance Referral Challenge de Zindi, une réalisation qui se classe au premier rang de mes résultats de tous les temps au concours de science des données.

En nombres purs, ce n'était pas mon premier top résultat, mais seulement l'un des plus de 30 résultats entre 3 J'ai d'abord eu mon propre parcours de compétition en science des données. Pendant cette période de repartir de zéro et de se classer dans les échelons supérieurs des classements du hackathon d'apprentissage automatique, J'ai réalisé la pertinence d'apprendre par l'expérience et je ne saurais trop insister sur l'importance de la citation ci-dessus.

Gagner un concours de science des données est un voyage sans tracas. Vous êtes en compétition avec les meilleurs esprits de la science des données du monde entier !, vous travaillez sur un obstacle à la science des données qui n'a pas été résolu auparavant et vous faites tout cela avec un délai strict pour démarrer!

Mais je peux vous assurer qu'obtenir le 3 les premières places dans le classement sont tout à fait réalisables, si tu sais ce que tu fais.

Il ne s'agit pas d'une publication technique.. Il s'agit de mon parcours vers les compétitions de science des données. Oui, depuis lors, comment et pourquoi devriez-vous commencer maintenant. En tant que débutant, vous ne voulez certainement pas manquer de lire ceci. Des articles techniques apparaîtront bientôt pour les lecteurs plus avancés, Alors restez à l'écoute!

Comme je le mentionne, il n'y a pas de meilleure façon d'apprendre la science des données qu'en la pratiquant. Je vous encourage à nous rejoindre ce week-end prolongé pour un hackathon communautaire guidé où des experts en science des données vous guideront tout au long de la procédure du hackathon EN DIRECT:

Et vous pouvez toujours visiter le Plateforme DataHack pour mettre en pratique vos compétences en science des données ou participer à des hackathons.

Mon parcours dans le concours de science des données: de zéro à expert

Un de nos professeurs m'a initié à la science des données au début du troisième semestre à l'université.. J'utilisais l'apprentissage automatique pour découvrir des planètes semblables à la Terre et la possibilité d'une vie extraterrestre.

La curiosité m'a suivi et m'a amené à plonger dans le célèbre cours d'Andrew Ng sur l'apprentissage automatique. J'ai été initié à diverses applications de l'apprentissage automatique, comme les prévisions de cours boursiers et les voitures autonomes, pour n'en nommer que quelques-uns.

Recherche plus dans le moteur de recherche Google sur les possibilités potentielles dans ce domaine, J'ai découvert des plateformes comme Kaggle et DataPeaker. Cela a ajouté plus de carburant à mon intérêt croissant pour la science des données. Concurrencer et s'améliorer constamment contre le temps et un classement était le prochain défi; Oui, Je parle des hackathons de science des données!

La plupart des débutants avec qui j'ai interagi ont l'impression qu'ils doivent d'abord connaître les tenants et les aboutissants de l'apprentissage automatique.. Ce n'est qu'alors que vous pourrez commencer à participer à la science des données.

C'est une grosse erreur.

« Pour participer à des concours de science des données, vous avez juste besoin d'être motivé pour apprendre et vous améliorer constamment. Vous obtiendrez un bon classement “.

Mon premier concours: Le défi de prédiction des logiciels malveillants Microsoft de Kaggle

Permettez-moi de parler rapidement de ma première compétition sérieuse chez Kaggle.: Concours de prédiction de logiciels malveillants de Microsoft. Cela s'est produit des mois après avoir échoué à une série de concours de science des données. Mais l'expérience acquise dans toutes les compétitions jusque-là avait aidé.

En solo 2 semaines et avec quelques présentations en main, j'ai sauté au sommet 20 du classement public.

Au fil du temps, J'ai fait équipe avec un étudiant singapourien, un maître Kaggle et deux leaders de l'industrie londonienne, New York et Pune. Travailler ensemble dans des fuseaux horaires différents était un défi en soi, mais nous avons réussi à discuter et à mettre en œuvre des stratégies et des modèles jour et nuit dans Slack.

Et en conclusion, avec moi à la tête de l'équipe, nous nous sommes retrouvés à la poste 25 en classement privé. C'était assez proche de notre classement public du classement des 21. C'était un très bon résultat, alors que seulement 10 équipes entre 100 premiers du classement public ont pu conserver leur position dans le classement privé.

Avance rapide jusqu'au jour actuel, j'ai fini entre 3 premier depuis plus de 30 hackathons de science des données sur diverses plateformes. Cela inclut la position de numéro un sur presque toutes les grandes plateformes auxquelles j'ai participé. (et si, Les deux premiers de la série JantaHack de DataPeaker).

Ceci est un bref résumé de mon parcours pour conquérir les compétences en science des données à partir de zéro. Ensuite, comprenons comment pouvez-vous, en tant que débutant, commencer à participer à des concours de science des données.

Comment puis-je commencer des compétitions de science des données si je suis débutant?

Voici quelques conseils que j'aurais aimé que quelqu'un me donne lorsque j'ai commencé à participer à des hackathons de science des données: participer à n'importe quelle compétition avec laquelle vous vous sentez à l'aise. La chose la plus importante est que vous commenciez.

Les analyses de Vidhya JanataHack est une série de concours pour débutants organisés chaque semaine. À la fin, de nombreux gagnants ont également la gentillesse de publier leurs solutions.

Toute personne débutante doit s'assurer qu'elle passe par des solutions gagnantes pour les précédents concours de science des données. Lorsque vous rencontrez une nouvelle idée ou un nouveau concept, recherchez-le sur la recherche google et prenez le temps de le comprendre. Si vous ne parvenez pas à transférer votre apprentissage d'une compétence à une autre, vous n'avez pas utilisé votre temps correctement.

Le transfert de l'apprentissage est très important, de l'apprentissage en profondeur à l'apprentissage.

Comment aborder les concours de science des données?

Ici, J'ai écrit quelques conseils clés auxquels vous devriez prêter attention lorsque vous lancez un nouveau concours de science des données..

  1. Je commence régulièrement par un modèle de base simple. Jetez un œil aux données, puis créez un modèle sans aucun nettoyage de données ni ingénierie de fonctionnalités
  2. Ensuite, le but devient comprendre le problème et les données pour créer un bon ensemble de validation. Un bon ensemble de validation est indispensable. Ce n'est qu'alors que vous pourrez faire confiance à vos résultats locaux. Cas contraire, préparez-vous pour une réorganisation du classement privé.
  3. Ingénierie des fonctionnalités est la prochaine étape clé. De bonnes caractéristiques font toujours la différence entre un gagnant et un top 100
  4. A l'approche de la fin du concours, j'essaie généralement de créer une gamme de modèles comme des modèles d'augmentation de gradient, les réseaux de neurones, etc. Vient ensuite l'empilement ou la combinaison de ces résultats. Assemblée vous donne l'avantage de gagner un concours. Pour cela, c'est un outil que vous voudrez toujours avoir sous la main.
  5. Une chose dont beaucoup de gens ne parlent pas est la pertinence d'un base de code. Le temps est un facteur très important dans toute compétition de science des données. Vous ne devriez pas perdre de temps à écrire les mêmes extraits à partir de zéro encore et encore dans plusieurs compétitions. À sa place, concentrez votre temps précieux sur quelque chose de nouveau et de meilleur

Quels sont les avantages de participer à des concours de science des données?

C'est une question valable !! Les concours de science des données nécessitent une quantité importante de votre temps, ensuite, ils valent la peine? Permettez-moi de partager quelques avantages de mon expérience dans cette section.

1. Rivaliser et apprendre

Apprenez beaucoup lors des compétitions de science des données, du dépannage à la construction de modèles. Si vous avez l'intention d'apprendre quelque chose de nouveau, les concours sont la meilleure façon de le faire. En peu de temps, étudiera et expérimentera beaucoup, et vous vous retrouverez constamment à la recherche de meilleures alternatives pour améliorer votre modèle.

2. La mise en réseau

À ce jour, J'ai collaboré avec plus de 25 différentes personnes de l'Inde, Singapour, EE. UU., Angleterre, La France et l'Afrique dans différents concours de data science. Ces personnes vont des étudiants aux leaders de l'industrie.

Franchement, le réseautage est l'un des plus grands avantages de la participation à ces hackathons. Rencontrer et interagir avec des personnes partageant les mêmes idées est sans aucun doute un atout majeur pour votre future carrière..

J'ai obtenu mon emploi actuel chez DataPeaker grâce au réseautage !!

3. Profilage / Création de CV

Imaginez un scénario dans lequel vous embauchez un scientifique des données et vous avez présélectionné deux excellents candidats. Les deux personnes ont des antécédents similaires en science des données. La première personne a réalisé des projets en science des données, tandis que la deuxième personne a réalisé des projets similaires, aussi bien que “Rang atteint” X “dans une compétition de science des données contre des centaines de personnes”.

Ensuite, Lequel aimeriez-vous donner plus de préférence à? En tant que responsable du recrutement, la plupart des gens préféreraient la deuxième option.

Il ne s'agit pas de remettre en cause la pertinence d'un bon projet., mais un bon classement dans un concours de science des données vous donne définitivement un avantage sur vos concurrents. Actuellement, de nombreuses entreprises préfèrent les candidats ayant une expérience dans les compétences en science des données. En tant qu'aspirant à la science des données, Il est temps pour toi de commencer aussi!

4. Obtenez des récompenses et gagnez des prix passionnants

Finalement, mais pas moins important, les concurrents chevronnés de la science des données ont beaucoup à gagner et à gagner. Seulement pendant ce confinement, J'ai gagné assez d'argent pour acheter une voiture. Des plateformes comme Kaggle ont beaucoup pour vous si vous pensez avoir la capacité de résoudre les problèmes de science des données les plus intéressants au monde.. Qu'est-ce que tu attends encore?

HackLive – Hackathon communautaire guidé!

Et s'il y avait une session en direct qui pourrait encourager et aider les débutants à participer à des hackathons de science des données et améliorer leur classement? Ne serait-ce pas génial?

Depuis sa création, DataPeaker a essayé de décoder les problèmes auxquels la communauté de la science des données est confrontée et de leur présenter une solution viable.. Et l'incapacité de commencer à participer aux Hackathons Data Science a été fréquente.. Ensuite, comme une étape pour résoudre ce problème, Permettez-moi de vous présenter: HackLive 2 – Hackathon communautaire guidé!

Les data scientists de DataPeaker combineront toute leur expérience et leurs connaissances du secteur pour aider la communauté à réagir 3 des questions:

  • Est-il important de souligner si j'ai une chance minimale de gagner?
  • Comment puis-je commencer?
  • Comment puis-je améliorer mon classement à l'avenir?

Ensuite, Qu'est-ce que tu attends? Allez vous inscrire dans le lien ci-dessous:

Remarques finales

J'espère vous avoir donné suffisamment de motivation pour commencer votre propre voyage vers les compétitions de science des données.. Plus d'articles techniques sur les prochains concours de science des données seront bientôt publiés. Je suis ravi de les partager avec vous! Jusque là, vous pouvez commencer avec certaines de mes solutions de hackathon sur Github ici.

Êtes-vous un débutant à la recherche d'un endroit pour commencer votre parcours en science des données ?? Voici un cours complet, plein de connaissances et d'apprentissage en science des données, sélectionné juste pour que vous appreniez la science des données:

Avez-vous déjà participé à des hackathons de science des données? Comment s'est passée votre expérience? Partagez vos réflexions avec nous dans la section commentaires ci-dessous et nous choisirons les meilleurs !!

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.