Projets open source pour les passionnés de machine learning

Partager sur Facebook
Partager sur Twitter
Partager sur lié
Partager sur télégramme
Partager sur WhatsApp

Contenu

L'open source fait référence à quelque chose que les gens peuvent modifier et partager car ils sont accessibles à tous. Vous pouvez utiliser le travail de nouvelles façons, l'intégrer dans un projet plus vaste ou trouver un nouvel emploi basé sur l'original. L'open source favorise le libre échange d'idées au sein d'une communauté pour générer des innovations ou des idées créatives et technologiques. Donc, Les développeurs devraient envisager de contribuer à des projets open source pour les raisons suivantes:

1. Vous aide à écrire un code plus propre.

2. Mieux comprendre la technologie.

3. Contribuer à des projets open source vous aide à attirer l'attention, popularité et peut s'appuyer sur votre carrière.

4. Ajouter un projet open source à votre CV augmente son poids.

5. Améliorer les compétences de codage

6. Améliorer les logiciels au niveau de l'utilisateur et de l'entreprise.

5tcs0edzmxgn4r1nxtym-4783147La source: Google images

Pour commencer à contribuer à des projets open source, il y a des prérequis:

1. Apprendre un langage de programmation: car dans la contribution open source, vous devez écrire du code pour vous impliquer dans le développement, besoin d'apprendre un langage de programmation. Cela peut être de n'importe quel choix. Il est facile d'apprendre une autre langue à un stade ultérieur en fonction des besoins du projet.

2. Familiarisez-vous avec les systèmes de contrôle de version: ce sont les outils logiciels qui permettent de conserver au même endroit toutes les modifications qui sont apportées pour les récupérer ultérieurement si nécessaire. Essentiellement, suivre chaque modification apportée par vous au fil du temps au code source. Certains systèmes de contrôle de version populaires sont Git, Mercuriel, CVS, etc. De tous ces, Git est le plus populaire et le plus utilisé dans l'industrie.

Nous allons maintenant examiner quelques-uns des incroyables projets open source auxquels vous pouvez contribuer..

Alors commençons!

1. Caliban

caliban / README.md et maître google / Projets GitHub Open Source caliban

La source: Google images

Il s'agit d'un projet d'apprentissage automatique du géant de la technologie Google. Utilisé pour développer des ordinateurs portables et des workflows de recherche en apprentissage automatique dans un environnement informatique isolé et reproductible. Résoudre un gros problème. Quand les développeurs créent des projets de science des données, il est souvent difficile de créer un environnement de test qui peut montrer votre projet dans une situation réelle. Tous les cas extrêmes ne sont pas prévisibles. Ensuite, Caliban est une solution possible à ce problème. Caliban facilite le développement local de n'importe quel modèle d'apprentissage automatique, exécutez du code sur votre machine, puis testez exactement le même code dans un environnement cloud pour qu'il s'exécute sur de grandes machines. Donc, Les workflows d'enquête dockerisés sont simplifiés, à la fois localement et dans le cloud.

Lien Github: https://github.com/google/caliban

2. Cornia

175jdfj4e15tx1x_y8uizna-6650984

La source: Google images

Kornia est une bibliothèque de vision par ordinateur pour PyTorch. Utilisé pour résoudre certains problèmes génériques de vision par ordinateur. Kornia est basé sur PyTorch et s'appuie sur son efficacité et sa puissance CPU pour pouvoir calculer des fonctions complexes. Kornia est un package de bibliothèque utilisé pour former des modèles de réseaux neuronaux et effectuer une transformation d'image, filtrage d'images, détection de contour, géométrie épipolaire, estimation de la profondeur, etc.

Lien Github: https://github.com/kornia/kornia

3. Zoo d'analyse

logo-analytics-zoo-rwd-jpg-rendition-intel_-web_-576-324-1364090

La source: Google images

Analytics Zoo est une plateforme unifiée d'analyse de données et d'intelligence artificielle qui réunit les programmes TensorFlow, Dur, PyTorche, Étincelle, Flink et Ray dans un pipeline intégré. Cela peut efficacement passer d'un ordinateur portable à un grand cluster pour traiter la production de données volumineuses.. Ce projet est maintenu par Intel-analytique.

Analytics Zoo aide une solution d'IA des manières suivantes:

  • Vous aide à prototyper facilement des modèles d'IA.
  • La mise à l'échelle est gérée efficacement.
  • Aide à ajouter des processus d'automatisation à votre canal ML en tant qu'ingénierie de fonctionnalités, sélection de modèles, etc.

Lien Github: https://github.com/intel-analytics/analytics-zoo

4. Apprentissage automatique automatisé MLJAR pour les humains

La source: Google images

Mljar est une plate-forme de création de modèles de prototypes et de services de mise en œuvre. Pour trouver le meilleur modèle, Mljar recherche différents algorithmes et effectue des ajustements d'hyperparamètres. Fournit des résultats rapides intéressants en exécutant tous les calculs dans le cloud et en créant enfin des modèles d'ensemble. Alors, crée un rapport pour vous à partir de la formation AutoML. N'est-ce pas cool?

Mljar forme efficacement des modèles pour la classification binaire, classification de plusieurs classes, régression.

Il propose deux types d'interfaces:

  • Vous pouvez exécuter des modèles d'apprentissage automatique dans votre navigateur Web
  • Fournit un wrapper Python sur l'API Mljar.

Le rapport reçu de Mljar contient le tableau avec des informations sur le score de chaque modèle et le temps nécessaire pour former chaque modèle. Le rendement est affiché sous forme de nuages ​​de points et de boîtes à moustaches, ce qui permet de vérifier visuellement quels algorithmes fonctionnent le mieux parmi tous. Regarde ça:

automl_summary-4371799

La source: Google images

Documentation: https://supervisé.mljar.com/

Code source: https://github.com/mljar/mljar-supervisé

5.DeepDetect

fdea7a61-ab12-4f90-8f31-67a300cd9ac7-3997349

La source: Google images

DeepDetect est une API et un serveur d'apprentissage automatique écrits en C ++. Si vous souhaitez travailler avec des algorithmes d'apprentissage automatique de pointe et que vous souhaitez les intégrer dans des applications existantes, DeepDetect est fait pour vous. DeepDetect prend en charge une grande variété de tâches telles que la classification, segmentation, régression, détection d'objets, encodeurs automatiques. Prend en charge l'apprentissage en profondeur supervisé et non supervisé des images, des séries chronologiques, du texte et d'autres types de données. Mais DeepDetect s'appuie sur des bibliothèques d'apprentissage automatique externes telles que:

  • Bibliothèques d'apprentissage en profondeur: Tensorflow, Café2, Torche.
  • Bibliothèque d'augmentation de gradient: XGBoost.
  • Regroupement avec T-SNE.

Lien Github: https://github.com/jolibrain/deepdetect

6. Dopamine

Dopamine: un cadre de recherche pour l'apprentissage par renforcement profond - Cryogrenouille

La source: Google images

Dopamine est un projet open source du géant de la technologie Google. Il est écrit en Python. C'est un cadre de recherche pour le prototypage rapide d'algorithmes d'apprentissage par renforcement.

Les principes de conception de la dopamine sont:

  • Expérience simple: la dopamine permet aux nouveaux utilisateurs d'effectuer plus facilement des expériences.
  • Il est compact et fiable.
  • Il facilite également la reproductibilité des résultats.
  • C'est souple, donc, permet aux nouveaux utilisateurs d'essayer facilement de nouvelles idées de recherche.

Noter: Regardez ces Cahiers Collaboratifs apprendre à utiliser la dopamine.

Lien Github: https://github.com/google/dopamine

7. TensorFlow

apporter-l

La source: Google images

Tensorflow est le plus connu, populaire et l'un des meilleurs projets d'apprentissage automatique open source sur GitHub. Il s'agit d'une bibliothèque logicielle open source pour le calcul numérique à l'aide de graphiques de flux de données. Il possède une interface Python très facile à utiliser et aucune interface indésirable dans d'autres langages pour créer et exécuter des graphiques de calcul.. TensorFlow fournit des API Python et C stables ++. Tensorflow a des cas d'utilisation étonnants comme:

  • En reconnaissance vocale / sonner
  • Applications de base de texte
  • Reconnaissance d'images
  • Détection vidéo

…et beaucoup plus!

Lien GitHub: https://github.com/tensorflow/tensorflow

8. PrédictionIO

1ti-w8opxn-6znge40zo0tg-9615970

La source: Google images

Il est construit sur une pile open source de pointe. Ce serveur d'apprentissage automatique est conçu pour que les scientifiques des données créent des moteurs prédictifs pour toute tâche d'apprentissage automatique.. Certaines de ses caractéristiques étonnantes sont:

  • Aide à créer et déployer rapidement un moteur en tant que service Web dans des modèles de production personnalisables.
  • Une fois implémenté en tant que service Web, répondre aux requêtes dynamiques en temps réel.
  • Prend en charge les bibliothèques de traitement de données et d'apprentissage automatique telles que OpenNLP, Spark MLLib.
  • Il simplifie également la gestion de l'infrastructure de données

Lien GitHub: https://github.com/apache/predictionio

9.Scikit-apprendre

vedette-2358205

La source: Google images

Il s'agit d'une bibliothèque d'outils d'apprentissage automatique gratuits basés sur Python. Fournit divers algorithmes de classification, régression, algorithmes de clustering, y compris les forêts aléatoires, augmentation de la pente, DBSCAN. Ceci est basé sur SciPy qui doit être pré-installé pour que vous puissiez utiliser sci-kit learn. Il propose également des modèles de:

  • Méthodes d'ensemble
  • Extraction de caractéristiques
  • Paramètres de réglage
  • Apprentissage multiple
  • Sélection de fonctionnalité
  • Réduction de la dimensionnalité

Noter: Pour apprendre sckit-learn, suivre la documentation: https://scikit-learn.org/stable/

Lien GitHub: https://github.com/scikit-learn

10. Pylearn2

Pylearn2 est la bibliothèque d'apprentissage automatique la plus courante parmi tous les développeurs Python. Il est basé sur Theano. Vous pouvez utiliser des expressions mathématiques pour écrire votre complément pendant que Theano prend ou optimisation et stabilisation. Il a des fonctionnalités étonnantes comme:

  • Un “algorithme d'entraînement par défaut” pour former le modèle lui-même
  • Critères d'estimation du modèle
    • Score correspondant
    • Entropie croisée
    • Probabilité logarithmique
  • Prétraitement de l'ensemble de données
    • Normalisation du contraste
    • Blanchiment ZCA
    • Suppression des correctifs (implémenter des algorithmes de type convolution)

Lien GitHub: https://github.com/lisa-lab/pylearn2

Remarques finales:

Contribuer à l'open source vient avec trop de pros. Ensuite, ce sont de bons projets open source pour contribuer.

Merci d'avoir lu si vous êtes arrivé ici

Connectons-nous LinkedIn.

Les médias présentés dans cet article ne sont pas la propriété de DataPeaker et sont utilisés à la discrétion de l'auteur.

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.