Le 5 meilleures applications de vision par ordinateur

Contenu

Vue d'ensemble

  • La vision par ordinateur est la technologie qui permet au monde numérique d'interagir avec le monde réel.
  • Explorer 5 des applications de vision par ordinateur les plus populaires
    • Estimation de pose à l'aide de la vision artificielle
    • Transformation d'image à l'aide de Gans
    • Vision par ordinateur pour le développement d'outils de distanciation sociale
    • Conversion d'images 2D en modèles 3D
    • Analyse d'images médicales

J'ai commencé à utiliser Facebook il y a 10 ans. en outre, si vous l'avez utilisé il y a longtemps, vous devez vous rappeler le marquage manuel des photos. Mais maintenant, nous n'avons plus besoin de marquer ces images manuellement. Facebook reconnaît la plupart des personnes dans l'image téléchargée et propose des suggestions pour les marquer. De la même manière, vous devez avoir vu ces filtres amusants sur Snapchat où les gens utilisent le filtre pour chien et mettent une tête de chien. Vous êtes-vous déjà demandé comment tout cela est possible? Comment notre téléphone peut-il détecter notre visage et y ajouter des filtres? Ce sont quelques-unes des applications de la vision artificielle.

La vision par ordinateur est l'un des domaines de recherche les plus en vogue dans le monde de la science des données. En outre, fait désormais partie de notre vie personnelle. Consciemment ou inconsciemment, nous utilisons tous diverses fonctions qui ont des techniques de vision par ordinateur en cours d'exécution dans le backend. Par exemple, nous utilisons Face Unlock sur nos smartphones. L'image suivante explique efficacement le fonctionnement de la détection de visage.

détection de visage-300x209-8936147

La source: https://www.pinterest.com

Je choisis la détection de visage pour commencer cet article, puisqu'il s'agit de la seule application de vision par ordinateur que nous ayons tous vue. Mais crois moi, la vision par ordinateur ne se limite pas à cela. Dans cet article, explorer des applications plus intéressantes de la vision par ordinateur.

Si vous cherchez à maîtriser la vision par ordinateur, consultez notre cours Vision par ordinateur utilisant l'apprentissage en profondeur 2.0

Table des matières

  • Qu'est-ce que la vision par ordinateur?
  • Estimation de pose à l'aide de la vision artificielle
  • Transformation d'image à l'aide de Gans
  • Vision par ordinateur pour le développement d'outils de distanciation sociale
  • Conversion d'images 2D en modèles 3D
  • Analyse d'images médicales

Qu'est-ce que la vision par ordinateur?

Avant d'entrer dans le monde des applications de vision par ordinateur, premier, comprenons ce qu'est la vision par ordinateur. En résumé, la vision par ordinateur est une branche multidisciplinaire de l'intelligence artificielle qui tente de reproduire les puissantes capacités de la vision humaine.

Si nous passons par la définition formelle,

“La vision par ordinateur est un utilitaire qui prend des décisions utiles sur des objets physiques réels et des scènes basées sur des images détectées” (Sockman et Shapiro, 2001)

La vision par ordinateur fonctionne grâce à des techniques de reconnaissance visuelle telles que la classification d'images, détection d'objets, segmentation de imágenes, suivi d'objet, reconnaissance optique de caractères, légendes des images, etc. Je sais que ce sont beaucoup de termes techniques, mais les comprendre n'est pas difficile. Il suffit de regarder l'image ci-dessous et vous comprendrez bon nombre de ces terminologies.

classe d

la source: https: //www.oreilly.com/library/view/python-advanced-guide

Commençons par la première image. Si je te demande, qu'est-ce qu'il y a sur la photo? Votre réponse sera, c'est un chat. C'est le classement. Cela signifie marquer l'image en fonction de son classement.. Ici, la classe est 'Cat'.

Vous connaissez maintenant la classe de l'image. La question suivante est de savoir où se trouve l'objet dans l'image. Lorsque nous identifions l'emplacement de l'objet dans le cadre et créons un cadre de délimitation autour de celui-ci, C'est ce qu'on appelle l'emplacement. Dans la deuxième image, nous identifions l'emplacement de l'objet et l'identifions comme un chat.

Le terme suivant est la détection d'objets. Dans les deux cas précédents, nous n'avons qu'un seul objet dans l'image, mais que faire s'il y a plusieurs objets présents? Ici, nous identifions les instances présentes et leur emplacement à l'aide de cadres de délimitation.

Sur la détection d'objets, nous utilisons une boîte englobante de forme carrée ou rectangulaire, mais ça ne dit rien sur la forme des objets. La segmentation d'instance crée un masque de pixels autour de chaque objet. Donc, la segmentation des instances permet de mieux comprendre l'image.

Consultez les ressources suivantes pour en savoir plus sur la vision par ordinateur-

DEVELOPPEMENTS récents

Los desarrollos recientes en los enfoques de l'apprentissage en profondeur y los avances en la tecnología han aumentado enormemente las capacidades de los sistemas de reconocimiento visual. Par conséquent, les entreprises ont rapidement adopté la vision par ordinateur. Des cas d'utilisation réussis de la vision par ordinateur peuvent être observés dans les secteurs industriels, ce qui conduit à une mise à l'échelle des applications et à une demande croissante d'outils de vision par ordinateur..

À présent, sans perdre plus de temps, passons à 5 applications passionnantes de la vision par ordinateur.

Estimation de la posture humaine

L'estimation de la posture humaine est une application intéressante de la vision par ordinateur. Vous devez avoir entendu parler Posenet, qui est un modèle open source pour estimer la pose humaine. En résumé, l'estimation de pose est une technique de vision par ordinateur pour déduire la pose d'une personne ou d'un objet présent dans l'image / vidéo.

Avant de discuter du fonctionnement de l'estimation de pose, Commençons par comprendre le « Squelette de pose humaine ». C'est l'ensemble des coordonnées pour définir la pose d'une personne. Une paire de coordonnées est connue sous le nom de membre. En outre, l'estimation de la pose est réalisée en identifiant, localiser et suivre les points clés du squelette de la pose humaine dans une image ou une vidéo.

squelette humain-9816275

la source: https: //www.researchgate.net/publication/338905462_The_'DEEP'_Landing_Error_Scoring_System

Voici quelques-unes des applications de l'estimation de la pose humaine:

  • Reconnaissance d'activité pour l'analyse sportive en temps réel ou le système de surveillance.
  • Pour des expériences de réalité augmentée
  • Dans entraînement de Robots
  • Animations et jeux

Voici quelques ensembles de données si vous souhaitez développer vous-même un modèle d'estimation de pose:

j'ai trouvé Pose profonde de Google comme un document de recherche très intéressant qui utilise des modèles d'apprentissage en profondeur pour l'estimation des poses. Pour aller plus loin, vous pouvez visiter diverses enquêtes documents disponible en pose devis

Transformation d'image à l'aide de GAN:

Faceapp est une application très intéressante et à la mode parmi les gens. C'est un outil de manipulation d'image et transforme l'image d'entrée à l'aide de filtres. Les filtres peuvent inclure un filtre d'âge ou d'échange d'un genre récent.

merveille-étoiles-dans-femmes-deadpool-300x150-9408598

la source: https: //comicbook.com/marvel/news/marvel-men-faceapp-gender-swap/#18

Regardez l'image ci-dessus, vérité? Il y a quelques mois, c'était un sujet brûlant sur Internet. Les gens partageaient des photos après avoir changé de sexe. Mais, Quelle est la technologie derrière ces applications? Oui, tu l'as bien deviné, Vision par ordinateur, Pour être plus précis, leurs réseaux génératifs contradictoires de convolution profonde.

Réseaux génératifs antagonistes communément appelés GAN est une innovation passionnante dans le domaine de la vision par ordinateur. Bien que les GAN soient un vieux concept, sous sa forme actuelle a été proposé par Ian Goodfellow dans 2014. Depuis, il a connu de nombreux développements.

La formation GAN implique deux réseaux de neurones se faisant face pour générer de nouvelles données basées sur la distribution des données de formation données. Aunque originalmente se propuso como un mecanismo de Apprentissage non supervisé, las GAN han demostrado ser un buen candidato para el enseignement supervisé y semi-supervisado.

Pour en savoir plus sur le fonctionnement du Gans, voir article ci-dessous.

Voici quelques articles de recherche à lire absolument sur le GAN que je recommande personnellement:

Voici quelques ensembles de données pour vous aider à acquérir une expérience pratique avec les GAN:

Applications

Quand il s'agit de discuter des applications de Gans Imaging, nous avons beaucoup. Voici quelques-unes de ses applications:

  • Traduction image à image en transfert de style et photo en peinture
  • super résolution de imagen
  • Génération de texte en image
  • L'édition d'image
  • Traduction sémantique d'image en photo

Si vous trouvez quelque chose de plus intéressant, faites le moi savoir dans la section commentaire.

La vision par ordinateur pour développer des outils de distanciation sociale

Au cours des derniers mois, le monde souffre de la pandémie de COVID-19. On constate que tant que le vaccin contre la maladie n'est pas disponible, Nous devons tous prendre les mesures de précaution en utilisant des désinfectants pour les mains, masque et le plus important est le suivi de la distanciation sociale.

La technologie de vision par ordinateur peut jouer un rôle essentiel dans ce scénario crucial. Il peut être utilisé pour suivre les personnes dans un local ou une zone particulière pour savoir si elles suivent ou non les règles de distanciation sociale.

L'outil de distanciation sociale est une application de détection et de suivi d'objets en temps réel. Dans ce cas, pour vérifier la violation de la distanciation sociale, nous détectons chaque personne présente dans la vidéo au moyen d'un cadre de délimitation. Plus tard, nous suivons le mouvement de chaque boîte dans le cadre et calculons la distance entre elles. Si vous détectez une violation de la règle de distanciation sociale, mettre en surbrillance ces cadres de délimitation.

socialdist-1-4151528

En outre, pour rendre ces outils plus avancés et précis, peut utiliser des techniques d'apprentissage par transfert. Divers modèles de détection d'objets préalablement formés tels que YOLO O Mascara R-CNN ils sont aussi là.

L'article suivant vous aide à créer un outil de distanciation sociale pour vous-même.:

Créer un modèle 3D à partir d'images 2D

Voici une autre application très intéressante de la vision par ordinateur. Vous convertissez des images bidimensionnelles en modèles 3D. Par exemple, imaginez que vous avez une photographie de votre collection précédente et vous pouvez la transformer en modèle 3D et l'inspecter comme si vous y étiez.

facebook_3d-300x158-3953062

la source: https: //petapixel.com/2020/02/28/facebook-now-lets-you-turn-any-2d-photo-into-a-3d-image-using-ai

Des chercheurs de Deep Mind ont créé un système d'intelligence artificielle qui fonctionne de la même manière. Il est connu comme Les résolutions génératives de Red, Peut percevoir des images sous différents angles comme les humains.

En outre, Nvidia a développé une architecture d'intelligence artificielle capable de prédire les propriétés 3D à partir d'une image. de la même manière, Facebook AI propose un outil similaire appelé Fonction photo 3D.

Voici quelques ensembles de données pertinents que vous pouvez expérimenter.:

En outre, Chèque sommes articles intéressants pour en savoir plus sur l'application.

Applications

Maintenant, vous devez penser aux cas d'utilisation de cette technologie. Voici ses applications:

  • Animations et jeux
  • Robotique
  • Voitures autonomes
  • Diagnostic médical et opérations chirurgicales.

Vision par ordinateur dans les soins de santé: analyse d'images médicales

Depuis très longtemps, les images médicales assistées par ordinateur sont utilisées pour le diagnostic, comme les tomodensitogrammes, rayons X, etc. En outre, les développements récents des technologies de vision par ordinateur permettent aux cliniciens de mieux les comprendre en les transformant en modèles 3D interactifs et en facilitant leur interprétation.

Si nous regardons le dernier cas d'utilisation de la vision par ordinateur, nous découvrirons que vous détectez des cas de COVID-19 à l'aide d'une radiographie pulmonaire. En outre, selon une étude de Service de radiologie, Wuhan, les méthodes d'apprentissage en profondeur peuvent être utilisées efficacement pour distinguer Covid-19 de la pneumonie communautaire.

Revoir le Radiographie pulmonaire COVID -19 Ensemble de données Kaggle et mettez la main à la pâte sur la mise en œuvre.

cv2-1-300x169-1257902

Pendant, si vous voulez travailler sur un autre jeu de données, possède Images CT médicales aussi disponible chez Kaggle. En outre, si vous souhaitez en savoir plus sur l'imagerie médicale et ses applications dans le domaine de la santé, Léa sommes travaux de recherche et leurs réalisations.

Remarques finales

En résumé, la vision par ordinateur est un domaine fascinant de l'intelligence artificielle. Nommez le domaine et vous y obtiendrez une demande de CV. Dans cet article, J'ai parlé de certains d'entre eux que j'ai trouvé intéressants. Mais ce n'est que la pointe de l'iceberg.

Si vous souhaitez savoir comment faire carrière dans la vision par ordinateur, Lisez ce qui suit-

C'est maintenant à votre tour de commencer à mettre en œuvre vous-même la vision par ordinateur.. N'oubliez pas de partager votre application de vision industrielle préférée dans la zone de commentaires.

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.