Vue d'ensemble
- La vision par ordinateur est la technologie qui permet au monde numérique d'interagir avec le monde réel.
- Explorer 5 des applications de vision par ordinateur les plus populaires
- Estimation de pose à l'aide de la vision artificielle
- Transformation d'image à l'aide de Gans
- Vision par ordinateur pour le développement d'outils de distanciation sociale
- Conversion d'images 2D en modèles 3D
- Analyse d'images médicales
J'ai commencé à utiliser Facebook il y a 10 ans. en outre, si vous l'avez utilisé il y a longtemps, vous devez vous rappeler le marquage manuel des photos. Mais maintenant, nous n'avons plus besoin de marquer ces images manuellement. Facebook reconnaît la plupart des personnes dans l'image téléchargée et propose des suggestions pour les marquer. De la même manière, vous devez avoir vu ces filtres amusants sur Snapchat où les gens utilisent le filtre pour chien et mettent une tête de chien. Vous êtes-vous déjà demandé comment tout cela est possible? Comment notre téléphone peut-il détecter notre visage et y ajouter des filtres? Ce sont quelques-unes des applications de la vision artificielle.
La vision par ordinateur est l'un des domaines de recherche les plus en vogue dans le monde de la science des données. En outre, fait désormais partie de notre vie personnelle. Consciemment ou inconsciemment, nous utilisons tous diverses fonctions qui ont des techniques de vision par ordinateur en cours d'exécution dans le backend. Par exemple, nous utilisons Face Unlock sur nos smartphones. L'image suivante explique efficacement le fonctionnement de la détection de visage.
La source: https://www.pinterest.com
Je choisis la détection de visage pour commencer cet article, puisqu'il s'agit de la seule application de vision par ordinateur que nous ayons tous vue. Mais crois moi, la vision par ordinateur ne se limite pas à cela. Dans cet article, explorer des applications plus intéressantes de la vision par ordinateur.
Si vous cherchez à maîtriser la vision par ordinateur, consultez notre cours Vision par ordinateur utilisant l'apprentissage en profondeur 2.0
Table des matières
- Qu'est-ce que la vision par ordinateur?
- Estimation de pose à l'aide de la vision artificielle
- Transformation d'image à l'aide de Gans
- Vision par ordinateur pour le développement d'outils de distanciation sociale
- Conversion d'images 2D en modèles 3D
- Analyse d'images médicales
Qu'est-ce que la vision par ordinateur?
Avant d'entrer dans le monde des applications de vision par ordinateur, premier, comprenons ce qu'est la vision par ordinateur. En résumé, la vision par ordinateur est une branche multidisciplinaire de l'intelligence artificielle qui tente de reproduire les puissantes capacités de la vision humaine.
Si nous passons par la définition formelle,
“La vision par ordinateur est un utilitaire qui prend des décisions utiles sur des objets physiques réels et des scènes basées sur des images détectées” (Sockman et Shapiro, 2001)
La vision par ordinateur fonctionne grâce à des techniques de reconnaissance visuelle telles que la classification d'images, détection d'objets, segmentationLa segmentation est une technique de marketing clé qui consiste à diviser un large marché en groupes plus petits et plus homogènes. Cette pratique permet aux entreprises d’adapter leurs stratégies et leurs messages aux spécificités de chaque segment, améliorant ainsi l’efficacité de vos campagnes. Le ciblage peut se faire sur des critères démographiques, Psychographique, géographique ou comportementale, Faciliter une communication plus pertinente et personnalisée avec le public cible.... de imágenes, suivi d'objet, reconnaissance optique de caractères, légendes des images, etc. Je sais que ce sont beaucoup de termes techniques, mais les comprendre n'est pas difficile. Il suffit de regarder l'image ci-dessous et vous comprendrez bon nombre de ces terminologies.
la source: https: //www.oreilly.com/library/view/python-advanced-guide
Commençons par la première image. Si je te demande, qu'est-ce qu'il y a sur la photo? Votre réponse sera, c'est un chat. C'est le classement. Cela signifie marquer l'image en fonction de son classement.. Ici, la classe est 'Cat'.
Vous connaissez maintenant la classe de l'image. La question suivante est de savoir où se trouve l'objet dans l'image. Lorsque nous identifions l'emplacement de l'objet dans le cadre et créons un cadre de délimitation autour de celui-ci, C'est ce qu'on appelle l'emplacement. Dans la deuxième image, nous identifions l'emplacement de l'objet et l'identifions comme un chat.
Le terme suivant est la détection d'objets. Dans les deux cas précédents, nous n'avons qu'un seul objet dans l'image, mais que faire s'il y a plusieurs objets présents? Ici, nous identifions les instances présentes et leur emplacement à l'aide de cadres de délimitation.
Sur la détection d'objets, nous utilisons une boîte englobante de forme carrée ou rectangulaire, mais ça ne dit rien sur la forme des objets. La segmentation d'instance crée un masque de pixels autour de chaque objet. Donc, la segmentation des instances permet de mieux comprendre l'image.
Consultez les ressources suivantes pour en savoir plus sur la vision par ordinateur-
DEVELOPPEMENTS récents
Los desarrollos recientes en los enfoques de l'apprentissage en profondeurL'apprentissage en profondeur, Une sous-discipline de l’intelligence artificielle, s’appuie sur des réseaux de neurones artificiels pour analyser et traiter de grands volumes de données. Cette technique permet aux machines d’apprendre des motifs et d’effectuer des tâches complexes, comme la reconnaissance vocale et la vision par ordinateur. Sa capacité à s’améliorer continuellement au fur et à mesure que de nouvelles données lui sont fournies en fait un outil clé dans diverses industries, de la santé... y los avances en la tecnología han aumentado enormemente las capacidades de los sistemas de reconocimiento visual. Par conséquent, les entreprises ont rapidement adopté la vision par ordinateur. Des cas d'utilisation réussis de la vision par ordinateur peuvent être observés dans les secteurs industriels, ce qui conduit à une mise à l'échelle des applications et à une demande croissante d'outils de vision par ordinateur..
À présent, sans perdre plus de temps, passons à 5 applications passionnantes de la vision par ordinateur.
Estimation de la posture humaine
L'estimation de la posture humaine est une application intéressante de la vision par ordinateur. Vous devez avoir entendu parler Posenet, qui est un modèle open source pour estimer la pose humaine. En résumé, l'estimation de pose est une technique de vision par ordinateur pour déduire la pose d'une personne ou d'un objet présent dans l'image / vidéo.
Avant de discuter du fonctionnement de l'estimation de pose, Commençons par comprendre le « Squelette de pose humaine ». C'est l'ensemble des coordonnées pour définir la pose d'une personne. Une paire de coordonnées est connue sous le nom de membre. En outre, l'estimation de la pose est réalisée en identifiant, localiser et suivre les points clés du squelette de la pose humaine dans une image ou une vidéo.
la source: https: //www.researchgate.net/publication/338905462_The_'DEEP'_Landing_Error_Scoring_System
Voici quelques-unes des applications de l'estimation de la pose humaine:
- Reconnaissance d'activité pour l'analyse sportive en temps réel ou le système de surveillance.
- Pour des expériences de réalité augmentée
- Dans entraînementLa formation est un processus systématique conçu pour améliorer les compétences, connaissances ou aptitudes physiques. Il est appliqué dans divers domaines, Comme le sport, Éducation et développement professionnel. Un programme d’entraînement efficace comprend la planification des objectifs, Pratique régulière et évaluation des progrès. L’adaptation aux besoins individuels et la motivation sont des facteurs clés pour obtenir des résultats réussis et durables dans toutes les disciplines.... de Robots
- Animations et jeux
Voici quelques ensembles de données si vous souhaitez développer vous-même un modèle d'estimation de pose:
j'ai trouvé Pose profonde de Google comme un document de recherche très intéressant qui utilise des modèles d'apprentissage en profondeur pour l'estimation des poses. Pour aller plus loin, vous pouvez visiter diverses enquêtes documents disponible en pose devis
Transformation d'image à l'aide de GAN:
Faceapp est une application très intéressante et à la mode parmi les gens. C'est un outil de manipulation d'image et transforme l'image d'entrée à l'aide de filtres. Les filtres peuvent inclure un filtre d'âge ou d'échange d'un genre récent.
la source: https: //comicbook.com/marvel/news/marvel-men-faceapp-gender-swap/#18
Regardez l'image ci-dessus, vérité? Il y a quelques mois, c'était un sujet brûlant sur Internet. Les gens partageaient des photos après avoir changé de sexe. Mais, Quelle est la technologie derrière ces applications? Oui, tu l'as bien deviné, Vision par ordinateur, Pour être plus précis, leurs réseaux génératifs contradictoires de convolution profonde.
Réseaux génératifs antagonistes communément appelés GAN est une innovation passionnante dans le domaine de la vision par ordinateur. Bien que les GAN soient un vieux concept, sous sa forme actuelle a été proposé par Ian Goodfellow dans 2014. Depuis, il a connu de nombreux développements.
La formation GAN implique deux réseaux de neurones se faisant face pour générer de nouvelles données basées sur la distribution des données de formation données. Aunque originalmente se propuso como un mecanismo de aprendizaje no supervisadoEl aprendizaje no supervisado es una técnica de machine learning que permite a los modelos identificar patrones y estructuras en datos sin etiquetas predefinidas. A través de algoritmos como k-means y análisis de componentes principales, este enfoque se utiliza en diversas aplicaciones, como la segmentación de clientes, la detección de anomalías y la compresión de datos. Su capacidad para revelar información oculta lo convierte en una herramienta valiosa en la..., las GAN han demostrado ser un buen candidato para el enseignement superviséL’apprentissage supervisé est une approche d’apprentissage automatique dans laquelle un modèle est formé à l’aide d’un ensemble de données étiquetées. Chaque entrée du jeu de données est associée à une sortie connue, permettre au modèle d’apprendre à prédire les résultats pour de nouvelles entrées. Cette méthode est largement utilisée dans des applications telles que la classification d’images, Reconnaissance vocale et prédiction de tendances, soulignant son importance dans... y semi-supervisado.
Pour en savoir plus sur le fonctionnement du Gans, voir article ci-dessous.
Voici quelques articles de recherche à lire absolument sur le GAN que je recommande personnellement:
Voici quelques ensembles de données pour vous aider à acquérir une expérience pratique avec les GAN:
Applications
Quand il s'agit de discuter des applications de Gans Imaging, nous avons beaucoup. Voici quelques-unes de ses applications:
- Traduction image à image en transfert de style et photo en peinture
- super résolutionLa "résolution" fait référence à la capacité de prendre des décisions fermes et d’atteindre les objectifs fixés.. Dans des contextes personnels et professionnels, Il s’agit de définir des objectifs clairs et d’élaborer un plan d’action pour les atteindre. La résolution est essentielle à la croissance personnelle et à la réussite dans divers domaines de la vie, car cela vous permet de surmonter les obstacles et de rester concentré sur ce qui compte vraiment.... de imagen
- Génération de texte en image
- L'édition d'image
- Traduction sémantique d'image en photo
Si vous trouvez quelque chose de plus intéressant, faites le moi savoir dans la section commentaire.
La vision par ordinateur pour développer des outils de distanciation sociale
Au cours des derniers mois, le monde souffre de la pandémie de COVID-19. On constate que tant que le vaccin contre la maladie n'est pas disponible, Nous devons tous prendre les mesures de précaution en utilisant des désinfectants pour les mains, masque et le plus important est le suivi de la distanciation sociale.
La technologie de vision par ordinateur peut jouer un rôle essentiel dans ce scénario crucial. Il peut être utilisé pour suivre les personnes dans un local ou une zone particulière pour savoir si elles suivent ou non les règles de distanciation sociale.
L'outil de distanciation sociale est une application de détection et de suivi d'objets en temps réel. Dans ce cas, pour vérifier la violation de la distanciation sociale, nous détectons chaque personne présente dans la vidéo au moyen d'un cadre de délimitation. Plus tard, nous suivons le mouvement de chaque boîte dans le cadre et calculons la distance entre elles. Si vous détectez une violation de la règle de distanciation sociale, mettre en surbrillance ces cadres de délimitation.
En outre, pour rendre ces outils plus avancés et précis, peut utiliser des techniques d'apprentissage par transfert. Divers modèles de détection d'objets préalablement formés tels que YOLO O Mascara R-CNN ils sont aussi là.
L'article suivant vous aide à créer un outil de distanciation sociale pour vous-même.:
Créer un modèle 3D à partir d'images 2D
Voici une autre application très intéressante de la vision par ordinateur. Vous convertissez des images bidimensionnelles en modèles 3D. Par exemple, imaginez que vous avez une photographie de votre collection précédente et vous pouvez la transformer en modèle 3D et l'inspecter comme si vous y étiez.
la source: https: //petapixel.com/2020/02/28/facebook-now-lets-you-turn-any-2d-photo-into-a-3d-image-using-ai
Des chercheurs de Deep Mind ont créé un système d'intelligence artificielle qui fonctionne de la même manière. Il est connu comme Les résolutions génératives de Red, Peut percevoir des images sous différents angles comme les humains.
En outre, Nvidia a développé une architecture d'intelligence artificielle capable de prédire les propriétés 3D à partir d'une image. de la même manière, Facebook AI propose un outil similaire appelé Fonction photo 3D.
Voici quelques ensembles de données pertinents que vous pouvez expérimenter.:
En outre, Chèque sommes articles intéressants pour en savoir plus sur l'application.
Applications
Maintenant, vous devez penser aux cas d'utilisation de cette technologie. Voici ses applications:
- Animations et jeux
- Robotique
- Voitures autonomes
- Diagnostic médical et opérations chirurgicales.
Vision par ordinateur dans les soins de santé: analyse d'images médicales
Depuis très longtemps, les images médicales assistées par ordinateur sont utilisées pour le diagnostic, comme les tomodensitogrammes, rayons X, etc. En outre, les développements récents des technologies de vision par ordinateur permettent aux cliniciens de mieux les comprendre en les transformant en modèles 3D interactifs et en facilitant leur interprétation.
Si nous regardons le dernier cas d'utilisation de la vision par ordinateur, nous découvrirons que vous détectez des cas de COVID-19 à l'aide d'une radiographie pulmonaire. En outre, selon une étude de Service de radiologie, Wuhan, les méthodes d'apprentissage en profondeur peuvent être utilisées efficacement pour distinguer Covid-19 de la pneumonie communautaire.
Revoir le Radiographie pulmonaire COVID -19 Ensemble de données Kaggle et mettez la main à la pâte sur la mise en œuvre.
Pendant, si vous voulez travailler sur un autre jeu de données, possède Images CT médicales aussi disponible chez Kaggle. En outre, si vous souhaitez en savoir plus sur l'imagerie médicale et ses applications dans le domaine de la santé, Léa sommes travaux de recherche et leurs réalisations.
Remarques finales
En résumé, la vision par ordinateur est un domaine fascinant de l'intelligence artificielle. Nommez le domaine et vous y obtiendrez une demande de CV. Dans cet article, J'ai parlé de certains d'entre eux que j'ai trouvé intéressants. Mais ce n'est que la pointe de l'iceberg.
Si vous souhaitez savoir comment faire carrière dans la vision par ordinateur, Lisez ce qui suit-
C'est maintenant à votre tour de commencer à mettre en œuvre vous-même la vision par ordinateur.. N'oubliez pas de partager votre application de vision industrielle préférée dans la zone de commentaires.
En rapport
Articles Similaires:
- Apprendre la vision par ordinateur | Parcours d'apprentissage de la vision industrielle
- Vision par ordinateur avec OpenCV et Python
- Applications de la science des données | Applications de la science des données et de l'intelligence artificielle dans le monde réel
- Où se trouve l'onglet Applications dans iTunes ou comment accéder à l'App Store dans iTunes sur votre ordinateur? 3 formes