25 statistiques de reconnaissance d'images pour dévoiler les pixels derrière la technologie

Publié: 2023-10-09

Les ordinateurs modernes apprennent à voir de la même manière que les humains, et la technologie de reconnaissance d’images rend cela possible.

Les réseaux de neurones sont au cœur de cette technologie. Il apprend des données et reconnaît des modèles. À mesure que vous fournissez davantage de données sur les objets, les visages et même les émotions, vous améliorez votre capacité à « voir » et à comprendre une image.

La reconnaissance d'images est un sous-ensemble de la vision par ordinateur et de l'intelligence artificielle (IA). Il comprend des techniques et des algorithmes qui étiquetent et catégorisent le contenu d'une image.

À la base, la technologie commence seulement à évoluer, mais de nombreuses organisations ont déjà commencé à utiliser des logiciels de reconnaissance d'images pour former des modèles et ajouter des fonctionnalités de reconnaissance d'images sur d'autres plates-formes logicielles. De nos jours, la reconnaissance d’images aide au diagnostic médical, à la recherche de personnes perdues et même à la réalisation de voitures autonomes.

Le potentiel du marché est vaste et il est en constante expansion pour pénétrer de nouveaux secteurs. Explorons ces statistiques et voyons les nouveautés en matière de reconnaissance d'images.

Statistiques du marché de la reconnaissance d'images

Le marché de la reconnaissance d'images connaît une croissance rapide et devient populaire dans les secteurs de la vente au détail, de la santé et de la sécurité. L’intelligence artificielle et l’apprentissage automatique sont les principaux moteurs de la croissance du marché. Sur la base des statistiques ci-dessous, toute opportunité sur le marché de la reconnaissance d’images pourrait être prometteuse entre 2023 et 2030.

Voyez à quoi ressemblent les statistiques.

  • Le marché mondial de la reconnaissance d’images devrait afficher un taux de croissance annuel composé (TCAC) de 10,42 % de 2023 à 2030.
  • La taille du marché américain de la reconnaissance d’images devrait être la plus importante, évaluée à 3,94 milliards de dollars en 2023.

10,53 milliards de dollars

est la valeur projetée du marché de la reconnaissance d’images pour 2023.

Source : Statista

  • La taille du marché nord-américain de la reconnaissance d’images a augmenté de 11,86 % en 2023.
  • Le marché australien de la reconnaissance d'images devrait atteindre 280 millions de dollars en 2023.
  • L’Amérique du Sud affiche une augmentation significative de la taille du marché de 20,26 % en 2023.
  • La taille du marché mondial de la reconnaissance d’images par l’IA était évaluée à 3 330,67 millions de dollars en 2022 et devrait croître à un TCAC de 24,91 % pour atteindre 12 652,88 millions en 2028.
  • Le marché de la reconnaissance d’images en Asie est relativement plus petit, avec une taille de 2,57 milliards de dollars en 2023.
  • La taille du marché de la reconnaissance d'images en Europe centrale et occidentale est encore plus petite, à 1,88 milliard de dollars en 2023.
  • Le TCAC attendu du marché américain de la reconnaissance d’images de 2023 à 2030 est de 7,86 %.

Statistiques sur la technologie de reconnaissance d'images

L’apprentissage profond joue un rôle majeur dans la technologie de reconnaissance d’images. Les modèles d'apprentissage en profondeur populaires tels que You Only Look Once (YOLO) et Single-Shot Detector (SSD) utilisent des couches de convolution pour analyser des images ou des photographies numériques. Les techniques et modèles d’apprentissage profond continueront de s’améliorer en 2023, rendant la reconnaissance d’images plus simple et plus précise.

De plus, des algorithmes tels que la transformation des fonctionnalités invariantes d'échelle (SIFT), les fonctionnalités robustes accélérées (SURF) et les modèles de reconnaissance d'image par analyse des composants principaux (PCA) lisent, traitent et fournissent.

L’écosystème technologique autour de la reconnaissance d’images évolue rapidement. Ces statistiques vous tiendront au courant des dernières nouveautés technologiques.

  • Le laboratoire d'informatique et d'intelligence artificielle (CSAIL) du MIT a développé un encodeur génératif masqué (MAGE) pour déduire les parties manquantes d'une image. Il a atteint une précision de 80,9 % en sondage linéaire et a correctement identifié les images dans 71,9 % des cas lorsqu'on lui a donné dix exemples étiquetés de chaque classe.
  • Object365, un ensemble de données de détection d'objets à grande échelle, a été formé avec plus de 600 000 images.

1 000 images

de chaque classe sont nécessaires pour former des systèmes capables de détecter et de reconnaître des images et des objets.

Source : IBM

  • 1 à 2 mégapixels est idéal lorsque les images n'ont pas besoin de détails fins pour la détection d'objets. Si les images nécessitent des détails fins, elles sont divisées en images de 1 à 2 mégapixels chacune.
  • Les systèmes de reconnaissance d’images volumineux et puissants peuvent gérer 1 000 images par seconde (FPS). À l’inverse, les systèmes de reconnaissance d’images courants traitent à 100 FPS.
  • Le plus grand ensemble de données accessible au public pour la formation de modèles de reconnaissance d'images est IMDB-Wiki, avec plus de 500 000 images de visages humains.
  • Le Berkeley Deep Drive (BDD110K) est le plus grand ensemble de données vidéo de conduite variées. Il contient plus de 100 000 vidéos annotées pour les tâches de perception en conduite autonome.
  • La reconnaissance d'image se compose de trois couches : entrée, masquée et sortie. La couche d'entrée capte le signal, la couche cachée le traite et la couche de sortie décide de quoi il s'agit.
  • Une image couleur a une profondeur de bits allant de 8 à 24 ou plus. Dans une image 24 bits, il existe trois groupes : 8 pour le rouge, 8 pour le vert et 8 pour le bleu. La combinaison de ces bits représente d'autres couleurs.
  • 4 statistiques de premier ordre (moyenne, variance, asymétrie et aplatissement) et 5 statistiques de second ordre (second moment angulaire, contraste, corrélation, homogénéité et entropie) représentent les caractéristiques textuelles d'une image.

Statistiques de précision du système de reconnaissance d'images

Avec les réseaux de neurones convolutifs (CNN), le niveau de précision de la reconnaissance d'images a augmenté. Néanmoins, des défis tels que la déformation, la variation des objets au sein d'une même classe et l'occlusion peuvent affecter la précision du système. (L'occlusion se produit lorsqu'un objet cache une partie d'un autre objet dans l'image.)

Malgré ces inconvénients potentiels, les systèmes de reconnaissance d’images affichent des niveaux de certitude incroyablement élevés. Explorez ces statistiques pour comprendre la précision que vous pouvez attendre d'un logiciel de reconnaissance d'images et quelle est la marge d'erreur.

  • Le taux d'erreur moyen sur tous les ensembles de données en reconnaissance d'images est de 3,4 %.
  • Le taux d'erreur du top 5 en reconnaissance d'images fait référence au pourcentage de fois où une étiquette cible n'apparaît pas parmi les cinq prédictions les plus probables. De nombreuses techniques ne peuvent pas descendre en dessous de 25 %.

6%

est le taux d’erreur moyen de l’ensemble de données ImageNet, largement utilisé dans les systèmes de reconnaissance d’images développés par Google et Facebook.

Source : MIT

  • Le niveau de précision approximatif des outils de reconnaissance d'images est de 95 %. Cela est dû au développement de CNN et d’autres réseaux de neurones profonds basés sur des fonctionnalités.
  • YOLOv7 est le modèle de détection d'objets en temps réel précis le plus efficace pour les tâches de vision par ordinateur.

Sources:

  • Statiste
  • Yahoo
  • IBM
  • Tout sur les circuits
  • Visuel
  • Altexsoft
  • V7labs
  • HackerMidi

Des pixels aux motifs

Les statistiques ci-dessus montrent clairement que le marché de la reconnaissance d'images est sur une trajectoire de croissance de 2023 à 2030. La technologie évolue et augmente sa précision avec de nouvelles mises à jour et avancées. Mais cette croissance ne se limite pas à la reconnaissance d’images. L’ensemble du domaine de la vision par ordinateur connaît une expansion en termes de taille de marché et d’adoption. À mesure que la valeur marchande augmente, les entreprises qui trouvent leur place dans le secteur de la reconnaissance d’images en bénéficieront.

Apprenez-en davantage sur la vision par ordinateur et comprenez comment les machines interprètent le monde visuel.