Nvidia Maxine : traduction d'appels vidéo en temps réel alimentée par l'IA

Publié: 2021-04-27

Nvidia Corporation, le géant du traitement graphique basé en Californie, a récemment dévoilé une nouvelle fonctionnalité appelée Nvidia Maxine. Nvidia Maxine est une innovation de pointe qui combine l'intelligence artificielle avec la technologie d'appel vidéo pour créer un logiciel qui aide à exécuter diverses fonctions qui améliorent la qualité et la vitesse de la vidéo. Il peut être utilisé comme outil pour d'autres logiciels d'appel vidéo afin de réduire leur imprécision.

Il comprend de nombreuses fonctionnalités telles que l'amélioration graphique automatique, l'alignement automatique du visage et la traduction automatique de la langue - tous les services qui pourraient faire de l'appel vidéo un événement pratiquement sans erreur. Plus important encore, la fonction d'amélioration graphique pourrait avoir des effets considérables pour les zones sous-développées qui fonctionnent avec une bande passante faible.

Table des matières afficher
  • Qu'est-ce que Nvidia Maxine ?
  • Qu'est-ce que la fonctionnalité de traduction d'appels vidéo en temps réel de Nvidia ?
  • Comment fonctionne Nvidia Maxine ?
  • Est-ce que ça vaut le battage médiatique ?
  • Derniers mots

Qu'est-ce que Nvidia Maxine ?

question-requête-penser-penser-plan

Nvidia Maxine est un ensemble d'outils d'amélioration vidéo développés par Nvidia Corporation et dévoilés en octobre 2020 lors de la GPU Technology Conference (une conférence mondiale organisée par Nvidia pour promouvoir les discussions sur les développements de l'intelligence artificielle avec les meilleurs ingénieurs, développeurs et innovateurs du monde dans présence). Il s'agit d'un ajout révolutionnaire au monde de la transmission vidéo qui corrige les inexactitudes ou les problèmes qui peuvent survenir dans les appels téléphoniques à un degré qui pourrait complètement réorganiser la façon dont nous opérons les appels vidéo.

Certaines des fonctionnalités de Nvidia Maxine qui attirent rapidement l'attention sur elles-mêmes dans la communauté de l'IA sont celles avec lesquelles il est automatiquement capable de construire et de déconstruire des visages, des arrière-plans, des bruits et même des traits du visage.

Pour l'instant, ces outils d'amélioration des appels vidéo sont en vente pour les éditeurs de logiciels qui souhaitent intégrer la technologie dans leurs programmes, mais son succès pourrait signifier que les fonctionnalités pourraient bientôt devenir largement disponibles.

Recommandé pour vous : L'art de la conférence téléphonique : comment organiser des réunions en ligne efficaces.

Qu'est-ce que la fonctionnalité de traduction d'appels vidéo en temps réel de Nvidia ?

apprentissage-en-ligne-éducation-chat-vidéo-conférence-réunion

Nvidia Maxine est livré avec une unité de traduction linguistique capable de traduire un appel vidéo depuis et vers n'importe quelle langue en quelques secondes. Cette invention pourrait s'avérer extrêmement bénéfique pour les pays qui font des affaires avec des étrangers.

Cela pourrait s'avérer particulièrement utile pour des pays comme la Chine et la plupart des pays européens, ceux qui entretiennent des relations commerciales saines avec la plupart des pays mais ne parlent pas l'anglais comme langue officielle. Cela contribuera à renforcer les liens commerciaux et entraînera des changements économiques et financiers massifs dans les pays qui l'emploient.

Une autre chose qui distingue cette fonctionnalité des autres fonctionnalités telles que Google Traduction est sa capacité à traduire les conversations et ses dialogues en temps réel. Cela signifie qu'il n'y aura pas de pauses gênantes dans les appels vidéo étrangers lorsqu'un traducteur humain se lance dans une traduction détournée ou lorsque quelqu'un tâtonne avec Google Translate pour comprendre ce qui se dit.

Travailler avec des entreprises étrangères sans langue commune a toujours été une tâche difficile, mais avec la pandémie de COVID-19 au plus fort de sa deuxième vague, cette tâche est devenue beaucoup plus difficile avec des réunions menées à distance à l'aide d'applications comme Zoom et Skype. Les trames gelées et les transmissions vocales glitchées en raison de la lenteur des connexions Internet sont monnaie courante, mais celles-ci font de la tenue de réunions en langues étrangères une tâche ardue. Nvidia Maxine est présentée comme quelque chose qui aidera ses utilisateurs à se débarrasser de tous ces inconvénients gênants grâce à sa fonction de traduction d'appels vidéo en temps réel, ce qui en fait une invention qui n'aurait pas pu arriver à un meilleur moment.

Comment fonctionne Nvidia Maxine ?

IA-intelligence-artificielle-code-script-conception-développement

L'élément clé de la vitesse à laquelle Nvidia Maxine traduit spontanément les langues est son utilisation de l'intelligence artificielle (IA) pour discerner les modèles de parole et les voix afin de traduire la phrase dans la langue sélectionnée en un minimum de temps.

Maxine de Nvidia utilise quelque chose appelé « apprentissage en profondeur » pour obtenir la plupart des effets fournis par ses outils. L'apprentissage en profondeur est un type populaire d'apprentissage par IA appelé apprentissage automatique qui a été développé pour la première fois en 2012 et est la technologie derrière la plupart des applications de reconnaissance faciale, des fonctionnalités de traduction et des systèmes de recommandation de contenu.

Les outils inclus dans la gamme de Nvidia Maxine incluent jusqu'à présent la conversion de vidéos basse résolution en vidéos haute résolution par le biais de l'IA, l'alignement automatique des visages, la réduction du bruit et, bien sûr, la fonction de traduction qui fonctionne en temps réel. Ces outils seront bénéfiques pour les personnes ayant des connexions Internet instables, des lieux de travail bruyants et des barrières linguistiques lors de réunions à distance.

Outre la fonction de traduction en temps réel, l'outil le plus attrayant de Nvidia Maxine est sa promesse de réduire la bande passante requise pour une transmission vidéo fluide des images haute définition. En termes simples, la dernière invention du géant du GPU fonctionne sur le principe qu'il n'est pas nécessaire de transmettre l'intégralité des informations visuelles dans une vidéo pour obtenir des images haute définition de l'autre côté. Maxine fonctionne en n'envoyant que certains points spécifiques de n'importe quelle image, puis en comblant les lacunes par elle-même à l'aide de sa technologie d'intelligence artificielle (IA).

Est-ce que ça vaut le battage médiatique ?

intelligence-artificielle-apprentissage-machine-iot-ai-web-design-development

L'invention de Nvidia soulève des questions sur l'éthique de la manipulation artificielle des appels vidéo, citant l'augmentation de l'incidence des imposteurs qui trompent les gens en leur faisant croire qu'ils sont de la famille ou des amis et pêchent derrière les doutes. De plus, le débat restera ouvert sur la traduction humaine par rapport à la traduction automatique, au moins pendant encore quelques jours.

Cependant, la pandémie de COVID-19 a limité une grande majorité de la population mondiale au travail à domicile. Cet événement a entraîné une augmentation rapide du taux de téléchargements des logiciels et applications d'appel vidéo au cours des derniers mois. Cela montre à quel point une fonctionnalité d'appel vidéo et, par extension, Nvidia Maxine est importante pour l'avenir des réunions à distance et du travail de bureau virtuel.

En dehors de cela, le statut de Nvidia en tant qu'entreprise qui fournit une technologie de pointe à toutes sortes d'utilisateurs d'ordinateurs, des joueurs aux développeurs de logiciels, confère à cette entreprise une crédibilité en raison de la capacité financière de Nvidia Corporation à rechercher et à produire en masse ces outils pour le profit de ses utilisateurs.

Cependant, quelque chose qui peut s'avérer être un point de consternation pour certains utilisateurs peut être le besoin de Maxine d'avoir un GPU Nvidia pour que cela fonctionne. Les représentants de Nvidia ne l'ont pas encore confirmé.

Vous pourriez également aimer : 10 logiciels de montage vidéo à utiliser, des débutants aux professionnels.

Derniers mots

nvidia-maxine-ai-traduction-d'appel-vidéo-en-temps-réel-conclusion

Il reste maintenant à voir si d'autres géants de l'appel vidéo tels que Zoom et Microsoft achètent la technologie de Nvidia Maxine ou développent les leurs pour compléter leurs applications d'appel vidéo. Avec des améliorations technologiques autour de chaque bloc, il peut être difficile de suivre le rythme. Les sociétés de traduction peuvent aider votre logiciel à s'adapter aux besoins de vos clients. Ils vous aident même à localiser votre logiciel dans plus de 100 langues.