Nvidia Maxine: KI-gestützte Echtzeit-Videoanrufübersetzung
Veröffentlicht: 2021-04-27Nvidia Corporation, der in Kalifornien ansässige Grafikverarbeitungsriese, hat kürzlich eine neue Funktion namens Nvidia Maxine vorgestellt. Nvidia Maxine ist eine hochmoderne Innovation, die künstliche Intelligenz mit Videoanruftechnologie kombiniert, um Software zu entwickeln, die dabei hilft, verschiedene Funktionen auszuführen, die die Videoqualität und -geschwindigkeit verbessern. Es kann als Tool für andere Videoanrufsoftware verwendet werden, um deren Ungenauigkeit zu verringern.
Es umfasst viele Funktionen wie automatische Grafikverbesserung, automatische Gesichtsausrichtung und automatische Sprachübersetzung – alles Dienste, die den Videoanruf zu einem nahezu fehlerfreien Ereignis machen könnten. Am wichtigsten ist, dass die Grafikverbesserungsfunktion weitreichende Auswirkungen auf unterentwickelte Gebiete mit geringer Bandbreite haben könnte.
- Was ist Nvidia Maxine?
- Was ist die Echtzeit-Videoanruf-Übersetzungsfunktion von Nvidia?
- Wie funktioniert Nvidia Maxine?
- Ist es den Hype wert?
- Letzte Worte
Was ist Nvidia Maxine?
Nvidia Maxine ist eine Reihe von Tools zur Videoverbesserung, die von der Nvidia Corporation entwickelt und im Oktober 2020 auf der GPU Technology Conference vorgestellt wurden (einer globalen Konferenz, die von Nvidia organisiert wird, um Diskussionen über Entwicklungen in der künstlichen Intelligenz mit den weltweit besten Ingenieuren, Entwicklern und Innovatoren zu fördern). Teilnahme). Es handelt sich um eine revolutionäre Ergänzung der Welt der Videoübertragung, die Ungenauigkeiten oder Störungen, die bei Telefongesprächen auftreten können, in einem Ausmaß korrigiert, dass die Art und Weise, wie wir Videogespräche führen, völlig neu gestaltet werden könnte.
Einige der Funktionen von Nvidia Maxine, die in der KI-Community schnell Aufmerksamkeit erregen, sind diejenigen, mit denen es automatisch Gesichter, Hintergründe, Geräusche und sogar Gesichtszüge konstruieren und dekonstruieren kann.
Derzeit stehen diese Tools zur Verbesserung von Videoanrufen an Softwareunternehmen zum Verkauf, die die Technologie möglicherweise in ihre Programme integrieren möchten. Der Erfolg könnte jedoch bedeuten, dass die Funktionen bald allgemein verfügbar sein werden.
Für Sie empfohlen: Die Kunst der Telefonkonferenz: So führen Sie effektive Online-Meetings durch.
Was ist die Echtzeit-Videoanruf-Übersetzungsfunktion von Nvidia?
Nvidia Maxine verfügt über eine Sprachübersetzungseinheit, die einen Videoanruf in Sekundenschnelle aus und in jede beliebige Sprache übersetzen kann. Diese Erfindung könnte sich für Länder, die Geschäfte mit Ausländern abwickeln, als äußerst vorteilhaft erweisen.
Dies könnte sich insbesondere in Bezug auf Länder wie China und die meisten europäischen Länder als nützlich erweisen – Länder, die mit den meisten Ländern gute Handelsbeziehungen unterhalten, aber kein Englisch als Amtssprache sprechen. Dies wird dazu beitragen, die Geschäftsbeziehungen zu stärken und in den Ländern, in denen es eingesetzt wird, massive wirtschaftliche und finanzielle Veränderungen herbeizuführen.
Ein weiterer Punkt, der diese Funktion von anderen Funktionen wie Google Translate unterscheidet, ist die Fähigkeit, Konversationen und Dialoge in Echtzeit zu übersetzen. Dies bedeutet, dass es bei ausländischen Videoanrufen keine unangenehmen Pausen gibt, wenn ein menschlicher Übersetzer mit einer umständlichen Übersetzung beginnt oder wenn jemand mit Google Translate herumfummelt, um zu verstehen, was gesagt wird.
Die Zusammenarbeit mit ausländischen Unternehmen ohne gemeinsame Sprache war schon immer eine schwierige Aufgabe, aber mit der COVID-19-Pandemie auf dem Höhepunkt ihrer zweiten Welle ist diese Aufgabe viel schwieriger geworden, da Meetings mithilfe von Apps wie z. B. aus der Ferne abgehalten werden Zoom und Skype. Eingefrorene Frames und fehlerhafte Sprachübertragungen aufgrund langsamer Internetverbindungen kommen häufig vor, machen die Durchführung von Meetings in Fremdsprachen jedoch zu einer mühsamen Angelegenheit. Nvidia Maxine wird als etwas angepriesen, das seinen Benutzern mit seiner Echtzeit-Videoanruf-Übersetzungsfunktion dabei helfen wird, all diese lästigen Unannehmlichkeiten loszuwerden – was es zu einer Erfindung macht, die zu keinem besseren Zeitpunkt hätte kommen können.
Wie funktioniert Nvidia Maxine?
Der Schlüsselfaktor für die Geschwindigkeit, mit der Nvidia Maxine Sprachen spontan übersetzt, ist der Einsatz künstlicher Intelligenz (KI), um Sprachmuster und Stimmen zu erkennen und den Satz in minimaler Zeit in die ausgewählte Sprache zu übersetzen.
Nvidias Maxine nutzt etwas, das „Deep Learning“ genannt wird, um die meisten Effekte zu erzielen, die seine Tools bieten. Deep Learning ist eine beliebte Art des KI-Lernens namens maschinelles Lernen, das erstmals 2012 entwickelt wurde und die Technologie hinter den meisten Gesichtserkennungs-Apps, Übersetzungsfunktionen und Inhaltsempfehlungssystemen ist.
Zu den bisher im Angebot von Nvidia Maxine enthaltenen Tools gehören die Konvertierung von Videos mit niedriger Auflösung in hochauflösende Videos mittels KI, automatische Gesichtsausrichtung, Rauschunterdrückung und natürlich die in Echtzeit arbeitende Übersetzungsfunktion. Diese Tools werden für Menschen mit instabilen Internetverbindungen, lauten Arbeitsplätzen und Sprachbarrieren bei der Durchführung von Remote-Meetings von Vorteil sein.
Abgesehen von der Echtzeit-Übersetzungsfunktion ist das attraktivste Tool von Nvidia Maxine das Versprechen, die Bandbreite zu verringern, die für eine reibungslose Videoübertragung von hochauflösenden Bildern erforderlich ist. Vereinfacht ausgedrückt basiert die neueste Erfindung des GPU-Riesen auf dem Prinzip, dass es nicht notwendig ist, die gesamten visuellen Informationen in einem Video zu übertragen, um auf der anderen Seite hochauflösende Bilder zu erhalten. Maxine funktioniert, indem es nur bestimmte Punkte eines Bildes sendet – und die Lücken dann mithilfe seiner Technologie der künstlichen Intelligenz (KI) selbstständig füllt.
Ist es den Hype wert?
Die Erfindung von Nvidia wirft einige Fragen zur Ethik der künstlichen Manipulation von Videoanrufen auf und verweist auf die zunehmende Häufigkeit von Betrügern, die Menschen glauben lassen, sie seien Familie oder Freunde, und hinter den Zweifeln stecken. Außerdem wird die Debatte über menschliche oder maschinelle Übersetzung zumindest noch einige Tage lang offen bleiben.
Die COVID-19-Pandemie hat jedoch dazu geführt, dass die überwiegende Mehrheit der Weltbevölkerung nicht mehr von zu Hause aus arbeiten kann. Dieser Vorfall hat in den letzten Monaten zu einem rasanten Anstieg der Downloadrate von Videoanrufsoftware und -anwendungen geführt. Dies zeigt, wie wichtig eine Funktion von Videoanrufen und darüber hinaus Nvidia Maxine für die Zukunft von Remote-Meetings und virtueller Büroarbeit ist.
Darüber hinaus verleiht der Status von Nvidia als Unternehmen, das hochmoderne Technologie für alle Arten von Computerbenutzern bereitstellt, vom Gamer bis zum Softwareentwickler, diesem Unternehmen Glaubwürdigkeit, da der Nvidia-Konzern über die finanziellen Möglichkeiten verfügt, diese Tools für die Forschung und Massenproduktion zu erforschen und zu produzieren Nutzen für seine Nutzer.
Was jedoch einige Benutzer beunruhigen könnte, ist möglicherweise, dass Maxine eine Nvidia-GPU benötigt, damit es funktioniert. Nvidia-Vertreter haben dies noch nicht bestätigt.
Vielleicht gefällt Ihnen auch Folgendes: 10 Videobearbeitungssoftware für Anfänger bis Profis.
Letzte Worte
Es bleibt nun abzuwarten, ob andere Videoanruf-Giganten wie Zoom und Microsoft die Technologie von Nvidia Maxine kaufen oder eigene entwickeln, um ihre Videoanruf-Anwendungen zu ergänzen. Da sich die Technologie in jedem Block verbessert, kann es schwierig sein, mit der Zeit Schritt zu halten. Übersetzungsunternehmen können Ihnen dabei helfen, Ihre Software an die Bedürfnisse Ihrer Kunden anzupassen. Sie helfen Ihnen sogar bei der Lokalisierung Ihrer Software in mehr als 100 Sprachen.