Nvidia Maxine: oparte na sztucznej inteligencji tłumaczenie rozmów wideo w czasie rzeczywistym

Opublikowany: 2021-04-27

Nvidia Corporation, gigant przetwarzania grafiki z siedzibą w Kalifornii, niedawno zaprezentował nową funkcję o nazwie Nvidia Maxine. Nvidia Maxine to najnowocześniejsza innowacja, która łączy sztuczną inteligencję z technologią połączeń wideo w celu stworzenia oprogramowania, które pomaga wykonywać różne funkcje poprawiające jakość i szybkość wideo. Może być używany jako narzędzie dla innych programów do połączeń wideo, aby zmniejszyć ich niedokładność.

Obejmuje wiele funkcji, takich jak automatyczne ulepszanie grafiki, automatyczne wyrównywanie twarzy i automatyczne tłumaczenie języka — wszystkie usługi, które mogą sprawić, że rozmowa wideo będzie wydarzeniem praktycznie bezbłędnym. Co najważniejsze, funkcja ulepszania grafiki może mieć dalekosiężne skutki dla słabo rozwiniętych obszarów, które działają ze słabą przepustowością.

Pokaż spis treści
  • Co to jest Nvidia Maxine?
  • Co to jest funkcja tłumaczenia rozmów wideo w czasie rzeczywistym firmy Nvidia?
  • Jak działa Nvidia Maxine?
  • Czy warto robić szum?
  • Ostatnie słowa

Co to jest Nvidia Maxine?

pytanie-zapytanie-pomyśl-myśl-plan

Nvidia Maxine to zestaw narzędzi do ulepszania wideo opracowany przez Nvidia Corporation i zaprezentowany w październiku 2020 r. na GPU Technology Conference (globalna konferencja organizowana przez Nvidię w celu promowania dyskusji na temat rozwoju sztucznej inteligencji z najlepszymi na świecie inżynierami, programistami i innowatorami w frekwencja). Jest to rewolucyjny dodatek do świata transmisji wideo, który koryguje nieścisłości lub usterki, które mogą pojawić się w rozmowach telefonicznych w stopniu, który może całkowicie zmienić sposób obsługi połączeń wideo.

Niektóre funkcje Nvidii Maxine, które szybko przyciągają uwagę społeczności AI, to te, za pomocą których jest w stanie automatycznie konstruować i dekonstruować twarze, tła, dźwięki, a nawet rysy twarzy.

Na razie te narzędzia do ulepszania połączeń wideo są wystawione na sprzedaż firmom programistycznym, które mogą chcieć włączyć tę technologię do swoich programów, ale ich sukces może oznaczać, że funkcje te mogą wkrótce stać się powszechnie dostępne.

Polecane dla Ciebie: Sztuka telekonferencji: jak prowadzić efektywne spotkania online.

Co to jest funkcja tłumaczenia rozmów wideo w czasie rzeczywistym firmy Nvidia?

online-learning-edukacja-czat-wideo-konferencja-spotkanie

Nvidia Maxine jest wyposażona w jednostkę tłumaczącą język, która jest w stanie przetłumaczyć rozmowę wideo z dowolnego języka i na dowolny język w ciągu kilku sekund. Ten wynalazek może okazać się niezwykle korzystny dla krajów, które prowadzą interesy z obcokrajowcami.

Może to okazać się szczególnie przydatne w odniesieniu do krajów takich jak Chiny i większość krajów europejskich – tych, które cieszą się zdrowymi stosunkami handlowymi z większością krajów, ale nie mówią po angielsku jako języku urzędowym. Pomoże to wzmocnić więzi biznesowe i spowoduje ogromne zmiany gospodarcze i finansowe w krajach, które go stosują.

Kolejną rzeczą, która odróżnia tę funkcję od innych funkcji, takich jak Tłumacz Google, jest możliwość tłumaczenia rozmów i dialogów w czasie rzeczywistym. Oznacza to, że nie będzie żadnych niezręcznych przerw w zagranicznych rozmowach wideo, gdy tłumacz-człowiek rozpocznie tłumaczenie okrężne lub gdy ktoś grzebie w Tłumaczu Google, aby zrozumieć, co zostało powiedziane.

Współpraca z zagranicznymi firmami, które nie miały wspólnego języka, zawsze była trudnym zadaniem, ale w obliczu drugiej fali pandemii COVID-19 zadanie to stało się znacznie trudniejsze, ponieważ spotkania odbywają się w formie zdalnej za pomocą takich aplikacji jak m.in. Zooma i Skype'a. Zamrożone ramki i przerywane transmisje głosu spowodowane wolnymi połączeniami internetowymi są częstym zjawiskiem, ale takie, które sprawiają, że prowadzenie spotkań w językach obcych to żmudna walka. Nvidia Maxine jest reklamowana jako coś, co pomoże jej użytkownikom pozbyć się wszystkich tych nieznośnych niedogodności dzięki funkcji tłumaczenia rozmów wideo w czasie rzeczywistym – co czyni go wynalazkiem, który nie mógł przyjść w lepszym czasie.

Jak działa Nvidia Maxine?

AI-sztuczna-inteligencja-kod-skrypt-projekt-rozwój

Kluczowym elementem szybkości, z jaką Nvidia Maxine spontanicznie tłumaczy języki, jest wykorzystanie sztucznej inteligencji (AI) do rozpoznawania wzorców mowy i głosów w celu przetłumaczenia zdania na wybrany język w jak najkrótszym czasie.

Maxine Nvidii wykorzystuje coś, co nazywa się „głębokim uczeniem się”, aby osiągnąć większość efektów zapewnianych przez jego narzędzia. Głębokie uczenie się to popularny rodzaj sztucznej inteligencji zwany uczeniem maszynowym, który został po raz pierwszy opracowany w 2012 roku i jest technologią stojącą za większością aplikacji do rozpoznawania twarzy, funkcji tłumaczenia i systemów rekomendacji treści.

Narzędzia zawarte do tej pory w ofercie Nvidia Maxine obejmują konwersję filmów o niskiej rozdzielczości do wysokiej rozdzielczości za pomocą sztucznej inteligencji, automatyczne wyrównanie twarzy, redukcję szumów i oczywiście funkcję tłumaczenia działającą w czasie rzeczywistym. Narzędzia te przydadzą się osobom z niestabilnymi łączami internetowymi, hałaśliwymi miejscami pracy i barierami językowymi podczas prowadzenia zdalnych spotkań.

Oprócz funkcji tłumaczenia w czasie rzeczywistym, najbardziej atrakcyjnym narzędziem Nvidii Maxine jest obietnica zmniejszenia przepustowości wymaganej do płynnej transmisji wideo obrazów o wysokiej rozdzielczości. Najprościej rzecz ujmując, najnowszy wynalazek giganta GPU opiera się na założeniu, że nie jest konieczne przesyłanie całości informacji wizualnych w jakimkolwiek filmie, aby uzyskać obraz w wysokiej rozdzielczości po drugiej stronie. Maxine działa, wysyłając tylko określone punkty dowolnego obrazu, a następnie samodzielnie wypełniając luki za pomocą technologii sztucznej inteligencji (AI).

Czy warto robić szum?

sztuczna inteligencja-uczenie maszynowe-iot-ai-projektowanie-sieci

Wynalazek Nvidii rodzi pewne pytania dotyczące etyki sztucznego manipulowania rozmowami wideo, powołując się na wzrost liczby oszustów, którzy oszukują ludzi, myśląc, że są rodziną lub przyjaciółmi, i ukrywają wątpliwości. Ponadto debata na temat tłumaczenia ludzkiego i maszynowego pozostanie otwarta, przynajmniej jeszcze przez kilka dni.

Jednak pandemia COVID-19 ograniczyła zdecydowaną większość światowej populacji do pracy z domu. Zjawisko to doprowadziło do szybkiego wzrostu liczby pobrań oprogramowania i aplikacji do połączeń wideo w ostatnich miesiącach. To pokazuje, jak ważna jest funkcja połączeń wideo, a co za tym idzie, Nvidia Maxine dla przyszłości zdalnych spotkań i pracy w wirtualnym biurze.

Poza tym status Nvidii jako firmy dostarczającej najnowocześniejszą technologię wszystkim użytkownikom komputerów, od graczy po twórców oprogramowania, nadaje temu przedsięwzięciu wiarygodność ze względu na możliwości finansowe korporacji Nvidia w zakresie badań i masowej produkcji tych narzędzi dla korzyść jego użytkowników.

Jednak czymś, co może okazać się punktem konsternacji dla niektórych użytkowników, może być potrzeba Maxine posiadania procesora graficznego Nvidia, aby działał. Przedstawiciele Nvidii na razie tego nie potwierdzili.

Może ci się spodobać również: 10 programów do edycji wideo do użytku od początkujących do profesjonalistów.

Ostatnie słowa

nvidia-maxine-ai-rozmowa-wideo-w-czasie-zawarcia-zatwierdzenia

Teraz okaże się, czy inni giganci wideorozmów, tacy jak Zoom i Microsoft, kupią technologię Nvidii Maxine lub opracują własne, aby uzupełnić swoje aplikacje do wideorozmów. Dzięki ulepszeniom technologicznym wokół każdego bloku nadążanie za duchem czasu może być trudne. Firmy tłumaczeniowe mogą pomóc w dostosowaniu oprogramowania do potrzeb konsumentów. Pomagają nawet zlokalizować oprogramowanie w ponad 100 językach.