Nvidia Maxine: traducere prin apeluri video în timp real bazată pe inteligență artificială

Publicat: 2021-04-27

Nvidia Corporation, gigantul de procesare grafică cu sediul în California, a dezvăluit recent o nouă caracteristică numită Nvidia Maxine. Nvidia Maxine este o inovație de ultimă generație care combină inteligența artificială cu tehnologia de apel video pentru a crea software care ajută la îndeplinirea diferitelor funcții care îmbunătățesc calitatea și viteza video. Poate fi folosit ca instrument pentru alte programe de apelare video pentru a le reduce imprecizia.

Include multe caracteristici, cum ar fi îmbunătățirea automată a graficului, alinierea automată a feței și traducerea automată a limbii - toate serviciile care ar putea face ca apelul video să fie practic un eveniment fără erori. Cel mai important, caracteristica de îmbunătățire a graficii ar putea avea efecte de anvergură pentru zonele subdezvoltate care funcționează cu lățime de bandă slabă.

Cuprins arată
  • Ce este Nvidia Maxine?
  • Care este funcția de traducere a apelurilor video în timp real a Nvidia?
  • Cum funcționează Nvidia Maxine?
  • Merită hype?
  • Cuvinte finale

Ce este Nvidia Maxine?

întrebare-interogare-gândire-plan-gândire

Nvidia Maxine este un set de instrumente de îmbunătățire a videoclipurilor dezvoltate de Nvidia Corporation și prezentate în octombrie 2020 la GPU Technology Conference (o conferință globală organizată de Nvidia pentru a promova discuțiile despre evoluțiile în inteligența artificială cu cei mai buni ingineri, dezvoltatori și inovatori din lume în prezența). Este o completare revoluționară a lumii transmisiei video care corectează inexactitățile sau erorile care pot apărea în apelurile telefonice într-o măsură care ar putea reînnoi complet modul în care operam apelurile video.

Unele dintre caracteristicile Nvidia Maxine care atrag rapid atenția asupra lor în comunitatea AI sunt cele cu care este capabilă automat să construiască și să deconstruiască fețe, fundaluri, zgomote și chiar trăsături faciale.

Deocamdată, aceste instrumente de îmbunătățire a apelurilor video sunt puse la vânzare companiilor de software care ar putea dori să încorporeze tehnologia în programele lor, dar succesul acesteia ar putea însemna că funcțiile pot deveni disponibile pe scară largă în curând.

Recomandat pentru dvs.: Arta conferinței telefonice: Cum să desfășurați întâlniri online eficiente.

Care este funcția de traducere a apelurilor video în timp real a Nvidia?

online-învățare-educație-chat-video-conferință-întâlnire

Nvidia Maxine vine cu o unitate de traducere a limbii care este capabilă să traducă un apel video din și către orice limbă în câteva secunde. Această invenție s-ar putea dovedi a fi incredibil de benefică pentru țările care desfășoară afaceri cu străini.

Acest lucru s-ar putea dovedi deosebit de util în relație cu țări precum China și majoritatea celor europene – cele care se bucură de relații comerciale sănătoase cu majoritatea țărilor, dar nu vorbesc engleza ca limbă oficială. Acest lucru va contribui la consolidarea legăturilor de afaceri și va aduce schimbări economice și financiare masive în țările care îl folosesc.

Un alt lucru care diferențiază această funcție de alte funcții, cum ar fi Google Translate, este capacitatea sa de a traduce conversațiile și dialogurile sale în timp real. Aceasta înseamnă că nu vor exista pauze incomode în apelurile video din străinătate, când un traducător uman se lansează într-o traducere giratorie sau când cineva caută Google Translate pentru a înțelege ce se spune.

Lucrul cu companii străine fără un limbaj comun a fost întotdeauna o sarcină dificilă, dar odată cu pandemia COVID-19 în vârful celui de-al doilea val, această sarcină a devenit mult mai grea, ședințele fiind desfășurate la distanță cu ajutorul unor aplicații precum Zoom și Skype. Cadrele înghețate și transmisiile vocale greșite din cauza conexiunilor lente la internet sunt o întâmplare comună, dar cele care fac ca organizarea întâlnirilor în limbi străine să fie o luptă dificilă. Nvidia Maxine este prezentată ca fiind ceva care îi va ajuta pe utilizatori să scape de toate aceste neplăceri neplăcute cu funcția sa de traducere a apelurilor video în timp real – făcându-l o invenție care nu ar fi putut veni într-un moment mai bun.

Cum funcționează Nvidia Maxine?

AI-inteligentă-artificială-cod-script-design-dezvoltare

Componenta cheie a vitezei cu care Nvidia Maxine traduce limbile în mod spontan este utilizarea inteligenței artificiale (AI) pentru a discerne modelele de vorbire și vocile pentru a traduce propoziția în limba selectată într-un timp minim.

Maxine de la Nvidia folosește ceva numit „învățare profundă” pentru a obține majoritatea efectelor oferite de instrumentele sale. Învățarea profundă este un tip popular de învățare AI numit învățarea automată, care a fost dezvoltat pentru prima dată în 2012 și este tehnologia din spatele majorității aplicațiilor de recunoaștere a feței, funcțiilor de traducere și sistemelor de recomandare de conținut.

Instrumentele incluse până în prezent în gama Nvidia Maxine includ conversia videoclipurilor de joasă rezoluție în cele de înaltă rezoluție prin intermediul AI, alinierea automată a feței, reducerea zgomotului și, desigur, funcția de traducere care funcționează în timp real. Aceste instrumente vor fi benefice pentru persoanele cu conexiuni instabile la internet, locuri de muncă zgomotoase și bariere lingvistice în timp ce desfășoară întâlniri la distanță.

În afară de caracteristica de traducere în timp real, cel mai atrăgător instrument de la Nvidia Maxine este promisiunea de a reduce lățimea de bandă necesară pentru o transmitere video lină a imaginilor de înaltă definiție. În termeni simpli, cea mai nouă invenție a gigantului GPU funcționează pe motivul că nu este necesar să se transmită întreaga informație vizuală din orice videoclip pentru a obține imagini de înaltă definiție pe cealaltă parte. Maxine funcționează trimițând doar câteva puncte specifice ale oricărei imagini, apoi completând golurile de la sine cu ajutorul tehnologiei sale de inteligență artificială (AI).

Merită hype?

Dezvoltarea-dezvoltare-design-web-inteligentă-artificială-învățare-mașină-iot-ai

Invenția Nvidia ridică unele întrebări cu privire la etica manipulării artificiale a apelurilor video, invocând creșterea incidenței impostorilor care păcălesc oamenii, făcându-le să creadă că sunt familie sau prieteni, și pescuiesc în spatele îndoielilor. De asemenea, dezbaterea va rămâne deschisă despre traducerea umană vs. automată, cel puțin pentru câteva zile.

Cu toate acestea, pandemia de COVID-19 a limitat marea majoritate a populației lumii să lucreze de acasă. Acest eveniment a dus la o creștere rapidă a ratei de descărcări pe care le-au înregistrat software-urile și aplicațiile pentru apeluri video în ultimele luni. Acesta arată cât de importantă este o caracteristică a apelurilor video și, prin extensie, Nvidia Maxine pentru viitorul întâlnirilor la distanță și al biroului virtual.

În afară de asta, statutul Nvidia ca o companie care furnizează tehnologie de ultimă oră pentru tot felul de utilizatori de computere, de la jucători până la dezvoltatori de software, conferă acestei întreprinderi credibilitate datorită capacității financiare a corporației Nvidia de a cerceta și produce în masă aceste instrumente pentru beneficiul utilizatorilor săi.

Cu toate acestea, ceva care se poate dovedi a fi un punct de consternare pentru unii utilizatori poate fi nevoia lui Maxine de a avea un GPU Nvidia pentru ca acesta să funcționeze. Reprezentanții Nvidia nu au confirmat încă acest lucru.

S-ar putea să vă placă și: 10 software de editare video de folosit de la începători până la profesioniști.

Cuvinte finale

nvidia-maxine-ai-real-time-video-call-traducere-concluzie

Rămâne acum de văzut dacă alți giganți ai apelurilor video, cum ar fi Zoom și Microsoft, cumpără tehnologia Nvidia Maxine sau dezvoltă unele dintre ele pentru a-și completa aplicațiile de apeluri video. Cu îmbunătățiri ale tehnologiei în fiecare bloc, poate fi o provocare să ții pasul cu vremurile. Companiile de traduceri vă pot ajuta software-ul să se adapteze la nevoile consumatorului. Ele vă ajută chiar să vă localizați software-ul în mai mult de 100 de limbi.