Nvidia Maxine: tradução de chamadas de vídeo em tempo real com inteligência artificial

Publicados: 2021-04-27

A Nvidia Corporation, gigante do processamento gráfico com sede na Califórnia, revelou recentemente um novo recurso chamado Nvidia Maxine. Nvidia Maxine é uma inovação de ponta que combina inteligência artificial com tecnologia de videochamada para criar um software que ajuda a executar várias funções que aprimoram a qualidade e a velocidade do vídeo. Ele pode ser usado como uma ferramenta para outro software de videochamada para diminuir sua imprecisão.

Ele inclui muitos recursos, como aprimoramento gráfico automático, alinhamento facial automático e tradução automática de idiomas - todos os serviços que podem tornar a videochamada um evento praticamente livre de erros. Mais importante ainda, o recurso de aprimoramento gráfico pode ter efeitos de longo alcance para áreas subdesenvolvidas que operam com largura de banda ruim.

Índice mostra
  • O que é Nvidia Maxine?
  • O que é o recurso de tradução de chamadas de vídeo em tempo real da Nvidia?
  • Como funciona a Nvidia Maxine?
  • Vale a pena o hype?
  • Palavras Finais

O que é Nvidia Maxine?

pergunta-consulta-pensamento-pensamento-plano

Nvidia Maxine é um conjunto de ferramentas de aprimoramento de vídeo desenvolvido pela Nvidia Corporation e apresentado em outubro de 2020 na GPU Technology Conference (uma conferência global organizada pela Nvidia para promover discussões sobre desenvolvimentos em Inteligência Artificial com os melhores engenheiros, desenvolvedores e inovadores do mundo em comparecimento). É uma adição revolucionária ao mundo da transmissão de vídeo que corrige as imprecisões ou falhas que podem surgir nas chamadas telefônicas a um nível que pode renovar completamente a maneira como operamos as chamadas de vídeo.

Alguns dos recursos da Nvidia Maxine que estão chamando a atenção rapidamente na comunidade de IA são aqueles com os quais ela é capaz de construir e desconstruir automaticamente rostos, planos de fundo, ruídos e até recursos faciais.

Por enquanto, essas ferramentas de aprimoramento de videochamada estão à venda para empresas de software que queiram incorporar a tecnologia em seus programas, mas seu sucesso pode significar que os recursos podem se tornar amplamente disponíveis em breve.

Recomendado para você: A arte da teleconferência: como realizar reuniões on-line eficazes.

O que é o recurso de tradução de chamadas de vídeo em tempo real da Nvidia?

online-aprendizagem-educação-chat-videoconferência-reunião

A Nvidia Maxine vem com uma unidade de tradução de idiomas capaz de traduzir uma chamada de vídeo de e para qualquer idioma em questão de segundos. Esta invenção pode ser incrivelmente benéfica para países que conduzem negócios com estrangeiros.

Isso pode ser especialmente útil em relação a países como a China e a maioria dos europeus — aqueles que têm relações comerciais saudáveis ​​com a maioria dos países, mas não falam inglês como língua oficial. Isso ajudará a fortalecer os laços comerciais e provocar grandes mudanças econômicas e financeiras nos países que o empregam.

Outra coisa que diferencia esse recurso de outros recursos, como o Google Tradutor, é a capacidade de traduzir conversas e diálogos em tempo real. Isso significa que não haverá pausas incômodas em chamadas de vídeo estrangeiras quando um tradutor humano inicia uma tradução indireta ou quando alguém se atrapalha com o Google Tradutor para entender o que está sendo dito.

Trabalhar com empresas estrangeiras sem um idioma comum sempre foi uma tarefa difícil, mas com a pandemia do COVID-19 no auge de sua segunda onda, essa tarefa ficou muito mais difícil com as reuniões sendo realizadas de forma remota com o auxílio de aplicativos como Zoom e Skype. Quadros congelados e transmissões de voz com falhas devido a conexões de internet lentas são uma ocorrência comum, mas que tornam a realização de reuniões em línguas estrangeiras uma luta difícil. A Nvidia Maxine está sendo apresentada como algo que ajudará seus usuários a se livrar de todos esses incômodos inconvenientes com seu recurso de tradução de chamadas de vídeo em tempo real - tornando-a uma invenção que não poderia ter surgido em melhor hora.

Como funciona a Nvidia Maxine?

IA-inteligência-artificial-código-desenvolvimento-design-script

O principal componente na velocidade com que a Nvidia Maxine traduz idiomas espontaneamente é o uso de Inteligência Artificial (IA) para discernir padrões de fala e vozes para traduzir a frase para o idioma selecionado em um período mínimo de tempo.

O Maxine da Nvidia usa algo chamado 'aprendizagem profunda' para obter a maioria dos efeitos fornecidos por suas ferramentas. O aprendizado profundo é um tipo popular de aprendizado de IA chamado aprendizado de máquina que foi desenvolvido pela primeira vez em 2012 e é a tecnologia por trás da maioria dos aplicativos de reconhecimento facial, recursos de tradução e sistemas de recomendação de conteúdo.

As ferramentas incluídas na gama da Nvidia Maxine até agora incluem a conversão de vídeos de baixa resolução em alta resolução por meio de AI, alinhamento automático de face, redução de ruído e, claro, o recurso de tradução que opera em tempo real. Essas ferramentas serão benéficas para pessoas com conexões de internet instáveis, locais de trabalho barulhentos e barreiras linguísticas durante a realização de reuniões remotas.

Além do recurso de tradução em tempo real, a ferramenta mais atraente da Nvidia Maxine é a promessa de diminuir a largura de banda necessária para a transmissão suave de imagens de alta definição. Em termos simples, a mais nova invenção da gigante da GPU funciona com base na lógica de que não é necessário transmitir toda a informação visual em qualquer vídeo para obter imagens de alta definição do outro lado. Maxine funciona enviando apenas alguns pontos específicos de qualquer imagem - preenchendo as lacunas por conta própria com a ajuda de sua tecnologia de inteligência artificial (IA).

Vale a pena o hype?

inteligência artificial-machine-learning-iot-ai-web-design-development

A invenção da Nvidia levanta algumas questões sobre a ética da manipulação artificial de chamadas de vídeo, citando o aumento na incidência de impostores enganando as pessoas fazendo-as pensar que são familiares ou amigos e pescando por trás das dúvidas. Além disso, o debate permanecerá aberto sobre tradução humana versus tradução automática, pelo menos por mais alguns dias.

No entanto, a pandemia do COVID-19 limitou a grande maioria da população mundial a trabalhar em casa. Essa ocorrência levou a um rápido aumento na taxa de downloads de software e aplicativos de videochamada nos últimos meses. Isso mostra a importância de um recurso de videochamada e, por extensão, a Nvidia Maxine é para o futuro das reuniões remotas e do trabalho de escritório virtual.

Além disso, o status da Nvidia como uma empresa que fornece tecnologia de ponta para todos os tipos de usuários de computador, de jogadores a desenvolvedores de software, confere credibilidade a esse empreendimento devido à capacidade financeira da corporação Nvidia de pesquisar e produzir em massa essas ferramentas para o benefício de seus usuários.

No entanto, algo que pode ser um ponto de consternação para alguns usuários pode ser a necessidade de Maxine ter uma GPU Nvidia para que funcione. Os representantes da Nvidia ainda não confirmaram isso.

Você também pode gostar de: 10 softwares de edição de vídeo para usar de iniciantes a profissionais.

Palavras Finais

nvidia-maxine-ai-real-time-video-chamada-tradução-conclusão

Agora resta saber se outros gigantes de videochamada, como Zoom e Microsoft, compram a tecnologia da Nvidia Maxine ou desenvolvem alguma própria para complementar seus aplicativos de videochamada. Com melhorias na tecnologia em cada quarteirão, pode ser um desafio acompanhar os tempos. As empresas de tradução podem ajudar seu software a se ajustar às necessidades do consumidor. Eles até ajudam você a localizar seu software em mais de 100 idiomas.