Nvidia Maxine: traducción de videollamadas en tiempo real impulsada por IA

Publicado: 2021-04-27

Nvidia Corporation, el gigante del procesamiento de gráficos con sede en California, presentó recientemente una nueva característica llamada Nvidia Maxine. Nvidia Maxine es una innovación de vanguardia que combina la inteligencia artificial con la tecnología de videollamadas para crear un software que ayuda a realizar varias funciones que mejoran la calidad y la velocidad del video. Se puede utilizar como una herramienta para otro software de videollamadas para disminuir su imprecisión.

Incluye muchas funciones, como la mejora automática de gráficos, la alineación automática de rostros y la traducción automática de idiomas, todos los servicios que podrían hacer que la videollamada sea un evento prácticamente libre de errores. Lo que es más importante, la función de mejora de gráficos podría tener efectos de gran alcance para áreas subdesarrolladas que operan con un ancho de banda deficiente.

Mostrar tabla de contenido
  • ¿Qué es Nvidia Maxine?
  • ¿Qué es la función de traducción de videollamadas en tiempo real de Nvidia?
  • ¿Cómo funciona Nvidia Maxine?
  • ¿Vale la pena el bombo?
  • Ultimas palabras

¿Qué es Nvidia Maxine?

pregunta-consulta-pensar-pensamiento-plan

Nvidia Maxine es un conjunto de herramientas de mejora de video desarrollado por Nvidia Corporation y presentado en octubre de 2020 en la GPU Technology Conference (una conferencia global organizada por Nvidia para promover debates sobre desarrollos en inteligencia artificial con los mejores ingenieros, desarrolladores e innovadores del mundo en asistencia). Es una adición revolucionaria al mundo de la transmisión de video que corrige las imprecisiones o fallas que pueden surgir en las llamadas telefónicas a un grado que podría renovar por completo la forma en que operamos las videollamadas.

Algunas de las características de Nvidia Maxine que están atrayendo rápidamente la atención de la comunidad de IA son aquellas con las que puede construir y deconstruir automáticamente rostros, fondos, ruidos e incluso rasgos faciales.

Por ahora, estas herramientas de mejora de las videollamadas están a la venta para empresas de software que deseen incorporar la tecnología en sus programas, pero su éxito podría significar que las funciones pronto estarán ampliamente disponibles.

Recomendado para usted: El arte de la llamada de conferencia: cómo realizar reuniones en línea efectivas.

¿Qué es la función de traducción de videollamadas en tiempo real de Nvidia?

online-learning-education-chat-video-conference-reunión

Nvidia Maxine viene con una unidad de traducción de idiomas que es capaz de traducir una videollamada desde y hacia cualquier idioma en cuestión de segundos. Esta invención podría resultar increíblemente beneficiosa para los países que realizan negocios con extranjeros.

Esto podría resultar especialmente útil en relación con países como China y la mayoría de los europeos, aquellos que disfrutan de relaciones comerciales sanas con la mayoría de los países pero que no hablan inglés como idioma oficial. Esto ayudará a fortalecer los lazos comerciales y generar cambios económicos y financieros masivos en los países que lo emplean.

Otra cosa que distingue a esta función de otras funciones como Google Translate es su capacidad para traducir conversaciones y sus diálogos en tiempo real. Esto significa que no habrá pausas incómodas en las videollamadas extranjeras cuando un traductor humano se lanza a una traducción indirecta o cuando alguien busca a tientas con Google Translate para entender lo que se dice.

Trabajar con empresas extranjeras que no tienen un idioma común siempre ha sido una tarea difícil, pero con la pandemia de COVID-19 en el pico de su segunda ola, esa tarea se ha vuelto mucho más difícil con las reuniones que se llevan a cabo de forma remota con la ayuda de aplicaciones como Zoom y Skype. Los cuadros congelados y las transmisiones de voz con fallas debido a conexiones lentas a Internet son una ocurrencia común, pero hacen que llevar a cabo reuniones en idiomas extranjeros sea una lucha cuesta arriba. Nvidia Maxine se promociona como algo que ayudará a sus usuarios a deshacerse de todos estos molestos inconvenientes con su función de traducción de videollamadas en tiempo real, lo que la convierte en un invento que no podría haber llegado en un mejor momento.

¿Cómo funciona Nvidia Maxine?

IA-inteligencia-artificial-código-script-diseño-desarrollo

El componente clave en la velocidad con la que Nvidia Maxine traduce idiomas de manera espontánea es su uso de Inteligencia Artificial (IA) para discernir patrones de habla y voces para traducir la oración al idioma seleccionado en una cantidad mínima de tiempo.

Maxine de Nvidia usa algo llamado "aprendizaje profundo" para lograr la mayoría de los efectos proporcionados por sus herramientas. El aprendizaje profundo es un tipo popular de aprendizaje de IA llamado aprendizaje automático que se desarrolló por primera vez en 2012 y es la tecnología detrás de la mayoría de las aplicaciones de reconocimiento facial, funciones de traducción y sistemas de recomendación de contenido.

Las herramientas incluidas en la gama de Nvidia Maxine hasta el momento incluyen la conversión de videos de baja resolución en videos de alta resolución mediante IA, alineación automática de rostros, reducción de ruido y, por supuesto, la función de traducción que opera en tiempo real. Estas herramientas serán beneficiosas para las personas con conexiones a Internet inestables, lugares de trabajo ruidosos y barreras del idioma mientras realizan reuniones remotas.

Además de la función de traducción en tiempo real, la herramienta más atractiva de Nvidia Maxine es su promesa de disminuir el ancho de banda requerido para una transmisión de video fluida de imágenes de alta definición. En términos simples, el invento más reciente del gigante de GPU funciona con la lógica de que no es necesario transmitir la totalidad de la información visual en cualquier video para obtener imágenes de alta definición en el otro lado. Maxine funciona enviando solo algunos puntos específicos de cualquier imagen y luego rellena los espacios por sí mismo con la ayuda de su tecnología de inteligencia artificial (IA).

¿Vale la pena el bombo?

inteligencia-artificial-aprendizaje-máquina-iot-ai-diseño-web-desarrollo

La invención de Nvidia plantea algunas preguntas sobre la ética de la manipulación artificial de las videollamadas, citando el aumento en la incidencia de impostores que engañan a las personas haciéndoles creer que son familiares o amigos y aprovechan las dudas. Además, seguirá abierto el debate sobre la traducción humana frente a la automática, al menos durante unos días más.

Sin embargo, la pandemia de COVID-19 ha limitado a la gran mayoría de la población mundial a trabajar desde casa. Este hecho ha llevado a un rápido aumento en la tasa de descargas que el software y las aplicaciones de videollamadas han visto en los últimos meses. Muestra cuán importante es una característica de las videollamadas y, por extensión, Nvidia Maxine es para el futuro de las reuniones remotas y el trabajo de oficina virtual.

Aparte de eso, el estado de Nvidia como una empresa que proporciona tecnología de punta a todo tipo de usuarios de computadoras, desde jugadores hasta desarrolladores de software, le da credibilidad a esta empresa debido a la capacidad financiera de la corporación Nvidia para investigar y producir en masa estas herramientas para el beneficio de sus usuarios.

Sin embargo, algo que puede llegar a ser un punto de consternación para algunos usuarios puede ser la necesidad de Maxine de tener una GPU Nvidia para que funcione. Los representantes de Nvidia aún no lo han confirmado.

También te puede interesar: 10 software de edición de video para usar desde principiantes hasta profesionales.

Ultimas palabras

nvidia-maxine-ai-real-time-video-call-translation-conclusion

Ahora queda por ver si otros gigantes de las videollamadas como Zoom y Microsoft compran la tecnología de Nvidia Maxine o desarrollan alguna propia para complementar sus aplicaciones de videollamadas. Con mejoras en la tecnología en cada bloque, puede ser un desafío mantenerse al día. Las empresas de traducción pueden ayudar a que su software se ajuste a las necesidades de su consumidor. Incluso lo ayudan a localizar su software en más de 100 idiomas.