Nvidia Maxine: перевод видеовызовов в реальном времени на основе искусственного интеллекта

Опубликовано: 2021-04-27

Корпорация Nvidia, гигант в области обработки графики, базирующийся в Калифорнии, недавно представила новую функцию под названием Nvidia Maxine. Nvidia Maxine — это современная инновация, сочетающая искусственный интеллект с технологией видеозвонков для создания программного обеспечения, помогающего выполнять различные функции, повышающие качество и скорость видео. Его можно использовать в качестве инструмента для другого программного обеспечения для видеовызовов, чтобы уменьшить их неточность.

Он включает в себя множество функций, таких как автоматическое улучшение графики, автоматическое выравнивание лица и автоматический языковой перевод — все услуги, которые могут сделать видеозвонок практически безошибочным. Что наиболее важно, функция улучшения графики может иметь далеко идущие последствия для слаборазвитых областей, которые работают с плохой пропускной способностью.

Оглавление показать
  • Что такое Nvidia Maxine?
  • Что такое функция перевода видеовызовов Nvidia в реальном времени?
  • Как работает Nvidia Maxine?
  • Стоит ли шумиха?
  • Заключительные слова

Что такое Nvidia Maxine?

вопрос-запрос-думай-мысль-план

Nvidia Maxine — это набор инструментов для улучшения видео, разработанный корпорацией Nvidia и представленный в октябре 2020 года на конференции GPU Technology Conference (глобальная конференция, организованная Nvidia для обсуждения разработок в области искусственного интеллекта с участием лучших мировых инженеров, разработчиков и новаторов в области посещаемость). Это революционное дополнение к миру передачи видео, которое исправляет неточности или сбои, которые могут возникнуть в телефонных звонках, до такой степени, что может полностью изменить то, как мы работаем с видеозвонками.

Некоторые из функций Nvidia Maxine, которые быстро привлекают к себе внимание сообщества ИИ, — это те, с помощью которых он может автоматически создавать и деконструировать лица, фоны, шумы и даже черты лица.

На данный момент эти инструменты улучшения видеозвонков выставлены на продажу компаниям-разработчикам программного обеспечения, которые могут захотеть включить эту технологию в свои программы, но ее успех может означать, что вскоре эти функции могут стать широко доступными.

Рекомендуется для вас: Искусство конференц-связи: как проводить эффективные онлайн-встречи.

Что такое функция перевода видеовызовов Nvidia в реальном времени?

онлайн-обучение-образование-чат-видео-конференция-встреча

Nvidia Maxine поставляется с модулем языкового перевода, способным переводить видеовызов с любого языка и на него за считанные секунды. Это изобретение может оказаться невероятно полезным для стран, ведущих деловые отношения с иностранцами.

Это может оказаться особенно полезным в отношении таких стран, как Китай и большинство европейских стран, которые поддерживают здоровые торговые отношения с большинством стран, но не говорят на английском как на официальном языке. Это поможет укрепить деловые связи и привести к масштабным экономическим и финансовым изменениям в странах, использующих его.

Еще одна вещь, которая отличает эту функцию от других функций, таких как Google Translate, — это ее способность переводить разговоры и диалоги в режиме реального времени. Это означает, что в иностранных видеозвонках не будет неловких пауз, когда человек-переводчик начинает окольный перевод или когда кто-то возится с Google Translate, чтобы понять, о чем идет речь.

Работать с иностранными компаниями, у которых нет общего языка, всегда было сложной задачей, но в связи с пиком второй волны пандемии COVID-19 эта задача стала намного сложнее, поскольку встречи проводятся в дистанционной форме с помощью таких приложений, как Зум и Скайп. Застывшие кадры и сбои при передаче голоса из-за медленного подключения к Интернету — обычное явление, но это делает проведение встреч на иностранных языках сложной задачей. Nvidia Maxine рекламируется как нечто, что поможет ее пользователям избавиться от всех этих надоедливых неудобств с помощью функции перевода видеовызовов в реальном времени, что делает ее изобретением, которое не могло прийти в лучшее время.

Как работает Nvidia Maxine?

AI-искусственный-интеллект-код-сценарий-дизайн-разработка

Ключевым компонентом скорости, с которой Nvidia Maxine спонтанно переводит языки, является использование искусственного интеллекта (ИИ) для распознавания речевых паттернов и голосов для перевода предложения на выбранный язык за минимальное время.

Maxine от Nvidia использует так называемое «глубокое обучение» для достижения большинства эффектов, предоставляемых его инструментами. Глубокое обучение — это популярный тип обучения ИИ, называемый машинным обучением, который был впервые разработан в 2012 году и является технологией, лежащей в основе большинства приложений для распознавания лиц, функций перевода и систем рекомендаций по контенту.

Инструменты, включенные в ассортимент Nvidia Maxine, на данный момент включают преобразование видео с низким разрешением в видео с высоким разрешением с помощью ИИ, автоматическое выравнивание лица, шумоподавление и, конечно же, функцию перевода, которая работает в режиме реального времени. Эти инструменты будут полезны людям с нестабильным интернет-соединением, шумными рабочими местами и языковым барьером при проведении удаленных совещаний.

Помимо функции перевода в реальном времени, наиболее привлекательным инструментом Nvidia Maxine является обещание уменьшить пропускную способность, необходимую для плавной передачи видеоизображений высокой четкости. Проще говоря, новейшее изобретение гиганта GPU работает на том основании, что нет необходимости передавать всю визуальную информацию в любом видео, чтобы получить изображения высокой четкости с другой стороны. Maxine работает, отправляя только определенные точки любого изображения, а затем самостоятельно заполняя пробелы с помощью своей технологии искусственного интеллекта (ИИ).

Стоит ли шумиха?

искусственный интеллект-машинное обучение-iot-ai-веб-дизайн-разработка

Изобретение Nvidia действительно поднимает некоторые вопросы об этичности искусственного манипулирования видеозвонками, ссылаясь на увеличение числа самозванцев, которые обманывают людей, заставляя их думать, что они члены семьи или друзья, и ловят рыбу на сомнениях. Кроме того, дебаты о человеческом и машинном переводе останутся открытыми, по крайней мере, еще несколько дней.

Однако пандемия COVID-19 ограничила подавляющее большинство населения мира возможностью работать из дома. Это событие привело к быстрому увеличению скорости загрузки программного обеспечения и приложений для видеозвонков в последние месяцы. Это показывает, насколько важна функция видеозвонков и, соответственно, Nvidia Maxine для будущего удаленных встреч и работы в виртуальном офисе.

Помимо этого, статус Nvidia как компании, которая предоставляет передовые технологии всем пользователям компьютеров, от геймеров до разработчиков программного обеспечения, придает этому предприятию авторитет благодаря финансовым возможностям корпорации Nvidia исследовать и массово производить эти инструменты для пользу своих пользователей.

Тем не менее, что-то, что может вызвать ужас у некоторых пользователей, может заключаться в том, что для работы Maxine требуется графический процессор Nvidia. Представители Nvidia пока не подтвердили это.

Вам также может понравиться: 10 программ для редактирования видео, которые могут использовать как новички, так и профессионалы.

Заключительные слова

nvidia-maxine-ai-real-time-video-call-translation-заключение

Теперь еще неизвестно, купят ли другие гиганты видеозвонков, такие как Zoom и Microsoft, технологию Nvidia Maxine или разработают свои собственные, чтобы дополнить свои приложения для видеозвонков. С развитием технологий вокруг каждого блока может быть сложно идти в ногу со временем. Переводческие компании могут помочь вашему программному обеспечению адаптироваться к потребностям вашего потребителя. Они даже помогут вам локализовать ваше программное обеспечение более чем на 100 языков.