Nvidia Maxine: AI を活用したリアルタイム ビデオ通話翻訳
公開: 2021-04-27カリフォルニアに本拠を置くグラフィックス処理大手 Nvidia Corporation は、最近 Nvidia Maxine と呼ばれる新機能を発表しました。 Nvidia Maxine は、人工知能とビデオ通話テクノロジーを組み合わせて、ビデオの品質と速度を向上させるさまざまな機能の実行を支援するソフトウェアを作成する最先端のイノベーションです。 他のビデオ通話ソフトウェアの不正確さを軽減するためのツールとして使用できます。
これには、自動グラフィック強化、自動顔調整、自動言語翻訳などの多くの機能が含まれており、これらすべてのサービスにより、ビデオ通話を事実上エラーのないイベントにすることができます。 最も重要なことは、グラフィックス強化機能は、帯域幅が不十分で動作する未開発の領域に広範囲に影響を与える可能性があることです。
- Nvidia Maxineとは何ですか?
- Nvidia のリアルタイム ビデオ通話翻訳機能とは何ですか?
- Nvidia Maxine はどのように機能しますか?
- 誇大宣伝する価値はあるでしょうか?
- 最後の言葉
Nvidia Maxineとは何ですか?
Nvidia Maxine は、Nvidia Corporation によって開発され、2020 年 10 月に GPU テクノロジー カンファレンス (世界最高のエンジニア、開発者、イノベーターと人工知能の開発についての議論を促進するために Nvidia が主催する世界的なカンファレンス) で発表された一連のビデオ強化ツールです。出席)。 これは、ビデオ伝送の世界への革命的な追加であり、電話通話で発生する可能性のある不正確さや不具合を修正し、ビデオ通話の操作方法を完全に刷新する可能性があります。
AI コミュニティで急速に注目を集めている Nvidia Maxine の機能には、顔、背景、ノイズ、さらには顔の特徴を自動的に構築および分解できる機能があります。
今のところ、これらのビデオ通話強化ツールは、この技術を自社のプログラムに組み込みたいと考えているソフトウェア会社に販売されているが、その成功により、その機能がすぐに広く利用可能になる可能性がある。
あなたにお勧めします:電話会議の技術: 効果的なオンライン会議を開催する方法。
Nvidia のリアルタイム ビデオ通話翻訳機能とは何ですか?
Nvidia Maxine には、ビデオ通話をあらゆる言語間で数秒で翻訳できる言語翻訳ユニットが付属しています。 この発明は、外国人とビジネスを行う国にとって非常に有益であることが判明する可能性があります。
これは、中国やほとんどのヨーロッパ諸国、つまりほとんどの国と健全な貿易関係を享受しているものの、英語を公用語として話さない国々との関係で特に役立つ可能性があります。 これはビジネス関係を強化し、それを利用する国々に大きな経済的および財政的変化をもたらすのに役立ちます。
この機能が Google 翻訳などの他の機能と異なるもう 1 つの点は、会話とその対話をリアルタイムで翻訳できることです。 これは、人間の翻訳者が回りくどい翻訳を開始したり、誰かが何を言っているのかを理解するために Google 翻訳を手探りしたりするときに、外国のビデオ通話で気まずい一時停止が発生することがないことを意味します。
共通言語を持たない外国企業と協力することは常に困難な作業でしたが、新型コロナウイルス感染症のパンデミックが第2波のピークにある現在、会議がリモート形式で行われ、ズームとスカイプ。 インターネット接続が遅いためにフレームがフリーズしたり、音声送信に不具合が生じたりすることはよくあることですが、外国語での会議の実施は困難を伴います。 Nvidia Maxine は、リアルタイムのビデオ通話翻訳機能により、ユーザーがこれらの厄介な不便さをすべて取り除くのに役立つものとして宣伝されており、これは、これより良い時期に実現することはできなかった発明です。
Nvidia Maxine はどのように機能しますか?
Nvidia Maxine が言語を自発的に翻訳する速度の重要な要素は、人工知能 (AI) を使用して音声パターンと音声を識別し、最小限の時間で文を選択した言語に翻訳することです。
Nvidia の Maxine は、「ディープ ラーニング」と呼ばれるものを使用して、ツールによって提供される効果のほとんどを実現します。 ディープラーニングは、2012 年に初めて開発された機械学習と呼ばれる一般的なタイプの AI 学習であり、ほとんどの顔認識アプリ、翻訳機能、コンテンツ推奨システムの背後にあるテクノロジーです。
これまでのところ Nvidia Maxine の製品群に含まれているツールには、AI による低解像度ビデオの高解像度ビデオへの変換、自動顔調整、ノイズ リダクション、そしてもちろんリアルタイムで動作する翻訳機能が含まれています。 これらのツールは、リモート会議を行う際に、インターネット接続が不安定であったり、職場が騒がしかったり、言葉の壁がある人にとって有益です。
リアルタイム翻訳機能以外に、Nvidia Maxine の最も魅力的なツールは、高解像度画像のスムーズなビデオ伝送に必要な帯域幅を削減できるという約束です。 簡単に言うと、GPU 巨人の最新発明は、ビデオの向こう側で高解像度の画像を取得するために、ビデオ内の視覚情報全体を送信する必要はないという理論的根拠に基づいて機能します。 Maxine は、画像の特定の点を送信するだけで動作し、人工知能 (AI) テクノロジーを利用して自動的にギャップを埋めます。
誇大宣伝する価値はあるでしょうか?
Nvidiaの発明は、ビデオ通話を人為的に操作する倫理についていくつかの疑問を投げかけており、人々を家族や友人だと思い込ませ、疑問の背後でナマズをする詐欺師の発生率が増加していることを挙げている。 また、少なくともあと数日は、人間翻訳と機械翻訳をめぐる議論が続くだろう。
しかし、新型コロナウイルス感染症のパンデミックにより、世界人口の大多数は在宅勤務が制限されています。 この出来事により、ここ数カ月でビデオ通話ソフトウェアやアプリケーションのダウンロード速度が急速に増加しました。 これは、ビデオ通話、ひいては Nvidia Maxine の機能が、リモート会議やバーチャル オフィスでの仕事の将来にとっていかに重要であるかを示しています。
それ以外に、ゲーマーからソフトウェア開発者まで、あらゆる種類のコンピュータ ユーザーに最先端のテクノロジを提供する企業としての Nvidia の地位が、これらのツールを研究し、量産するための Nvidia 社の資金力により、このベンチャーの信頼性を高めています。ユーザーの利益につながります。
ただし、一部のユーザーにとって困惑する点は、Maxine が動作するには Nvidia GPU が必要であることかもしれません。 Nvidiaの代表者はまだこれを確認していません。
こちらもおすすめです:初心者からプロまで使えるビデオ編集ソフトウェア 10 選。
最後の言葉
Zoom や Microsoft などの他のビデオ通話大手が Nvidia Maxine のテクノロジーを購入するか、あるいは自社のビデオ通話アプリケーションを補完するために独自のテクノロジーを開発するかどうかは、現時点では不明です。 各ブロックのテクノロジーが強化されているため、時代に追いつくのは困難な場合があります。 翻訳会社は、ソフトウェアを消費者のニーズに合わせて調整できるように支援します。 ソフトウェアを 100 以上の言語にローカライズするのにも役立ちます。