AutoGPT とは何ですか? 包括的なガイドと ChatGPT の比較

公開: 2023-04-20

人工知能は、加速度的なペースで進化し続けています。

GPT-3 から GPT-4 にかけて、高度な推論、入力設定、動作の微調整、およびより長いコンテキストの理解に関して大幅な改善が見られました。

GPT-4 と GPT-3 の比較について詳しくは、こちらをご覧ください。

ただし、AI と人間の相互作用は同じままでした。 AI プロンプトを慎重に作成し、その動作を微調整して、目的の結果を得る必要があります。

では、目標を AI に伝えるだけで、AI がすべてを実行してくれるとしたらどうでしょうか。 テスラ車に目的地を入力する方法と同様に、積極的な関与を必要とせずにそこに連れて行ってくれます。

はい、自律型 AI エージェントについて話しています。 そして、何を推測しますか? 彼らはすでにここにいます!

AutoGPT は、インターネットを席巻した GPT-4 の最新のアプリケーションです。 世界中の開発者が、さまざまな業界で AutoGPT を使用して新しいアプリケーションを構築しています。 AutoGPT を AGI と呼ぶ人もいます。

このブログでは、誇大宣伝を過ぎて次のことを理解しましょう。

  • AutoGPTとは
  • AutoGPT の仕組み
  • AutoGPT と ChatGPT の比較
  • AutoGPT の使用方法

もっと!

目次

AutoGPT とは何ですか?

AutoGPT は、OpenAI の GPT-4 言語モデルを活用して、完全に自律的でカスタマイズ可能な AI エージェントを作成するオープンソースの AI アプリケーションです。 2023 年 3 月 30 日に、Toran Bruce Richards によってリリースされました。 トランは本業のゲーム開発者であり、Significant Gravitas というゲーム会社を設立しました。

AutoGPT は、独立して動作するため、他の AI ツールと比べてユニークです。つまり、ニーズを満たすためにモデルを操作する必要がなくなります。 代わりに、目標を書き出すと、AI が残りの作業を行います。 そのため、AutoGPT は AI と人間の相互作用を根本的に変えており、ChatGPT などの他の AI アプリケーションと同じかそれ以上の品質の結果を維持しながら、人間が積極的な役割を果たす必要がなくなりました。

知っておくべき31のChatGPTの代替案をチェックしてください.

AutoGPT はどのように機能しますか?

AutoGPT は、AI システムが特定のタスクを満たすためにさまざまな AI エージェントを作成する自律型 AI メカニズムに基づいて動作します。

  • タスク作成エージェント: AutoGPT で目標を入力すると、タスク作成エージェントと対話する最初の AI エージェント。 目標に基づいて、それを達成するためのステップを含むタスクのリストを作成し、それを優先順位付けエージェントに送信します。
  • タスク優先順位付けエージェント:タスクのリストを受け取った後、優先順位付け AI エージェントは、実行エージェントに送信する前に、シーケンスが正しく、論理的に意味があることを確認します。
  • タスク実行エージェント:優先順位付けが完了すると、実行エージェントは次々とタスクを完了します。 これには、GPT-4、インターネット、およびその他のリソースを利用して結果を得ることが含まれます。
AutoGPT - AutoGPT とは?
AutoGPT

上記のエージェントも相互に通信します。 そのため、実行エージェントがすべてのタスクを完了し、結果が不十分な場合、タスク作成エージェントと通信して、タスクの新しいリストを作成できます。 これは、すべてのユーザー定義の目標が完了するまで、3 つのエージェント間の反復ループになります。

AI エージェントのアクションも、思考、推論、計画、批判の 4 つのグループに分類してユーザー インターフェイスに表示されます。 まず、AI エージェントはタスクの完了後に考えを共有します。 次に、AI エージェントが現在行っていることを行っている理由を説明する推論が続きます。 その後、システムはタスクを完了するための計画を提供します。 最後に、このシステムは、AI エージェントがその過ちを修正し、制限を克服できるようにするための批判も行います。

この計算フローを共有することで、AutoGPT は特定の問題にどのようにアプローチし、ユーザーの介入なしにそれらを克服するかについての洞察を提供します。

AutoGPT は ChatGPT とどのように比較されますか?

基礎となる LLM モデルは同じですが、AutoGPT と ChatGPT の間にはかなりの違いがあります。 それらのいくつかを以下に示します。

リアルタイムの洞察

ChatGPT が使用する最新の GPT-4 モデルは、GPT-3.5 と同じデータでトレーニングされていますが、これは 2021 年 9 月までです。そのため、ウェブサイトやオンライン プラットフォームにアクセスできないため、ChatGPT を使用してリアルタイムの洞察を得ることができません。情報を抽出します。

一方、AutoGPT はインターネットにアクセスできます。 Web をサーフィンするだけでなく、ソースが正当かどうかを検証することもできます。 さらに、AutoGPT は任意のプラットフォームにアクセスしてタスクを実行できます。 たとえば、AI に製品を販売するための見通しを調査してアウトリーチ メールを送信するように依頼すると、Gmail アカウントを使用して直接メールを下書きして送信します。

メモリ管理

コンテキスト ウィンドウは、言語モデルが正確な答えを出すために非常に重要です。 しかし、GPT-4 のような LLM では、ウィンドウには 4000 から 8000 トークンの制限があります。 そのため、要件が制限を超えている場合、モデルはすべての指示に適切に従わなかったり、接線を外れて信頼できない出力を生成したりする可能性があります。

対照的に、AutoGPT は短期および長期のメモリ管理に優れています。 ベクトル データベースを使用することにより、AutoGPT はコンテキストまたは以前の経験を保存して、モデルがより適切な決定を下せるようにします。

画像生成

AutoGPT は DALL-E を使用しているため、画像生成が可能です。 AI エージェントの画像生成機能を有効にする場合は、DALL-E への API アクセスが必要です。 この機能は、入力に関してマルチモーダルであるにもかかわらず、ChatGPT-4 では現在利用できません。

テキスト読み上げ

コマンド ラインでpython -m autogpt --speakと入力すると、AutoGPT でテキスト読み上げを有効にできます。 ただし、AutoGPT を操作するたびにコマンドを入力する必要があります。 AutoGPT を多目的 AI 音声ソフトウェアである Eleven Labs に接続することで、音声にさまざまな音声を追加することもできます。

AutoGPT の制限事項

自律的な性質が AI システムに新しい次元を追加することは間違いありません。 同時に、AutoGPT の制限とリスクを無視することはできません。 知っておく必要がある主な制限の一部を以下に示します。

使用するには高すぎる

機能は素晴らしいですが、AutoGPT の実用性にはがっかりするでしょう。 AutoGPT は高価な GPT-4 モデルを使用するため、小さなタスクであっても、タスク完了あたりのコストが高くなる可能性があります。 これは主に、AutoGPT が特定のタスクのステップで GPT-4 を何度も使用できるためです。

さらに、入力が同じ場合、別のシナリオで出力を複製できないため、実用的ではありません。 たとえば、道路と芝でトップのランニング シューズを見つけるようにモデルに指示した場合、芝カテゴリのプロセスを複製する関数は作成されません。 代わりに、ゼロから開始します。

頻繁にループに陥る

ユーザーが AutoGPT で直面する最も一般的な問題は、ループに陥ることです。 これが数分以上続く場合は、プロセスを再起動する必要がある可能性があります。 これは、AutoGPT が GPT-4 に依存してタスクを適切に定義および分解するために発生します。 そのため、結果は AutoGPT が何らかのアクションを実行するのに不十分です。

データ侵害の可能性

AI モデルがシステムとインターネットにアクセスして自律的に動作する場合、データが漏洩する可能性があります。 セキュリティ エージェントがないため、懸念事項であり、AutoGPT を使用する場合は注意が必要です。 適切な指示と安全ガイドラインを提供せずに、モデルを実行したままにすることはできません。

AutoGPT のインストール方法

他の AI ツールとは異なり、AutoGPT にはプラットフォームと機能にアクセスするための簡単なサインアップ手順がありません。 AutoGPT の使用を開始する前に、要件を満たすためにさまざまなソフトウェアをダウンロードする必要があります。 そのため、作業を簡単にするために、AutoGPT をインストールするための段階的なプロセスを共有しました。

ステップ 1: 前提条件のソフトウェアをダウンロードする

AutoGPT をインストールするには、Git、Python、および Visual Code Studio の 3 つの主なソフトウェア要件があります。 ここにある AutoGPT のクイック リンク概念ドキュメントを使用して、3 つのソフトウェアすべてをダウンロードできます。

AutoGPT のインストール方法は? - AutoGPT とは何ですか?
AutoGPT のインストール方法は?

ステップ 2: API キー用の OpenAI アカウントを作成する

まだお持ちでない場合は、OpenAI アカウントを作成してください。 アカウントを開設したら、[API キー] タブに移動します。 秘密鍵を作成するためのオプション (以下で強調表示) が表示されます。 それをクリックして、秘密鍵をコピーします。

AutoGPT のインストール方法は? - AutoGPT とは何ですか?
AutoGPT のインストール方法は?

ステップ 3: AutoGPT リポジトリをハード ドライブにコピーする

AutoGPT GitHub リポジトリをハード ドライブにコピーするには、主に 2 つのことを行う必要があります。 まず、GitHub からプロジェクトのリンクをコピーします。

AutoGPT のインストール方法は? - AutoGPT とは何ですか?
AutoGPT のインストール方法は?

次に、コマンド プロンプトを開き、下の画像に示すようにリンクを貼り付けて、AutoGPT GitHub リポジトリのクローンを作成します。

AutoGPT のインストール方法は? - AutoGPT とは何ですか?
AutoGPT のインストール方法は?

VCS がインストールされているので、コマンド プロンプトにコードを入力して、VCS エディターから AutoGPT にアクセスすることもできます。

ステップ 4: Python モジュールをインストールする

VCS を開くと、左側に多くのファイルが表示されます。 ファイルの 1 つが requirements.txt になります。 このファイルには、AutoGPT の実行に必要なモジュールが含まれています。

これらのモジュールをインストールするには、 pip install -r requirements.txtと入力して Enter キーを押します。 注: ディレクトリが、リポジトリをコピーした場所を指していることを確認する必要があります。

ステップ 5: .env.template ファイルの名前を変更する

VCS で .env.template ファイルを見つけて、「.」を削除します。 そして「テンプレート」。

AutoGPT のインストール方法は? - AutoGPT とは何ですか?
AutoGPT のインストール方法は?

ステップ 6: OpenAI API キーを入力する

最後のステップは、API キーを .env ファイルに貼り付けることです。 キーを入力してファイルを保存したら、コマンド プロンプトに移動してpython -m autogpt と入力します。 それでおしまい。 これで AutoGPT がインストールされ、使用を開始できます。

AutoGPT のインストール方法は? - AutoGPT とは何ですか?
AutoGPT のインストール方法は?

最後に

AutoGPT の可能性は見ていてわくわくするものだと思いますが、新しいテクノロジーに関しては、現実的な期待を設定することが重要です。 AutoGPT がローンチされてから丸 1 か月も経っていないため、この新しい AI アプリケーションがさまざまなユースケースで何ができるか、何ができないかをまだ見ていません。 さらに、多くの個人のプライバシーとデータ セキュリティの問題があり、すぐに対処する必要があります。

とはいえ、AutoGPT は、GPT-4 のような LLM モデルとの対話方法を変えていると思います。 AI がどのように問題に取り組み、間違いから学び、良い結果をもたらすかを確認できるようになり、プロンプトをより適切に最適化できるようになりました。 そのため、AI エージェントはどこにも行きませんが、成熟し、意味のあるユーザーの採用を促進するには時間がかかります。