TDSE株式会社
TDSEマガジン

AIエージェントとは? ChatGPTの次に来るAIを紹介

AIトレンド

はじめに:AIエージェントとは何か?

 ChatGPTに代表される大規模言語モデル(Large Language Models;LLM)の次に来る機械学習の技術として、AIエージェントがいま注目を集めています。例えば、自動運転技術などは、AIエージェントの応用によって、かなり実用的な段階へと進む期待が持たれています。

 AIエージェントが従来の機械学習の技術と異なる点は、自律的であるという点です。例えば、ユーザ自らが知りたい情報に関する質問を入力するChatGPTのようなチャットボットでは、AIに対して人が指示を出す必要があります。しかし、AIエージェントは、自律的に動作する機能を有しており、自ら推論することや、実世界と連動した出力をすることができます。

 自律的なAIとは何か、ということについて掘り下げつつ、AIエージェントの特徴や活用方法について解説しますので、ぜひ最後までご一読ください。

なぜいま、AIエージェントなのか?

 AIエージェントが実現するまでには、いくつかの技術的なブレークスルーがありました。簡単にその変遷を追いながら、AIエージェントが最新技術たる所以をご紹介いたします。

大規模言語モデルからチャットボットへ

 LLMは、古くからそのアイディアはありましたが、2017年にGoogleが発表したTransformerというアーキテクチャによって、飛躍的な躍進を遂げました(※1)。その後様々な改良が為され、現在のLLMでは、様々な文脈や意図を理解できるようになりました。LLMの活用の一例として、ChatGPTのような対話可能なチャットボットが挙げられます。

 LLMに関する技術が追い風である理由には、技術革新に加えて、利用コスト/処理コストが年々低下していることも挙げられ、「LLMフレーション」と呼ばれています。すなわち、同等の機能が、1年前の10分の1程度のコストで利用可能になっています(※2)。

チャットボットからLLMアプリケーションへ

 LLM技術の応用はチャットボットに留まることなく、いまでは多様な応用が為されています。モデル自体の再学習(ファインチューニング)をせずとも、独自の情報を安価に学習可能な検索拡張生成(Retrieval-Augmented Generation;RAG)への展開や、画像や音声などのテキスト以外の非構造化データを組み合わせた、マルチモーダルな入出力処理を行う生成AIも台頭し、目覚ましい進化を遂げました。そして、これらのLLMアプリケーションは、現在、新たな局面を迎えています。

LLMアプリケーションから自律的なアプリケーションへ

 LLMアプリケーションの動作の大前提は、人が指示(プロンプト)を出し、膨大な学習データからその指示の意味や意図を理解して、指定された形式で出力する、というものでした。例えば、生成AIを用いて旅行の計画を立てる場合、「東京観光の計画案を立てて」という指示を人が出すと、プランの提案を行ってくれます。このような一つのタスクに応じて一つの出力を振る舞うAIは、「AIアシスタント」と呼ばれます。

 一方で、「東京観光の計画案を立てて」という指示を人が出すと、旅程の提案のみならず、それに合わせた交通手段や空室のある旅館のweb予約、当日の天気予報から雨天の可能性という問題を検出して旅程の再調整の提案、同行者に旅程を共有するメールの自動送信など、AIが自律的にタスクを分割し、順序立てて実行する機能を擁するAI技術が誕生しました。このような、自律性を有するAIのことを、AIエージェント(Autonomous AI Agent)と呼びます。

 特定のタスクを遂行するAIアシスタントとは異なり、自律的に多様なタスクを実行可能なAIエージェントは、様々なビジネスシーンへの活用が期待されています。AIエージェントを活用することで大幅な業務効率化が見込まれ、ChatGPTの次に来るAI技術として注目を集めています。

AIエージェントの特徴

AIエージェントの特徴は3つ

 AIエージェントは、現在も進化を遂げている最中の技術であることから、大手のベンダでも定義に差異があります。この記事では、AWSを提供しているAmazonの定義を参考にご紹介します(※3)。

 AIエージェントの特徴には、①「自律性」、②「適応性」、③「多機能性」の3つが挙げられます。

 まず一点目の「自律性」についてです。AIエージェントは、人の指示に対して、自らタスクを分割し、実行順序を定め、目標達成のために行動に移すという特徴を有しています。目標は人間が設定しますが、以降の処理については人が介入することなく、独立して計画/実行/決定を下します。このような目的指向性を有してタスクを独自に実行する点が、AIエージェントの特徴たる「自律性」です。

 次に、二点目の「適応性」です。AIエージェントは、環境の変化に応じて判断や意思決定を行うことが可能です。新しいデータなどの環境の変化に対しても行動を調整する機能を有しており、常に最適化されたパフォーマンスを発揮することが可能です。

 最後に、三点目の「多機能性」です。AIエージェントは様々なアプリケーションやソフトウェアと連動させることが可能であり、複数のツールを横断することなく、AIエージェント内で目標を達成することができます。また、デジタルな世界に閉じることなく、センサなどを通じて外部環境を認識/理解することも可能であり、モータなどのアクチュエータと連動し、外部環境に対して適応する機能も有しています。

 OpenAI社が2025年1月にリリースした、webブラウザをAIが直接操作してタスクをこなすことができるAIエージェントの「Operator」では、「認識 (perception)」「推論 (reasoning)」「行動 (action)」が主要なコンポーネントとして挙げられており、これらの要素がAIエージェントをAIエージェントたらしめる「自律性」を支える要となっています(※4)。

従来の技術との違い

 従来のAIは、特定のタスクに特化した機能を持つことが多く、自律性も有していませんでした。

 例えば、ChatGPTに代表される会話型AIでは、「人がAIに指示し、答えてもらう」という、情報提供や簡易的な分析に留まるタスクしか実行できませんでした。ロボティック・プロセス・オートメーション(RPA)では、定型的な業務プロセスを自動化するに留まり、事前にプログラムされたルールに基づいた行動までしか行うことができません。

 一方で、AIエージェントは、自律的に実際の行動を起こすことができます。情報収集から意思決定、実行といった一連のフローを一貫して行うことが可能であるため、従来のAIよりも一つステップの進化したAIといえます。

AIエージェントの種類にはどのようなものがあるか?

 自動運転技術や配送ドローンの制御など、AIエージェントは多様な場面で利用され始めていますが、具体的に、AIエージェントにはどのようなものがあるのでしょうか? AIエージェントには様々な種類があり、特定の機能や目的に応じて導入されています。また、場合によっては、異なるAIエージェント同士を組み合わせることで、所望の目的を達成するように構築されます。

 ベースとなるAIエージェントの種類は、どのような思想の元に設計されたかで大別できます。設計思想の異なる代表的な4種類を次の表にまとめました。

反射エージェント

 AIエージェントの中でも最もベーシックなタイプで、事前に定義されたルールに基づいて動作するAIエージェントです。例えば、特定のキーワードに対して自動的に返信するチャットボットのようなものが挙げられます。

目標ベースエージェント

 設定された目標に対して、最適な行動を選択するAIエージェントです。例えば、あるイベントの参加者全員が出席可能である最適な日時を自動で見つけ出す、スケジュール調整システムのようなものが挙げられます。

効用ベースエージェント

 設定された目標に対して、行動の効果や満足度を最大化することに重点が置かれたAIエージェントです。例えば、運送会社における商品の配送計画において、天候や道路の混雑状況なども加味しながら、目的地までの最短ルートの提案を行うようなものが挙げられます。

学習エージェント

 以前の出力結果などを元に経験を積み、エージェント内部で改善の学習を行い、時間とともに性能が向上するAIエージェントです。例えば、カスタマセンタにおいて、応対履歴の対話から学び、より適切な回答ができるように進化するカスタマサービスなどが挙げられます。

実際にAIエージェントを実装するには?

 実際にAIエージェントを導入するにはどうしたら良いでしょうか? 一見、AIエージェントを自社に導入すればDX化して何でもやってくれるように見えますが、導入には慎重なステップを踏むことが必要です。

導入のフロー

 まず初めに、AIエージェントは自律的に機能しますが、目標を設定するのは人間である点に留意が必要です。このため、ビジネス要件の定義が明確化されていることが導入の前提条件となります。解決したい具体的な業務課題を洗い出し、その業務フローを整理し、AIエージェントをどの業務範囲に適用させるのか、また、どのようにビジネスに接続するのかが明からになっていないことには、上手くAIエージェントを活用することはできません。

 ビジネス要件が整理された後には、技術的な要件の確認を行います。解決したいビジネス課題によっては、AIエージェントの導入が最適解とも限りません。ルールベース、LLM、AutoML、AIエージェント、などの多様なAIの種類の中から導入するAIの選定を行い、AIエージェントが適しているとなれば、次のステップに移ります。

 導入決定のあかつきには、学習データのアセスメントや、セキュリティ・プライバシーの考慮など、使用するデータ要件の整理を行います。また、クラウドかオンプレミスか、既存システムとの連携が必要か、といったインフラ要件の定義を進めていくことで、PoCでの検証、ビジネス展開へと移ることが可能となります。

導入するメリット

 AIエージェントを導入する判断ポイントとしては、次のような点が挙げられます。まず、ローコードやノーコード、クラウド環境のプラットフォームを利用可能であるといった、導入プロセスがシンプルであること挙げられます。また、AIの出力ログが検証可能であり、導入による効果を計測可能な透明性を持たせる設計が可能な点も大きな利点です。フロントエンド(使用者視点) / バックエンド(保守/管理者視点)の双方が使用しやすいUI/UX設計を行える柔軟性も、AIエージェントを上手に活用する鍵といえます。

代表的なサービス

 AIエージェントは、既に様々な環境で提供され始めており、オープンソースソフトウェア(LlamaIndex、AutoGen、LangGraph Agent、他)、クラウド環境プラットフォーム(Google Gemini、Microsoft Azure OpenAI Service 、AWS Amazon Bedrock、Dify、他)、エンタプライズ向け(IBM Watsonx Assistant、Salesforce Einstein GPT、Cohere AI、他)、などがあります。これらの特徴や実際の導入方法については、次回以降の記事で紹介しますので、そちらをご参照ください。

 TDSEでは、ビジネス要件の整理などの上流工程のコンサルティングから、要件定義、システム構築、運用保守といった実運用のフォローまで、幅広くご支援を行っています。

まとめ

 今回の記事では、AIエージェントとは何かについて、概説しました。次回の記事では、活用事例とビジネスに活かすポイントについて、その次の記事では、技術的な仕組みと最新技術をご紹介しますので、合わせてご一読ください。

DXやデータ分析に関するトレンドや活用法、
セミナー情報などをお届けします。

メールマガジンに無料で登録する
ご相談・お問合せはこちら

お問合せ

上へ戻る