東大発スタートアップのAthena Technologies(アテナテクノロジーズ、東京・文京区)は6月3日、東京電力ホールディングス(HD)と、四足歩行ロボットを音声指示で操作する「AI(人工知能)エージェント制御パイプライン」の検証を実施したと発表した。音声で与えた指示を認識・解釈し、四足歩行ロボットの操作コマンドに変換して実機で実行する仕組みを構築した。
四足歩行ロボットは、タブレットアプリによる遠隔操作に加え、SDK(ソフトウエア開発キット)を使ったアプリケーションからの制御や状態情報の取得ができる。今回の検証では、扱いやすい操作インターフェースの開発に向け、「自然言語の指示とロボット操作の接続」「安定性や安全性の向上を目指す実行制御」の2点を検証した。
検証では、音声認識から意図解釈、タスク分解、ツール選択、コード生成までを一気通貫で行うパイプラインを構築。事前に定義した動作シナリオを対象に評価し、各動作の実行を確認した。一方で、利用環境や条件によって挙動にばらつきが生じるなど、動作の安定性には課題も残ったという。
現場では「パトロールして」「異常がないか確認して」といった抽象的な音声指示が想定される。今回の検証では、AIが不足情報を判別し、ユーザーに確認を求める「聞き返し機能」も実装した。聞き返しを行わない場合と比べ、コード生成の成功率が改善したという。
ロボットの誤動作を防ぐため、AIが制約なくコードを生成する方式ではなく、利用可能な操作を事前に定義した。「歩く」「撮る」「つかむ」などの動作をツールとして参照させ、その範囲内で手順を組み合わせる設計を採用した。コードをレビューするAIエージェントも実装し、誤作動リスクの低減を図った。
アテナテクノロジーズは、撮影失敗時の自動再撮影やバッテリー残量に応じた自律充電、画像データを基にした再プランニング、RAG(検索拡張生成)を活用した業務知識の参照などを今後の技術拡張で検討する。








