米エヌビディアは1月6日、フィジカルAI(人工知能)開発者向けロボティクス基盤「アイザック」の新たなオープンモデルやフレームワーク、AIインフラを発表した。
ロボットの学習・リーズニング(論理的な思考や推論)を支援する「コスモス」「アイザック・グルート」のオープンモデルをはじめ、ロボット評価向けの「アイザックラボ・アリーナ」、エッジツークラウドのコンピューティングフレームワーク「オスモ」などを公開した。
エヌビディアは、ロボット開発の課題で、現行ロボットが高コストで単一タスク特化になりやすく、プログラミングの難易度も高い点を挙げている。このため、同社は、リーズニング能力を持つ汎用(はんよう)性が高いロボット構築を後押しするため、開発者が事前学習などの負担を減らし、次世代ロボット開発に集中できるようオープンモデル群を整備する。
また、AIモデルやデータセット、開発ツールを共有・利用できるオープンソースプラットホーム「ハギングフェイス」で提供するモデルで、「コスモス・トランスファー2.5」「コスモス・プレディクト2.5」「コスモス・リーズン2」、ヒューマノイド向け「アイザック・グルート・エヌワン1.6」なども発表した。
「コスモス」はフィジカルAI向けシミュレーションでの合成データ生成やロボットポリシー評価が可能。「コスモス・リーズン2」は視覚言語モデルとして物理世界の理解と行動計画を支援する。「グルート」は視覚言語行動モデルとして全身制御が可能で、「コスモス・リーズン2」を活用することで文脈理解やリーズニングの向上が図れるという。
さらに、ロボット開発の評価・検証を支援する枠組み「アイザックラボ・アリーナ」をソフトウエア開発プラットホーム「ギットハブ」で公開した。大規模なロボットポリシー評価とベンチマーク用の協調システムを備えており、物理ハードウエア展開前のスキル検証を標準化できる。
加えて、クラウド型のオーケストレーションフレームワーク「オスモ」を発表。合成データ生成、モデル学習、ソフトウエアインザループのテストなどを、ワークステーションからクラウドまで横断的に統合できる。
オープンソースコミュニティー連携では、エヌビディアとハギングフェイスが、「アイザック」のオープンモデルとライブラリを、オープンソースロボティクスフレームワーク「ルロボット」に統合する。開発者が統合されたソフトウエアとハードウエアツールへ効率的にアクセスが可能になることで、エンドツーエンドの開発を加速する。
ハードウエアでは、生成AIや大規模言語モデル(LLM)向けGPU「エヌビディア・ブラックウェル」を搭載した「ジェットソン・ティー4000」モジュールの提供を始めた。ロボティクスや自律システムなどエッジAI用途での活用を見込む。
同社によると、ボストン・ダイナミクス、キャタピラー、フランカ・ロボティクス、ヒューマノイド、エルジー・エレクトロニクス、ニューラ・ロボティクスなどのグローバルパートナーが、同社のロボティクス技術を基盤に構築した次世代ロボットや自律マシンを発表。モバイルマニピュレーターからヒューマノイドまで、幅広い領域でAI駆動ロボットの開発が進むとしている。
エヌビディアのジェンスン・フアンCEO(最高経営責任者)は、「ロボティクスにとってのChat(チャット)GPTの瞬間が到来した。フィジカルAIという現実世界を理解し、リーズニングし、行動を計画するモデルのブレークスルーが、全く新しい応用分野を切り開く」と話している。








