
NVIDIAがフィジカルAI基盤モデルCosmos 3を発表、オープン化で開発加速
公開日:
NVIDIAは2026年6月1日、フィジカルAIのためのオープンな世界基盤モデル「Cosmos 3」を発表しました。このモデルは、ロボットや自動運転車などの物理世界で動くAIの開発を大きく効率化します。従来数カ月かかっていたトレーニングと評価のサイクルを数日に短縮できる点が特徴です。また、Agile RobotsやRunwayなど主要企業と共に「Cosmos Coalition」を立ち上げ、オープンなエコシステムでの開発を推進します。
ポイント
- 1NVIDIAがフィジカルAI向けオープン基盤モデルCosmos 3を発表
- 2テキスト・画像・動画・音・動作を統合理解するオムニモデル
- 3Agile RobotsやRunwayなどとCosmos Coalitionを設立
フィジカルAIの課題を解決する新アーキテクチャ
Cosmos 3は、ロボットや自動運転車、ビジョンエージェント向けに設計されたモデルです。物理世界で動くAIは、現実の多様な状況に対応するために大量のデータと複雑なシミュレーションが必要でした。Cosmos 3は、mixture-of-transformersという新しいアーキテクチャを採用し、物体の相互作用や動き、空間・時間的な関係を理解した上で、動画や動作の軌跡を生成できます。これにより、開発者は少ないデータと低コストでフィジカルAIシステムを構築できるようになります。
3つのモデルで幅広い開発段階に対応
Cosmos 3は、用途に応じて3種類のモデルを提供します。最高品質の「Super」はロボティクスや自動運転のポストトレーニングに最適で、「Nano」は数分の1秒で高品質な動画生成とアクション推論を実現します。また、エッジでのリアルタイム推論に向けた「Edge」も近日公開予定です。これらのモデルは、世界生成やアクションポリシー、視覚理解の各種ベンチマークでトップクラスの結果を達成しています。
Cosmos Coalitionでオープンな開発を加速
NVIDIAは、Cosmos 3の普及と発展を目指し、グローバルなエコシステム「Cosmos Coalition」を立ち上げました。設立メンバーにはAgile Robots、Black Forest Labs、Generalist、LTX、Runway、Skild AIが名を連ねています。参加企業はCosmos 3の技術やトレーニングツール、大規模計算インフラを活用し、モデルや研究成果を共有します。これにより、フィジカルAIのイノベーションが加速することが期待されています。
すでに広がる産業応用
Cosmosプラットフォームは、すでに多くの企業で活用されています。ロボティクスではAgile RobotsやDoosan Robotics、LG Electronics、Samsung、Skild AIが、自動運転ではLiAutoが採用しています。また、産業AIやスマート空間向けのビジョンAIエージェント分野でも、Centific、Fogsphere、Linker Vision、Milestone Systemsなどが利用を進めています。NVIDIAは、ロボティクスや物理学、人間の動作などに関する新しいデータセットやエージェントスキルも提供し、開発を支援しています。
誰でもすぐに試せる環境
Cosmos 3 SuperとNanoは現在利用可能で、Edgeもまもなく登場します。開発者はbuild.nvidia.comで試したり、Hugging Faceからオープンモデルをダウンロードしたりできます。また、Hugging Face DiffusersやGitHubのリソースを使ってモデルのカスタマイズや合成データの生成が可能です。さらに、NVIDIA NIMマイクロサービスとして展開したり、BasetenやCoreWeave、Microsoft Azureなどのクラウドパートナーを通じてアクセスしたりすることもできます。
Q&A
Q. Cosmos 3とは何ですか?
A. NVIDIAが発表したフィジカルAI向けのオープンな基盤モデルで、テキストや画像、動画、音、動作を統合的に理解・生成できます。
Q. Cosmos 3を使うと、具体的に何ができるのですか?
A. ロボットや自動運転車のトレーニング期間を数カ月から数日に短縮したり、物理環境のシミュレーションや動作計画を効率化したりできます。
Q. Cosmos Coalitionとはどのような取り組みですか?
A. Agile RobotsやRunwayなどが参加するグローバルなエコシステムで、オープンな世界基盤モデルの開発と共有を推進する構想です。
関連リンク
- mixture-of-transformers
- NVIDIA Cosmos™ 3
- オムニモデル
- Agile Robots
- 世界的なモデル
- 視覚言語モデル
- 世界行動モデルのバックボーン
- Artificial Analysis
- Physics-IQ
- PAI-Bench
- R-Bench
- RoboLab
- RoboArena
- VANTAGE-Bench
- TAR
- NVIDIA DGX™ Cloud
- フィジカル AI エージェントスキル
- ビジョン AI エージェントの分野
- Fogsphere
- Linker Vision
- Milestone Systems
- build.nvidia.com
- Hugging Face
- GitHub
- NVIDIA NIM™
- Baseten
- CoreWeave
- Nebius
- こちらから
- NVIDIA GTC Taipei
- フィジカル AI のセッション
- プレスリリース
- NVIDIA

O!Productニュース編集部からのコメント
Cosmos 3でロボット開発のトレーニング期間が数カ月から数日に短縮されるのは大きいですね。自社でロボット導入を検討している現場には朗報です。
引用元:PR TIMES
この記事の著者
O!Productニュース編集部


関連ニュース

パーソルイノベーションがLPcats導入で転職応募効率約3倍に改善

uloqo、AIと低コストリソース活用の採用内製化支援を提供開始

PITALIy、LINE登録機能を提供開始 一度きりのWeb訪問を継続接点に

HIKE、「ブランディング・ゲーミフィケーション」パッケージを提供開始

SNS運用代行にAI×プロの分業モデル LIDDELLが「PRST AI+」を提供開始

AIアバター「PITALIy」が対話で営業資料を説明、AIプレゼンモード提供開始

横浜情報機器、「YJK365 Security」で中小企業の攻めのITを支援

フローレンス、Teachme Biz活用で年間6,000時間の余力を創出

営業ハック、展示会フォローコール代行を開始 ~商談創出へ~


