
AIエージェントの「暴走リスク」を動的に制御、AIセーフティ基盤「datagusto」提供開始
公開日:
株式会社datagustoは2025年12月11日、AIエージェントの意図しない挙動によるインシデントを未然に防ぐ、AIセーフティプラットフォーム「datagusto(データグスト)」の提供を開始しました。企業のAI活用が業務自動化へと進む中で顕在化してきた「AIの暴走リスク」に対し、リアルタイムで挙動を検知・抑止する新たなアプローチで、安全なAI運用を支援します。
ポイント
- 1従来の禁止リスト方式では防げない「想定外」のインシデントをリアルタイムに検知・抑止
- 2外部攻撃対策(Security)だけでなく、AI自身の誤動作(Safety)という内部リスクに特化
- 3検証実験ではインシデント阻止率100%を達成、既存の開発環境にも容易に統合可能
AIエージェントの「安全運用」という新たな課題
企業のAI活用は、単なる検索や文章生成から、複数の社内システムを横断して自律的に業務をこなす「AIエージェント」の段階へと進化しています。しかし、その高度化・自律化に伴い、AIが想定外の動作をしたり、誤った判断を下したりする「意図しない挙動」のリスクが大きな課題となりつつあります。
海外では、AIが本番環境のデータベースを完全に消去するという深刻なインシデントも報告されており、従来の対策の限界が指摘されてきました。これまでの主な対策は、事前に禁止事項をリスト化する「静的ガードレール」でしたが、この手法では想定外の事態に対応できず、運用するAIが増えるほど設定が複雑化するという問題がありました。
リアルタイム検知で「想定外」を防ぐ
今回リリースされた「datagusto」は、AIエージェントの挙動をリアルタイムで監視し、その状況に応じて「やって良いこと/悪いこと」の境界線を動的に生成・適用する「動的ガードレール」という独自技術を採用しています。これにより、静的なルールでは防ぎきれなかった「AIのうっかりミス」や「暴走」といったインシデントを未然に防ぐことが可能になります。
このプラットフォームは、外部からの悪意ある攻撃を防ぐ「セキュリティ」対策だけでなく、AI自身の認識の齟齬や誤動作といった「セーフティ(安全性)」の確保に特化している点が特徴です。
検証ではインシデントを100%阻止、導入も容易
datagusto社がAIの安全性評価ベンチマークを用いて実施した検証実験では、従来の静的ガードレールでは防げなかったインシデントを100%阻止する結果を実証したとのことです。
また、DifyやLangGraph、OpenAI Agent SDKなど、主要なAIエージェント開発フレームワークとAPI連携などで簡単に組み合わせることができ、既存環境への導入もスムーズに行えます。モデル更新のたびに発生していた膨大なガードレールの再設定工数を削減し、開発者がより創造的な業務に集中できる環境作りにも貢献します。
同社は今後、複数のAIエージェントが連携して動く「マルチエージェント社会」を見据え、AIの信頼性を評価・スコアリングする機能開発も進める方針です。AI社会の「信頼」を支えるインフラとなることを目指すとしています。
引用元:PR TIMES

O!Productニュース編集部からのコメント
AIエージェントの普及には、利便性の追求とリスク管理の両立が不可欠です。「datagusto」のようなSafety対策技術は、企業が安心してAI導入のアクセルを踏むための重要な鍵となりそうですね。









