すべて
タグ
Qlean Dataset、500万時間超の長尺動画データセットを提供開始
リリース
AI関連

Qlean Dataset、500万時間超の長尺動画データセットを提供開始

公開日:

AI開発用のデータソリューションを手がけるVisual Bankは、同社の「Qlean Dataset(キュリンデータセット)」において、500万時間を超える「ロングコンテキスト動画データセット」の提供を開始したと発表しました。近年のAI技術、特に長時間にわたる文脈を理解するモデルの開発が加速する中で、その学習基盤となる大規模な映像データへの需要に応える動きです。

この記事をシェア

ポイント

  • 1
    テレビ番組から監視カメラまで、500万時間超の多様な長尺映像を収録
  • 2
    長時間の文脈を理解する「ロングコンテキストAI」の開発需要に対応
  • 3
    権利処理済みで、研究開発から商用利用まで安心して活用可能

Visual Bank株式会社は、傘下のアマナイメージズを通じてAI学習用データソリューション「Qlean Dataset」を展開しています。今回、その新たなラインナップとして「ロングコンテキスト動画データセット」の提供を開始しました。このデータセットは、総収録時間が500万時間を超える大規模なもので、AI開発の現場を力強く支援します。

この動きの背景には、GPTやGeminiに代表される、長時間・大量の情報を一度に処理できる「ロングコンテキスト対応AI」の台頭があります。映像や音声、テキストといった多様な情報を時間的な文脈の中で統合的に理解するAIモデルの開発が世界的に進んでおり、その学習に不可欠な、質の高い長尺動画データへのニーズが急速に高まっていました。

今回提供が始まったデータセットには、テレビ番組やスポーツ中継、海外のアニメ・映画、SNSの短尺動画、さらには監視カメラや風景映像まで、極めて幅広いジャンルの実映像が含まれています。これらの映像は、登場人物の行動や会話、環境の変化などがそのまま収録されており、AIが現実世界に近い文脈を学習する上で最適な構成となっています。

すべてのデータは権利処理が完了しており、研究開発だけでなく商用サービスへの利用も可能です。動画生成AIのトレーニングやスポーツの戦術分析、放送映像の自動要約、監視システムにおける異常検知など、多岐にわたる分野での活用が期待されています。Visual Bankは、AI開発におけるデータ収集・整備の負担を軽減し、法的リスクのない開発環境の実現に貢献するとしています。

引用元:PR TIMES

O!Productニュース編集部

O!Productニュース編集部からのコメント

AI開発はデータが命ですが、これほどの規模と多様性を持つ長尺動画データは貴重ですね。特に権利クリア済みなのは、ビジネス活用を目指す企業にとって大きな後押しとなりそうです。日本のAI競争力向上に期待したいところです。

この記事をシェア

関連ニュース

ストックフォトサービス(写真・動画・イラスト)のプロダクト

この記事を読んだ人はこんなタグにも興味があります

この記事をシェア