OpenAIが、テキストから約1分間の映像を生成できる「Sora」を発表。競合のAI技術ベンダーと「互角の勝負になる」という見方がある一方、OpenAI自身も認める弱点がある。
人工知能(AI)技術ベンダーOpenAIは2024年2月15日(現地時間)、テキストから映像を生成できるAIモデル「Sora」を発表した。同社によると、Soraはユーザーの質問や指示(プロンプト)に応じて約1分間の映像を生成。複数のキャラクター、特定の動き、被写体の細部を描写した複雑なシーンを生み出せる。
このAIモデルは一般公開せず、AI技術のリスクを検証するために同社が組織した専門家のコミュニティー「レッドチーム」のメンバー(ビジュアルアーティスト、デザイナー、映画制作者など)が利用できる。
近ごろは生成AIを巡る競争が激化している。OpenAIがSoraをリリースした同日、Googleは生成AIモデル「Gemini」の最新バージョンである「Gemini 1.5」を発表。競合のAI技術ベンダーStability AIも、新しい画像生成のAIモデル「Stable Cascade」を2024年2月12日(現地時間)に発表していた。AI技術を使った画像生成サービスを提供するMidjourneyも、映像生成技術に取り組んでいる。
テキストから映像への変換に取り組んでいるベンダーは、OpenAIが初ではない。しかし今回のOpenAIの発表は、同社がこの市場で競争力があることを示すものだと、調査会社Constellation Researchの創設者R・レイ・ウォン氏は指摘する。
同氏は「OpenAIがSoraを発表し、レッドチームが利用できることを研究者に公表したことは、市場にくさびを打ち込んだ」と述べ、「Stability AIとMidjourneyに対して、Soraは互角の勝負ができる」とみている。
一方、OpenAIによるSoraの先行導入とレッドチームの取り組みは、プロジェクトの安全性をどのように確保し、悪用を防ぐのかという疑問を生んだと、調査会社Gartnerのアナリストであるアルン・チャンドラセカラン氏は指摘する。
「この技術が本当に新しいものであることを考慮すると、悪用されたり、顧客が新技術の限界を理解しないまま使用したりしないように、十分な制限を設ける必要がある」と同氏は主張。OpenAIがAIモデルに対する安全策を設け、誰が利用できるかをどのように認定するのかが重要だと付け加える。
OpenAIは、Soraにはまだ弱点があることを認識している。複雑なシーンを正確にシミュレートするのに苦戦したり、プロンプトの空間に関する細部を混同し、左右を取り違えたりする可能性があるという。
同社は、誤解を招くコンテンツを検出し、いつSoraが生成した映像なのかを知ることができるツールを構築中だと説明している。
新製品・新サービスや調査結果、セキュリティインシデントなど、米国TechTargetが発信する世界のITニュースをタイムリーにお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
ハロウィーンの口コミ数はエイプリルフールやバレンタインを超える マーケ視点で押さえておくべきことは?
ホットリンクは、SNSの投稿データから、ハロウィーンに関する口コミを調査した。
なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...
業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...