2024年12月、Luma AIは動画生成AI「Ray 2」を発表した。社会にどのようなインパクトをもたらすのか。同モデルの押さえておくべき特徴と併せて解説する。
「映像制作の現場だけでなく、幅広い業界に大きなインパクトをもたらし得るものだ」――。AI(人工知能)技術を手掛けるスタートアップのLuma AIでCEOを務めるアミット・ジェイン氏は、2024年12月に発表した動画生成モデル「Ray 2」についてこう語った。同モデルはAmazon Web Services(AWS)の生成AIサービス「Amazon Bedrock」を通じて利用できるようになる計画だ。
Ray 2はどのような特徴を持つAIモデルで、社会にどういった影響をもたらすのか。2024年12月2~6日(現地時間)にAWSが米ラスベガスで開催した年次イベント「AWS re:Invent」での取材を基に解説する。
Ray 2は最大1分間のビデオを生成でき、前身モデル「Dream Machine」の5秒から大きく進化している。将来的にはより長時間のコンテンツも作れるようになる見込みだ。1920×1080ピクセル(フルHD)のビデオを生成でき、将来的には4K(4000×2000ピクセル前後の解像度)も生成可能になる計画だという。
Ray 2の代表的な特徴の一つが、一貫性のあるストーリーを生成できる点だ。具体的には、コンテンツ内の出来事や状況、登場人物の外見的および内面的な特徴を記憶できる。もし登場人物が怒っていた場合、再登場の際にその感情が反映されるといった具合だ。
カメラワーク機能もRay 2の特筆すべき特徴だ。例えば、「この人物の周りをカメラで一周して」という風に自然言語で指示を出してカメラの動きを操作することが可能。レンズの絞りや焦点距離などを調整することもできる。
加えて、Luma AIのAIモデルは「コスト効率に優れる」という強みがある。同社の画像生成モデル「Photon」では、1枚の画像を生成するコストは0.0002ドル(0.2セント)と、「一般的な画像生成モデルの約10分の1」だとジェイン氏は説明する。
Luma AIのAIモデルを採用するメインユーザー層は、映画やテレビ番組、YouTube動画の制作者など、いわゆる映像関連職に就く人々だ。一方、広告代理店や、マーケティングを強化したい企業からも強い需要があるという。「企業は製品のストーリーをビジュアル化し、顧客に伝える必要がある。映像とは関係のないビジネスを展開する企業でも、広告を出したり、販促用の資料を作ったりする必要がある」とジェイン氏は説明した。
服飾デザイナーや建築家といったデザイン系職種からも大きな反響を得ているという。例えば服飾のプロセスでは、まず誰かがスケッチを作成し、別の人が素材を選んで縫製し、数週間後に完成品が出来上がる。Luma AIのAIモデルを使えば、スケッチを基にあらゆる素材やデザインのイメージを生成できる。画像からビデオを生成して、異なる人や場所での着用イメージ、素材の動き方を確認することも可能だ。ビデオ中の人物に対して「ジャンプさせて」「歩かせてみて」といった指示を出すこともできる。
品質、生成速度、コスト効率に優れたLuma AIのAIモデルを使うことで、デザイナーや映像制作者は何千もの実験的なアイデアを効率的に試せるようになる。その結果、より良いアイデアを発見できるようになるだけでなく、アイデアの実現可能性が飛躍的に高まる。
実際に撮影した映像と、仮想的に生成した映像をリアルタイムで融合させる映像制作手法「バーチャルプロダクション」や、超現実的な映像を作り出す「VFX」(Visual Effects)技術は、既に制作現場で活用されている。一方、これらの技術は膨大な時間とコストを要する。「200億ドル規模の予算を持たなければ、低品質のコンテンツしか作れないのが現状だ。当社のAIモデルを活用すれば、10~20人程度の小規模チームでも大ヒット作並みのスケールの作品を制作できるようにしたい」(ジェイン氏)
Luma AIはAWSとのパートナーシップを締結しており、AI開発タスクを一元管理するマネージドサービス「Amazon SageMaker Hyperpod」を用いてAIモデルの効率的な訓練を実現している。BedrockからRay 2が提供されることで、ユーザーはAIモデルをセキュアかつスケーラブルな環境で利用できるようになる。Luma AIは将来的にPhotonなど他のAIモデルもBedrockから提供できるようにする計画だ。
Copyright © ITmedia, Inc. All Rights Reserved.
プロジェクト管理ツールの乱立を解消するため、一本化を検討するケースが増えている。重要な点は“情シス目線”で選定することだ。そこで8つの主要ツールを比較し、多様な業務に対応しつつ、全社最適も実現できるツールの条件を探った。
組織のスリム化を目指し、バックヤード業務を1つの部署に集約したものの、チームごとに業務管理の方法が異なるという、新たな課題を抱えることになったネクスウェイ。これを解決すべく、同社が採用したアプローチとは?
リアルタイム性や生成AI対応などデータベースに対する期待が急速に高まっている。そこで従来のPostgreSQLでは対応が難しかったスピードやスケーラビリティの課題を解消したデータ基盤が注目されている。本資料で詳細を解説する。
生成AIを業務に生かすには、回答の正確性やセキュリティなど、多くの課題を解決する必要がある。そこで注目したいのが、オペレーショナルデータベースと、検索拡張生成(RAG)技術を組み合わせるアプローチだ。
多くの企業でアジャイル開発の手法が取り入れられるようになった一方、欧米企業を中心にアジャイル開発の大規模化が普及している。これに伴い、「テストの工数やコストの増大」「製品全体像の把握の難しさ」といった課題が出てきた。
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...
Cookieを超える「マルチリターゲティング」 広告効果に及ぼす影響は?
Cookieレスの課題解決の鍵となる「マルチリターゲティング」を題材に、AI技術によるROI向...