生成AIは業務をはじめさまざまな場面で利用できる“便利ツール”となりつつある。プロンプトを入力するだけで、画像や音楽を生成できるAIツール10選を紹介する。
文章や画像を自動生成するAI(人工知能)技術「生成AI」の進化は目覚ましく、業務をはじめさまざまな場面で活用が期待されている。本稿は、生成AIツールの中でも画像や音楽の生成に役立つツール10選を紹介する。
Craiyon (旧称「DALL・E mini」)は、Googleと人工知能(AI)技術ベンダーHugging Faceの研究者が開発した画像生成AIツールだ。プロンプト(情報を生成するための指示や質問文)に応じて画像を生成する。Midjourneyの同名サービスやStability AIの「Stable Diffusion」、AIベンダーOpenAIの画像生成AIモデルを利用した「DALL・E」と比べて、画像の品質は劣るという声もある。
シンプルなテキストから画像を生成できるツールだ。オブジェクト(画像に存在する特定の物体や要素)を削除したり、画像の質感を変更したりして、画像をリアルな状態に編集できる。ランダムなドットパターンから画像を生成する拡散モデル(Diffusion Model)を使っている。OpenAIが提供するAIチャットbot「ChatGPT」と連携も可能だ。
ボイスチャットサービス「Discord」かWebサイトでプロンプトを入力すると、画像を生成するツールだ。Midjourneyが出力した画像は、写真よりも絵画に似ているという声もある。
プロンプトを基に写実的な画像を生成する。画像の中で欠けている部分を補完したり、不要なオブジェクトを削除したりすることが可能だ。Stability AIが運営するStable Diffusionの公式WebサイトDreamStudioやAI開発プラットフォーム「Hugging Face」などで使用できる。
録音した音源から音楽を生成するツールだ。曲の長さやサビの位置を指定することで好みの曲を作ることができる。
深層学習モデル「RNN」(Recurrent Neural Network:回帰型ニューラルネットワーク)を使用して音楽を生成している。Dadabotsは、同ツールで作成したさまざまなジャンルの音楽を動画共有ツール「YouTube」で24時間配信している。
説明文や音源サンプル、デバイスのマイクから直接録音した音声クリップから音楽を生成できる。Hugging Faceで利用可能だ。
曲の長さやサビの位置、楽器の種類などを指定して著作権フリーの音楽を生成できる。
プロンプトに基づいて曲を生成する。AIアシスタント「Microsoft Copilot」のプラグインとしても利用できる。
音楽のジャンルやボーカルの音、歌詞の他、プロンプトを入力して曲を生成する。曲の一部を編集できるオーディオインペインティングといった有料の機能もある。
次回は、ソースコードの生成に役立つAIツールを紹介する。
TechTarget.AI編集部は生成AIなどのサービスを利用し、米国TechTargetの記事を翻訳して国内向けにお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。