テキストや画像を識別し、生成できる「生成AI」は、深層学習モデルを基盤として成り立っている。生成AIを支える代表的な深層学習モデルを5つ解説する。
テキストや画像、音声、ソースコードなど、さまざまなコンテンツを生成する人工知能(AI)技術である「生成AI」の発展には、深層学習モデルが大きく寄与している。本稿は、その中でも代表的な以下の深層学習モデルについて解説する。
GANは2014年に登場した深層学習モデルだ。「生成ネットワーク」と「識別ネットワーク」の2つのニューラルネットワーク(人間の脳の神経回路を模倣した機械学習モデル)が競い合う仕組みだ。
具体的には、生成ネットワークがコンテンツを生成し、識別ネットワークはAIが生成した画像か、本物の画像かを識別する。この2つが競い合うことで、AIモデルはより本物に近いコンテンツを作成できるようになる。
GANと同じく2014年に登場したVAEは、ニューラルネットワークを使用して、データのエンコード(データを他の形式に変換する)とデコード(元のデータ形式へ復号する) を実施する。これにより、新しいデータを生成する技術を学習する。
エンコーダーはデータを圧縮する過程で、重要な情報のみを抽出し、不要な情報を取り除く。デコーダーは圧縮されたデータをデコードして、入力データを再構成する。このようにして、VAEは効率的にコンテンツを生成できる。
2015年に登場した拡散モデルは、データの拡散過程(ノイズが付与されて破壊される過程)を学習したモデルで、画像生成によく使用される。
拡散モデルでは、まず入力データに徐々にノイズを加えて、ランダムなノイズ分布を作成する。その後、このプロセスを逆転させて、ノイズから新しいデータを生成する。
「DALL・E」や「Midjourney」などの画像生成サービスは、他のAIモデルと併せて拡散モデルを使用している。
言語翻訳を改善するために2017年に登場したトランスフォーマーは、機械学習手法「アテンションメカニズム」を使用する深層学習モデルだ。アテンションメカニズムとは、人間が何かに集中するように、コンピュータも重要な部分に注意を向けられるようにする方法だ。
アテンションメカニズムにより、Transformerは大量のラベル付けされていないテキストを処理し、データセット内の単語やサブワード(単語をさらに分解したもの)間のパターンや関係性を発見できる。
Transformerは、大規模な生成AIモデル、特にLLMの発展を促した。さまざまなLLMが、文脈に基づいたテキストを生成するために、Transformerを使用している。
2020年に登場したNeRFは、機械学習とニューラルネットワークを用いて、2D(2次元)や3D(3次元)のコンテンツを生成できる。さまざまな角度から撮影された2D画像を分析し、3D構造を推測することで、写実的な3Dコンテンツを生成できる仕組みだ。ロボット工学や仮想現実(VR)など、さまざまな分野を発展させる可能性を秘めている。
代表的な生成AIツールとして、
などがある。
生成AIにはさまざまなモデルやツールがあり、以下のような幅広い用途に活用できる。
生成AIツールの特徴や機能は個々に異なる。適切な生成AIツールを選ぶには、自社の目的に合った機能を備えているかどうかを調査することが欠かせない。
次回は、半世紀にわたるLLMの歴史について解説する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
LLMはビジネスに計り知れない恩恵をもたらす可能性を秘めているが、問題点の1つは、平気でうそをつくこと(ハルシネーション)だ。そこで、この問題を解決するために役立つ、RAGアプリケーションの作成方法を紹介する。
生成AIの登場によって、AIを業務活用しようとする企業が増えてきている。しかし、AIをどのような形で導入すればよいのか悩んでいる企業も少なくない。本資料では組織全体にAIと生成AIを組み込む方法について解説する。
労働力不足の解消や生産性の向上など、多くのメリットが見込める、職場へのAI導入。一方、LLM(大規模言語モデル)の学習データが枯渇する「2026年問題」が懸念されている点には注意が必要だ。それによる影響と、企業が取るべき対策とは?
現代のビジネス環境下で企業が成長を続けるには「イノベーション」の推進が不可欠だ。最新調査で明らかになった日本企業におけるイノベーションの現状を基に、イノベーション推進の鍵を握るAI活用やベロシティ向上の重要性を解説する。
今やビジネスを中心に、多様な場面でやりとりされているPDF。このPDFをより便利にするためには、文書の能動的な活用がポイントとなる。本資料では、アドビの生成AIを用いながら生産性や効率を飛躍的に向上させる活用方法を紹介する。
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...
Cookieを超える「マルチリターゲティング」 広告効果に及ぼす影響は?
Cookieレスの課題解決の鍵となる「マルチリターゲティング」を題材に、AI技術によるROI向...