「CNN」「GAN」は何に使える? ディープラーニングの基本用語深層学習モデルの仕組み【後編】

もはや身近な画像識別AIや生成AIだが、その基礎となる深層学習モデルについて知らない人は多いのではないだろうか。主要モデル「CNN」「GAN」の特徴と、モデル選びで重要なポイントを解説する。

2024年03月04日 05時00分 公開
[George LawtonTechTarget]

関連キーワード

人工知能 | 機械学習


 もはや日常に欠かせない画像生成AI(人工知能)や画像識別AIだが、これらの技術を支えるのが深層学習(ディープラーニング)だ。代表的なモデルとして以下の2つがある。

  • CNN(Convolutional Neural Network:畳み込みニューラルネットワーク)
  • GAN(Generative Adversarial Network:敵対的生成ネットワーク)

 CNNはGANの一部として使用されるなど類似する点があるものの、そのユースケース(想定される活用例)は異なる。両モデルの特徴や関係性と併せて解説する。

「CNN」「GAN」とは? ユースケースと併せて解説

 CNNは「畳み込み処理」により画像の特徴を抽出する深層学習モデルで、主に画像認識用途で使用される。画像内の顔や、音声の特徴を認識するために使用される他、オーディオ信号の解釈にも最適だ。具体的なユースケースとしては以下のようなものがある。

  • 文章の読み取り
  • 病状の把握や画像診断
  • 生体認証
  • 製品の外観検査や異常音判定
  • カスタマーサービスにおける顧客の声の感情認識

 GANは、主に文字や顔などの画像生成用途で使われる。「逆畳み込み」と呼ばれる処理で特徴をもとに画像を生成し、本物そっくりな人物や音声、その他の特性を生成できる。具体的なユースケースとしては、以下のようなさまざまな用途に利用されている。

  • 特定個人にそっくりな顔や、声と口調の合成、生成
    • 「ディープフェイク」と呼ばれる偽(フェイク)の画像、動画、音声による問題を引き起こす場合がある
  • ニュースや詩、ソースコードなどのテキスト生成
  • 創薬プロセスにおける化合物生成

CNNとGANの使用で注意すべきことは?

 近年はテキストや画像などを自動生成するAI技術「生成AI」(ジェネレーティブAI)の登場により、GANに注目が集まる傾向にあるが、CNNはGANの一部として真正性の判断に使用されている。

 AI技術を用いたサプライチェーン最適化ベンダーToolsGroupのCTO(最高変革責任者)ピエール・クストー氏は、CNNとGANのニューラルネットワークを相互補完的なものだと説明する。「CNNは画像処理に非常に有効だ。GANの生成ネットワークも識別ネットワークも元はCNNだ」(クストー氏)

 ITコンサルタント企業SPRのCTOマシュー・ミード氏は、CNNとGANを組み合わせる場合、組み合わせ方に注意が必要だと話す。「GANは通常、画像データを扱う際の識別ネットワークとしてCNNを使用する。一方で、CNNではGANを使用しない」

 初期のGANは、比較的単純で解像度の低い顔画像を生成していた。GANへの関心が高まった理由の一つに、計算量あたりのコストが劇的に低下したことがある。より複雑なニューラルネットワークを構築できるようになったことで設計が進歩し、「トランスフォーマー」「変分オートエンコーダ」「拡散モデル」など他の生成AIモデルの開発にも貢献した。

 コンサルティング企業SSA & Companyでプリンシパルデータサイエンティストを務めるジョン・ブランケンベイカー氏は、「深層学習モデルの活用において重要なのは、深層学習モデルそのものよりも、具体的な用途や目標、データを考えることだ」と話す。特に、モデルをトレーニングするためのデータの品質確保が課題だという。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

髫エ�ス�ス�ー鬨セ�ケ�つ€驛「譎擾スク蜴・�。驛「�ァ�ス�、驛「譎冗樟�ス�ス驛「譎「�ス�シ驛「譏懶スサ�」�ス�ス

製品資料 グーグル・クラウド・ジャパン合同会社

約80%の企業でAIが定着していない? その理由と成功させるためのポイントとは

生成AIを活用して業務や顧客体験の再構築を進める動きが活性化しているが、その多くが、PoCやラボ環境の段階にとどまっている。なぜなら、生成AIの可能性を最大限に引き出すための、インフラのパフォーマンスが不十分だからだ。

市場調査・トレンド グーグル・クラウド・ジャパン合同会社

ソフトウェア開発ライフサイクルにおける、生成AI活用のポイントを考察する

昨今のソフトウェア開発では、AIコーディングアシスタントの活用が主流になっている。しかし、最適なコーディングアシストツールは、開発者や企業によって異なるという。導入の際は、どのようなポイントに注意すればよいのか。

製品資料 グーグル・クラウド・ジャパン合同会社

データベースをモダナイズし、生成AIを最大限に活用する方法とは?

生成AIの活用にはデータベースが重要となるが、従来のデータベースは最新テクノロジーに対応できないなどの課題がある。本資料では、データベースをモダナイズし、生成AIを用いてビジネスイノベーションを生み出すための方法を探る。

製品資料 グーグル・クラウド・ジャパン合同会社

検索体験と結果の質をどう高める? ユーザーに喜ばれる検索体験を実現する方法

ビジネスにおいて、検索体験およびその結果の質の向上が重要なテーマとなっている。顧客はもちろん、自社の従業員に対しても、実用的な答えをより迅速に、手間なく入手できる環境の整備が求められている。

事例 グーグル・クラウド・ジャパン合同会社

検索の効率化からデータ活用まで、生成AIの業務組み込み事例5選

登場以来ビジネスへの活用方法が模索されてきた生成AI。近年では業務組み込みにおける具体的な成功例が数多く報告されている。本資料では、5件の生成AI活用事例を交えて、業務に組み込む上での具体的なアプローチを解説する。

驛「譎冗函�趣スヲ驛「謨鳴€驛「譎「�ス�シ驛「�ァ�ス�ウ驛「譎「�ス�ウ驛「譎「�ソ�ス�趣スヲ驛「譎「�ソ�スPR

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

「CNN」「GAN」は何に使える? ディープラーニングの基本用語:深層学習モデルの仕組み【後編】 - TechTargetジャパン エンタープライズAI 髫エ�ス�ス�ー鬨セ�ケ�つ€鬮ォ�ェ陋滂ソス�ス�コ�ス�ス

TechTarget驛「�ァ�ス�ク驛「譎「�ス�」驛「譏懶スサ�」�趣スヲ 髫エ�ス�ス�ー鬨セ�ケ�つ€鬮ォ�ェ陋滂ソス�ス�コ�ス�ス

ITmedia マーケティング新着記事

news014.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news046.png

「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news026.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...