検索
特集/連載

【G検定】AIモデルへの「データ汚染」、正しくない説明はどれ?『ディープラーニングG検定 最強の合格問題集』出張版

AIの基礎から法律・倫理まで幅広い領域が問われる資格「G検定」。試験範囲の中でも重要度の高いテーマを1問ずつ取り上げ、理解の定着に役立つポイントを確認していきます。今回はAIモデル(機械学習モデル)への攻撃の一種である「データ汚染」についてです。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

 「G検定」(ジェネラリスト検定)は、AI(人工知能)技術全般、特に機械学習やディープラーニングの基礎を体系的に学ぶ資格試験です。AI人材の需要の高まりとともに受験者数は年々増加しており、企業でも従業員への取得を奨励する動きが広がっているそうです。

 本記事はSBクリエイティブ刊『ディープラーニングG検定(ジェネラリスト)最強の合格問題集[第2版]』(ヤン・ジャクリン 著)から、G検定の出題範囲を踏まえた問題と解説を1問1答形式で紹介します。今回はAIモデル(機械学習モデル)への攻撃手法の一種である「データ汚染」を押さえる1問です。

書籍紹介

ディープラーニングG検定(ジェネラリスト)最強の合格問題集[第2版]

ディープラーニングG検定(ジェネラリスト)
最強の合格問題集[第2版]

著者:ヤン・ジャクリン

SBクリエイティブ 2,805円

究極の332問+模試2回(PDF)

G検定の問題集の決定版がパワーアップ!

効率的に1発合格をサポートします。

購入ページはこちら


問題

データ汚染について、最も不適切な選択肢を1つ選べ。

1.AIモデルの学習データを収集または加工する工程の中で、データに加えられる攻撃である。

2.画像データの特定の画素に加える変更は、慎重に観察してはじめて目視で気付けるくらい巧みなものである。

3.データ汚染は悪用だけではなく、人間社会にとって有益な使い方も可能である。

4.摂動を加えたデータを学習データに混入させると、それを学習したモデルは特定のクラスについて、入力データの誤分類をする可能性がある。


――答えは分かりましたか?



正解と解説

正解は「2.画像データの特定の画素に加える変更は、慎重に観察してはじめて目視で気付けるくらい巧みなものである。」

 データ汚染で加える変更は目視では確認できないくらい微小なものです

  • 選択肢1、4:データ汚染とは、AI・機械学習モデルの学習データに加えられる攻撃です。学習データの一部に「摂動」を加え、それをモデルに学習させることで、特定のクラスについて、入力データの誤分類を恣意的に引き起こします。
  • 選択肢2:画像データの場合、「摂動」とは、特定の画素(ピクセル)に目視では認識できないような微小な変更操作を加えることです。目視では認識できなくても、機械学習モデルを「騙す」ことで、誤った判断をさせる可能性があります。
  • 選択肢3:データ汚染は人間社会のセキュリティを守るためにも使われます。例えば、顔写真の漏洩や悪用による様々な被害を防ぐために、顔画像をウェブに投稿する前に、データ汚染(画像への摂動)でプライバシー保護の加工を行うツールが開発されています。

※この記事はSBクリエイティブ刊『ディープラーニングG検定(ジェネラリスト)最強の合格問題集[第2版]』から、アイティメディアが出版社の許可を得て一部加筆編集の上、転載したものです(無断転載禁止)。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る