生成AIが書いた「きれいな文」に混入する“AIのわずかな痕跡”はこれだ:AI生成コンテンツを見分けられるか?【第6回】
AIモデルによる出力結果の精度が高まる中で、AIモデル製のコンテンツと人間製のコンテンツの判別が難しくなっている。見分けるにはどのような特徴に着目すればいいのか。
LLM(大規模言語モデル)が膨大なデータを学習するにつれ、テキストや画像などを自動生成するAI(人工知能)技術「生成AI」(ジェネレーティブAI)の精度は向上している。コンテンツが人間製なのか、それともAIモデル製なのかを判別するのは、もはや極めて難しくなりつつある。ただし見分けるための“こつ”はある。どのような特徴を見ればいいのか。
「AI」を見抜くための複数の着眼点
併せて読みたいお薦め記事
連載:AI生成コンテンツを見分けられるか?
- 第1回:「AI製なのかどうか」を人間にはもう見破れない現実
- 第2回:それ、AI製? 人には判別不能でも「検出ツール」なら見破れるのか
- 第3回:AIチェッカーに「自筆」と「AIポエム」を判別させたら面白い結果に
- 第4回:AI検出は「ChatGPTの文」をどこまで見抜けるのか? 複数ツールで試してみた
- 第5回:「生成AI」対「AIコンテンツ検出ツール」 勝ったのはどっち?
生成AIのリスクに関する記事
AI技術の法的および技術的リスクを専門とする法律事務所Luminos.Lawで主席サイエンティストを務めるパトリック・ホール氏は、AIベンダーに対し、以下のような予防手段を講じるよう呼び掛ける。
- AIモデルが生成したコンテンツにウオーターマーク(透かし)を入れる
- 生成AIツールを提供する際、信頼性のある「AIコンテンツ検出ツール」を付属にする
生成AIコンテンツ検出ツールは、将来的に信頼できるものとして日常的に受け入れられるようになる可能性がある。それまでの間は、探偵シャーロック・ホームズや刑事コロンボになったつもりで、経験と直感に頼り、コンテンツ内の「AIモデルが残した痕跡」を探すのが最善だ。
例えば以下に示す7つのポイントは、AIモデルが出力したコンテンツである可能性が高い傾向にある。
1.画一的な文章構成
AIモデルが生成したコンテンツは、文の長さや構成に一貫性があり過ぎたり、画一的になり過ぎたりする傾向がある。人間が書いた文章の機敏さや複雑さと比較すると、ひどく退屈で単調な印象を受けることもある。
2.繰り返される単語やフレーズ
AIモデルが出力できる語彙(ごい)は、LLMによって制限されている。人間ならばより良い代替の単語やフレーズを使用する場面でも、AIが生成したコンテンツは全体的に同じ表現を繰り返す場合がある。
3.矛盾
AIモデルが生成したコンテンツは、解釈的な分析や文脈の整理、首尾一貫した議論ができていない場合がある。特に、出力要件が複雑過ぎる場合にこの傾向が顕著だ。
第7回も、引き続きAIモデルが生成したコンテンツを見分ける際に着目すべきポイントを解説する。
TechTarget発 世界のインサイト&ベストプラクティス
米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.