生成AIが書いた「きれいな文」に混入する“AIのわずかな痕跡”はこれだAI生成コンテンツを見分けられるか?【第6回】

AIモデルによる出力結果の精度が高まる中で、AIモデル製のコンテンツと人間製のコンテンツの判別が難しくなっている。見分けるにはどのような特徴に着目すればいいのか。

2024年02月17日 11時15分 公開
[Ron KarjianTechTarget]

 LLM(大規模言語モデル)が膨大なデータを学習するにつれ、テキストや画像などを自動生成するAI(人工知能)技術「生成AI」(ジェネレーティブAI)の精度は向上している。コンテンツが人間製なのか、それともAIモデル製なのかを判別するのは、もはや極めて難しくなりつつある。ただし見分けるための“こつ”はある。どのような特徴を見ればいいのか。

「AI」を見抜くための複数の着眼点

 AI技術の法的および技術的リスクを専門とする法律事務所Luminos.Lawで主席サイエンティストを務めるパトリック・ホール氏は、AIベンダーに対し、以下のような予防手段を講じるよう呼び掛ける。

  • AIモデルが生成したコンテンツにウオーターマーク(透かし)を入れる
  • 生成AIツールを提供する際、信頼性のある「AIコンテンツ検出ツール」を付属にする

 生成AIコンテンツ検出ツールは、将来的に信頼できるものとして日常的に受け入れられるようになる可能性がある。それまでの間は、探偵シャーロック・ホームズや刑事コロンボになったつもりで、経験と直感に頼り、コンテンツ内の「AIモデルが残した痕跡」を探すのが最善だ。

 例えば以下に示す7つのポイントは、AIモデルが出力したコンテンツである可能性が高い傾向にある。

1.画一的な文章構成

 AIモデルが生成したコンテンツは、文の長さや構成に一貫性があり過ぎたり、画一的になり過ぎたりする傾向がある。人間が書いた文章の機敏さや複雑さと比較すると、ひどく退屈で単調な印象を受けることもある。

2.繰り返される単語やフレーズ

 AIモデルが出力できる語彙(ごい)は、LLMによって制限されている。人間ならばより良い代替の単語やフレーズを使用する場面でも、AIが生成したコンテンツは全体的に同じ表現を繰り返す場合がある。

3.矛盾

 AIモデルが生成したコンテンツは、解釈的な分析や文脈の整理、首尾一貫した議論ができていない場合がある。特に、出力要件が複雑過ぎる場合にこの傾向が顕著だ。


 第7回も、引き続きAIモデルが生成したコンテンツを見分ける際に着目すべきポイントを解説する。

TechTarget発 世界のインサイト&ベストプラクティス

米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ITmedia マーケティング新着記事

news103.jpg

なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...

news160.jpg

業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...

news210.png

SEOを強化するサイトの9割超が表示速度を重視 で、対策にいくら投資している?
Reproが「Webサイトの表示速度改善についての実態調査 2024」レポートを公開。表示速度改...