生成AIが書いた「きれいな文」に混入する“AIのわずかな痕跡”はこれだAI生成コンテンツを見分けられるか?【第6回】

AIモデルによる出力結果の精度が高まる中で、AIモデル製のコンテンツと人間製のコンテンツの判別が難しくなっている。見分けるにはどのような特徴に着目すればいいのか。

2024年02月17日 11時15分 公開
[Ron KarjianTechTarget]

 LLM(大規模言語モデル)が膨大なデータを学習するにつれ、テキストや画像などを自動生成するAI(人工知能)技術「生成AI」(ジェネレーティブAI)の精度は向上している。コンテンツが人間製なのか、それともAIモデル製なのかを判別するのは、もはや極めて難しくなりつつある。ただし見分けるための“こつ”はある。どのような特徴を見ればいいのか。

「AI」を見抜くための複数の着眼点

 AI技術の法的および技術的リスクを専門とする法律事務所Luminos.Lawで主席サイエンティストを務めるパトリック・ホール氏は、AIベンダーに対し、以下のような予防手段を講じるよう呼び掛ける。

  • AIモデルが生成したコンテンツにウオーターマーク(透かし)を入れる
  • 生成AIツールを提供する際、信頼性のある「AIコンテンツ検出ツール」を付属にする

 生成AIコンテンツ検出ツールは、将来的に信頼できるものとして日常的に受け入れられるようになる可能性がある。それまでの間は、探偵シャーロック・ホームズや刑事コロンボになったつもりで、経験と直感に頼り、コンテンツ内の「AIモデルが残した痕跡」を探すのが最善だ。

 例えば以下に示す7つのポイントは、AIモデルが出力したコンテンツである可能性が高い傾向にある。

1.画一的な文章構成

 AIモデルが生成したコンテンツは、文の長さや構成に一貫性があり過ぎたり、画一的になり過ぎたりする傾向がある。人間が書いた文章の機敏さや複雑さと比較すると、ひどく退屈で単調な印象を受けることもある。

2.繰り返される単語やフレーズ

 AIモデルが出力できる語彙(ごい)は、LLMによって制限されている。人間ならばより良い代替の単語やフレーズを使用する場面でも、AIが生成したコンテンツは全体的に同じ表現を繰り返す場合がある。

3.矛盾

 AIモデルが生成したコンテンツは、解釈的な分析や文脈の整理、首尾一貫した議論ができていない場合がある。特に、出力要件が複雑過ぎる場合にこの傾向が顕著だ。


 第7回も、引き続きAIモデルが生成したコンテンツを見分ける際に着目すべきポイントを解説する。

TechTarget発 世界のインサイト&ベストプラクティス

米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ITmedia マーケティング新着記事

news037.jpg

Boseが新型イヤホンをアクセサリーに CMOが語る「オシャレ推しに転じた理由」は?
2024年2月にオープンイヤー型のイヤホン「Bose Ultra Open Earbuds」を発売したBose。従...

news005.jpg

「コミュニティー」の正解はオフライン? オンライン? トレジャーデータがコロナ禍で学んだこと
Treasure Data CDPユーザーが主体となって活動するコミュニティー「Treasure Data Rockst...

news170.jpg

ニトリやサツドラも導入 自社ECで「Amazonのようなビジネス」を実現するサービスの魅力
オンラインマーケットプレイス構築を支援するMiraklが日本で初のイベントを開催し、新た...