検索
特集/連載

「生成AI」対「AIコンテンツ検出ツール」 勝ったのはどっち?AI生成コンテンツを見分けられるか?【第5回】

生成AIが出力したコンテンツの、正確性の欠如や法的侵害といったリスクが問題となっている。AI製なのかどうかを見分ける手段が必要だ。その方法として「AIコンテンツ検出ツール」がある。実際に使えるものなのか。

Share
Tweet
LINE
Hatena

 テキストや画像などを自動生成するAI(人工知能)技術である「生成AI」(ジェネレーティブAI)。求めるコンテンツを迅速に出力してくれる便利な技術だが、生成AIが出力したコンテンツには不正確な情報が含まれる傾向にある。そのコンテンツがAIモデル製なのかどうかの判別が重要だ。ただしその判別は極めて難しいのが現状だ。

 このような課題の解決に役立つのが、コンテンツを生成したのが人間なのか、AIモデルなのかを判別する「AIコンテンツ検出ツール」だ。筆者は6つのAIコンテンツ検出ツールを実際に使用し、その性能を調査した。そのうち「GPTZero」と「AI GPT3 Detector by Kazan SEO」のレビューを紹介する。

生成AIとAIコンテンツ検出ツールの“意外な判定結果”

 調査では、同程度の長さの異なるテキストコンテンツを3つ用意した。

  • 1つ目は、人間(筆者自身)が書いた、最高データ責任者(CDO)の役割の変化に関する記事の抜粋
  • 残り2つは、「生成AIの長所と短所について説明せよ」というリクエストに応じてChatGPTが生成したエッセイとポエム
    • エッセイとポエムは、どちらも大ヒット映画「ターミネーター」シリーズのサイボーグ主人公、ターミネーターの口調で書かれている。

GPTZero

 GPTZeroは、「人間は真実を知るべきだ」(Humans deserve the truth)をコンセプトに掲げたAIコンテンツ検出ツールだ。プリンストン大学(Princeton University)でコンピュータサイエンスを専攻する学生エドワード・ティアン氏が開発した。統計的特徴に基づいてテキストを分析し、文章全体だけでなく、一文や段落ごとに詳細な予測を示すことが可能だ。

 テキストを空欄に入力し、「Check Origin」(起源を確認)ボタンをクリックすると、AIモデルが作成した可能性のある文章がハイライトで表示される。最終的に、人間が生成したテキストである可能性と、AIモデルが生成したテキストである可能性を表示する。

 GPTZeroに上述の3つのコンテンツを入力したところ、ChatGPTが生成したターミネーター調のエッセイは容易にAI製だと判別できたが、他の検出ツールと同様、ChatGPTが生成したターミネーター調のポエムは人間製と判定し、だまされる結果となった。

AI GPT3 Detector by Kazan SEO

 AI GPT3 Detector by Kazan SEOは、テキスト抽出機能や重複コンテンツ対策機能、キーワードクラスタリング機能など、さまざまな機能を提供するSEO(検索エンジン最適化)ツール「Kazan SEO」の一機能だ。Kazan SEOのWebサイトでは、検出の仕組みについてほぼ説明されていないが、単語数が多いほど精度が高くなるという。

 利用時は、まず「AI GPT3 Detector」のアイコンを選択する。表示されたスペースにコンテンツを入力し、「Detect」(検出)ボタンを押すと、そのテキストが本物(人間製)である確率と、偽物(AIモデル製)である確率をそれぞれパーセンテージで表示する。

 3つのコンテンツを渡したところ、筆者が書いたCDOの記事は「94.99%人間製」との判定が下り、ChatGPTが生成したターミネーター調のエッセイは「99.32%AIモデル製」の結果が出た。一方で、ChatGPTが生成したターミネーター調のポエムは「97.62%人間製」となり、筆者が書いたものよりも人間が作成した可能性が高いとの判定が出た。

 他のAIコンテンツ検出ツールでも、ChatGPTが生成したターミネーター調のポエムは「人間によって書かかれた」と判定される結果になった。


 第6回以降は、AIが生成したコンテンツを見分けるための方法について解説する。

TechTarget発 世界のインサイト&ベストプラクティス

米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る