AI検出は「ChatGPTの文」をどこまで見抜けるのか? 複数ツールで試してみたAI生成コンテンツを見分けられるか?【第4回】

コンテンツがAI製なのか、人間製なのかを判別するための「AIコンテンツ検出ツール」がある。その実力はどうなのか。OpenAIをはじめ、複数のベンダーが提供する検出ツールを実際に使ってみた。

2024年02月03日 11時15分 公開
[Ron KarjianTechTarget]

 テキストや画像などを自動生成するAI(人工知能)技術である「生成AI」(ジェネレーティブAI)。その利便性から利用がこれから拡大し、生成AIが出力したさまざまなコンテンツが世の中に出回るようになると考えられる。

 生成AIが出力したコンテンツには不正確な情報が含まれていることがあるが、それを判別することは容易ではないため利用には注意が必要だ。このような課題の解決に役立つのが、コンテンツを生成したのがAIモデルなのか、そうではないのかを判断する「AIコンテンツ検出ツール」だ。

 筆者は6つのAIコンテンツ検出ツールを使用し、その性能を調査した。そのうち「Giant Language model Test Room」と、AIベンダーOpenAIの「GPT-2 Output Detector」を紹介する。

ChatGPT vs. OpenAIのAI検出ツール 見破れるのか?

会員登録(無料)が必要です

 調査では、同程度の長さの異なるテキストコンテンツを3つ用意した。

  • 1つ目は、人間(筆者自身)が書いた、最高データ責任者(CDO)の役割の変化についての記事を抜粋
  • 残り2つは、「生成AIの長所と短所について説明せよ」というリクエストに応じてChatGPTが生成したエッセイとポエム
    • エッセイとポエムは、どちらも大ヒット映画「ターミネーター」シリーズのサイボーグ主人公、ターミネーターの口調で書かれている。

Giant Language model Test Room

 AIコンテンツ検出ツール「Giant Language model Test Room」(GLTR)は、マサチューセッツ工科大学(MIT:Massachusetts Institute of Technology)とIBM Researchの科学者コミュニティMIT-IBM Watson AI labの研究者と、ハーバード大学(Harvard University)の自然言語処理(NLP)の研究者ら3人により作成された。

 GLTRは、テキストにおける言語モデルの痕跡を精査する仕組みだ。具体的には、OpenAIのLLM(大規模言語モデル)「GPT-2」が生成したテキストと人間が作成したテキストの違いを分析する。テキストの文脈から次の単語が予測しやすいほど、AIモデルが生成したテキストの可能性が高いことを示す。

 まず、用意されたスペースに任意のテキストを入力すると、各単語に色のハイライトが付けられる。各色は予測される単語として可能性の高い単語を示す。緑色(予測される単語の上位10単語)、黄色(上位100単語)、赤色(上位1000単語)、残りの単語は紫色で表示される。色のバラエティやランダム性が高いほど、人間が作成したコンテンツである可能性が高く、緑色が多いコンテンツはAIが作成した可能性が高い。

 GLTRに上述の3つのコンテンツを入力したところ、ChatGPTが生成したエッセイが最も緑が多く、ランダム性の少ない結果となった(図1)。

画像 図1 Giant Language model Test Roomによる判定結果

GPT-2 Output Detector

 OpenAIの「GPT-2 Output Detector」は、テキストの作成者が人間なのかAIモデルなのかをトークン(テキストデータを処理する際の基本的な単位)に基づいて識別する、オープンソースのAIコンテンツ検出ツールだ。Meta PlatformsのAI技術研究所Meta AIが開発したLLM「RoBERTa」(Googleの自然言語処理モデル「BERT」の改良版)を微調整した言語モデルを使用する。

 検出ツールのテキストボックスに内容を入力すると、予測確率を「Real(人間製)- Fake(AIモデル製)」の割合で表示する。検出の精度は約50トークン以上で一定以上の精度になるという。上述の3つのコンテンツを渡したところ、ChatGPTが作成したターミネーター調のポエムは「99.02%人間製」となり、筆者が書いたCDOに関する記事とほぼ同じ結果が出た。一方で、ChatGPTが作成したターミネーター調のエッセイについては「99.97%AI製」との結果が出た(図2)。

画像 図2 GPT-2 Output Detector

 第5回は、引き続きAIコンテンツ検出AIツールのレビューを紹介する。

TechTarget発 世界のインサイト&ベストプラクティス

米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

市場調査・トレンド ServiceNow Japan合同会社

AIを活用したビジネス変革:調査結果に見る銀行業界の現状と変革実現の鍵

AIを活用したビジネス変革の必要性が高まる中、銀行業界でもその対応を迫られている。変革をリードしている組織では、どのように取り組みを進めているのだろうか。1125人を対象に行った調査を基に、変革の現状と変革実現の鍵を探る。

製品資料 ServiceNow Japan合同会社

生成AI活用を社内全体で推進し、生産性向上やビジネス変革につなげる方法とは?

生成AIのビジネスにおける活用を検討する際には、実際に自社のどのような業務領域に、どのような形で導入するかを考慮する必要がある。本資料では、生産性向上につながる生成AI戦略について詳しく解説する。

製品資料 ServiceNow Japan合同会社

企業の経営幹部が必要とするものを提供してくれるAIエージェントとは?

企業がイノベーションを起こせるようにするには、インテリジェントでリアルタイムな意思決定ができる組織への変革が必要だ。その変革を主導する経営幹部が必要とするものを提供してくれるAIエージェントがあるという。

製品資料 ServiceNow Japan合同会社

急増するITサービスとIT資産の管理を楽にする、AIエージェントの活用方法とは?

急増するITサービスとIT資産の管理運用に、課題を抱えている組織は少なくない。予測分析や問題解決の迅速化、生産性の向上を実現するためにはどうすればよいのか。本資料では、解決策としてAIエージェントを活用する方法を解説する。

製品資料 株式会社USEN WORK WELL

生成AIを導入したのに効果が出ないのはなぜ? 適切な活用シーンを見極めるコツ

生成AIがもたらすメリットは既に広く知られているが、実際に導入した企業からは、思ったような成果が挙がっていないという声もよく聞かれる。適切な活用シーンを見極め、安全かつ効果的に生成AIを導入/運用するには、どうすればよいのか。

アイティメディアからのお知らせ

From Informa TechTarget

なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか

なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...