生成AIが出力したコンテンツの、正確性の欠如や法的侵害といったリスクが問題となっている。AI製なのかどうかを見分ける手段が必要だ。その方法として「AIコンテンツ検出ツール」がある。実際に使えるものなのか。
テキストや画像などを自動生成するAI(人工知能)技術である「生成AI」(ジェネレーティブAI)。求めるコンテンツを迅速に出力してくれる便利な技術だが、生成AIが出力したコンテンツには不正確な情報が含まれる傾向にある。そのコンテンツがAIモデル製なのかどうかの判別が重要だ。ただしその判別は極めて難しいのが現状だ。
このような課題の解決に役立つのが、コンテンツを生成したのが人間なのか、AIモデルなのかを判別する「AIコンテンツ検出ツール」だ。筆者は6つのAIコンテンツ検出ツールを実際に使用し、その性能を調査した。そのうち「GPTZero」と「AI GPT3 Detector by Kazan SEO」のレビューを紹介する。
調査では、同程度の長さの異なるテキストコンテンツを3つ用意した。
GPTZeroは、「人間は真実を知るべきだ」(Humans deserve the truth)をコンセプトに掲げたAIコンテンツ検出ツールだ。プリンストン大学(Princeton University)でコンピュータサイエンスを専攻する学生エドワード・ティアン氏が開発した。統計的特徴に基づいてテキストを分析し、文章全体だけでなく、一文や段落ごとに詳細な予測を示すことが可能だ。
テキストを空欄に入力し、「Check Origin」(起源を確認)ボタンをクリックすると、AIモデルが作成した可能性のある文章がハイライトで表示される。最終的に、人間が生成したテキストである可能性と、AIモデルが生成したテキストである可能性を表示する。
GPTZeroに上述の3つのコンテンツを入力したところ、ChatGPTが生成したターミネーター調のエッセイは容易にAI製だと判別できたが、他の検出ツールと同様、ChatGPTが生成したターミネーター調のポエムは人間製と判定し、だまされる結果となった。
AI GPT3 Detector by Kazan SEOは、テキスト抽出機能や重複コンテンツ対策機能、キーワードクラスタリング機能など、さまざまな機能を提供するSEO(検索エンジン最適化)ツール「Kazan SEO」の一機能だ。Kazan SEOのWebサイトでは、検出の仕組みについてほぼ説明されていないが、単語数が多いほど精度が高くなるという。
利用時は、まず「AI GPT3 Detector」のアイコンを選択する。表示されたスペースにコンテンツを入力し、「Detect」(検出)ボタンを押すと、そのテキストが本物(人間製)である確率と、偽物(AIモデル製)である確率をそれぞれパーセンテージで表示する。
3つのコンテンツを渡したところ、筆者が書いたCDOの記事は「94.99%人間製」との判定が下り、ChatGPTが生成したターミネーター調のエッセイは「99.32%AIモデル製」の結果が出た。一方で、ChatGPTが生成したターミネーター調のポエムは「97.62%人間製」となり、筆者が書いたものよりも人間が作成した可能性が高いとの判定が出た。
他のAIコンテンツ検出ツールでも、ChatGPTが生成したターミネーター調のポエムは「人間によって書かかれた」と判定される結果になった。
第6回以降は、AIが生成したコンテンツを見分けるための方法について解説する。
米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
35〜49歳の含有率が最も高いのは「mixi2」 ニールセン デジタルがソーシャルメディアの利用状況を発表
ニールセン デジタルはデジタルコンテンツ視聴率のレポートを基にソーシャルメディアの利...
TikTokのトレンドに変化 なぜ「1分超え」動画が見られている?
Bufferのデータによると、TikTokでは最近、長めの動画が人気を集めている。
アドビが「10種類のAIエージェント」を発表 顧客体験はどう変わる?
アドビの年次イベント「Adobe Summit 2025」が開催された。初日の基調講演では、アドビの...