LLMが生成する完璧な文章には、もっともらしい偽情報が含まれていることがある。文法や表現の自然さといった従来の手掛かりが通用しなくなったいま、専門家が提唱する新たな対抗策とは何か。
大規模言語モデル(LLM)は、正確な文法と巧みな表現で文章を生成できる人工知能(AI)モデルだ。この飛躍的な進歩は、ジャーナリズムや教育、ビジネスコミュニケーションの効率化を推し進めた一方で、偽情報の検出をより困難にした。専門家でさえ、LLMが生成した文章と人間が書いた文章を区別するのに苦労する現状において、偽情報をどのように見分ければよいのだろうか。
この問いは、オランダの数学・情報科学研究所であるCentrum Wiskunde & Informatica(CWI)が2025年5月に開催した、偽情報とLLMに関するシンポジウムの中心的なテーマだった。シンポジウムに参加した研究者は偽情報がどのように進化しているのか、それに対抗するためにどのような新しいツールやアプローチが必要なのかを探った。主催者の一人であるCWIの研究者、ダビデ・チェオリン氏は、情報の質、AIモデルのバイアス(偏見)、説明可能性(AIモデルのデータ処理過程や分析結果の理由を説明する能力)を専門としている。
かつて偽情報を見分ける手掛かりとなっていた文法的な誤りや不自然な言い回し、言語的な矛盾といった特徴は、LLMが生成する文章と人間による文章の見分けがつかなくなるにつれて、時代遅れの判断基準になりつつある。
この変化で生じるのは、単なる技術的な課題にとどまらない。世界経済フォーラム(World Economic Forum)は、偽情報を2024年、2025年の2年連続で「世界的に重大な短期的リスク」のトップに位置付けている。LLMが生成する文章の巧妙さが、こうした懸念を増大させる主な要因であり、企業にとっても個人にとっても根本的な課題となっている。
チェオリン氏のチームは、言語的な特徴や情報の評判を手掛かりに、初期の偽情報に特有の兆候を検出するツールや手法を開発してきた。そのために、アムステルダム自由大学(Vrije Universiteit Amsterdam)やミラノ大学(University of Milan)など、複数の研究機関と連携し、自然言語処理(NLP)、論理的推論、クラウドソーシングといった技術を駆使している。
だが、状況は根本的に変わってしまった。LLMは以前よりも言語的に正しい文章を生成できるようになったため、文法的な正しさを頼りに、その情報が本物か偽物かを人間が見抜くことができなくなったとチェオリン氏は指摘する。
LLMが生成した文章から、偽情報を見分ける従来の手掛かりが消えつつある一方で、生成される文章の量、巧妙さ、個人に合わせた最適化の度合いは飛躍的に増大している。ライデン大学(Leiden University)でサイバーセキュリティを教えるトミー・ファン・スティーン氏は、研究者が直面する根本的な課題について説明する。同大学が2025年5月に主催した学際イベント「Night of Digital Security」には、法律、犯罪学、テクノロジー、行政の専門家が集まった。
イベントで、ファン・スティーン氏は次のように述べた。「『フェイクニュース』という概念や言葉が広まったのは、2016年の米大統領選挙の時期に、トランプ前大統領が、自身が同意できないものを全て偽情報と呼んだことがきっかけだ」
問題はあからさまな捏造(ねつぞう)だけにとどまらないとファン・スティーン氏は指摘する。「『誤情報』(misinformation)と『偽情報』(disinformation)を区別することが重要だ。どちらも不正確な情報を共有する点では同じだが、前者は意図的ではなく、後者は意図的である点が異なる」
チェオリン氏のようなAI技術の社会的リスクを研究する専門家にとって、LLMが生成する文章がもたらす影響は、単なる文章生成の域をはるかに超える。同氏のチームがCWIのフランスにおける姉妹機関Inriaと共同で実施した研究は、計算言語学の主要な国際会議であるACL(Association for Computational Linguistics)の論文として採択された。この研究は、LLMがプロンプト(質問や指示)の言語やプロンプトによって与えられた国籍に応じて、異なる政治的バイアスを示すことを明らかにした。同じLLMを、異なる言語で、あるいは異なる国籍の人物として、同一の政治的傾向を測る質問に答えさせたところ、その結果は大きく異なった。
一方でファン・スティーン氏は、偽情報が単に真実か偽りかという二元論で割り切れるものではないことを強調する。同氏は偽情報を性質に応じて分類するため、風刺やパロディーから完全に捏造されたコンテンツまで、7つのカテゴリーから成るフレームワークを提唱している。
「全くのでたらめか、完全な真実かという単純な話ではない。その間には、『事実を巧妙に切り取った報道』や『文脈を無視した引用』といった情報が存在し、それらもあからさまなうそと同じか、それ以上に有害な情報になり得る」(ファン・スティーン氏)
チェオリン氏は、技術的な手段だけではなく、他のエンドユーザーと協力して、偽情報の特定を促進すべきだと狩猟する。このアプローチは、純粋な自動検出から、「透明性が高いシステム」と同氏が呼ぶものへの大きな転換を意味する。このシステムは、評価の根拠をエンドユーザーに提供する。ブラックボックス化したアルゴリズムが二者択一の判断を下すのではなく、その意思決定プロセスをエンドユーザーに説明することで、エンドユーザーの知識を深め、判断能力を高めることを目指す。
次回も引き続き、AI技術が生む偽情報のリスクと、それに対する対抗策を取り上げる。
Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。
なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...