中国製AI「DeepSeek」に冷や水を浴びせた“生成AIの脆弱性”とは？：LLMのリスク管理を考える【前編】

突如として話題になった中国製AI「DeepSeek」が市場の関心を集める一方で、セキュリティベンダーが同モデルの脆弱性を指摘している。その具体的なリスクとは。

≫ 2025年03月05日 07時00分公開

「DeepSeek」の脆弱性が明らかに　具体的なリスクは？

併せて読みたいお薦め記事

DeepSeekのリスクを考察する

　Palo Alto Networksの技術チームは、3つの「ジェイルブレーク」（脱獄）技法がDeepSeekのセーフガードを突破したことを明らかにした。ジェイルブレークとは、特定のプロンプト（情報生成のための質問や指示）を入念に作成したり、脆弱性を悪用したりすることで、LLMが備える防御ルールを回避し、モデルが避けるべき出力（バイアスがかかった出力や有害な出力など）を引き出す技法を指す。

　本来、大規模言語モデル（LLM）がマルウェア作成などの不正目的に利用されるのを防ぐべきルールが設定されているが、攻撃者がジェイルブレークを使うことで、容易に回避できてしまう可能性がある。Palo Alto Networksによれば、ジェイルブレークを扱うための専門知識はほとんど、もしくは全く必要なかったという。

　実証では、サイバー犯罪者が関心を持つ分野に関する具体的なガイダンスをDeepSeekから引き出したという。これには、データの不正取得や、マルウェアの作成に関する指示が含まれた他、即席爆発装置（IED）の製造方法に関する情報も生成可能であることが確認された。

　火炎瓶やマルウェアを作成するための情報はインターネット上で簡単に入手できる。一方で、LLMは簡単に使える実用的な情報を整理して出力することができる。「LLMの安全対策が不十分な場合、悪意あるユーザーの参入障壁を下げ、活動が大幅に加速する恐れがある」と同チームは警告する。

　次回は、ジェイルブレークの代表的な手法について詳しく解説する。

Computer Weekly発世界に学ぶIT導入・活用術

米国Informa TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。

TechTargetジャパントップエンタープライズAI