中国製AI「DeepSeek」に冷や水を浴びせた“生成AIの脆弱性”とは?LLMのリスク管理を考える【前編】

突如として話題になった中国製AI「DeepSeek」が市場の関心を集める一方で、セキュリティベンダーが同モデルの脆弱性を指摘している。その具体的なリスクとは。

2025年03月05日 07時00分 公開
[Alex ScroxtonTechTarget]

関連キーワード

人工知能


 2025年1月27日、中国のAIベンダーDeepSeekは、大規模言語モデル(LLM)「DeepSeek R1」を発表した。そのコスト効率の高さやオープンソースである点が注目を集め、それまで米国一強だったAI市場の勢力図に変化の兆しが見られるなど、AI市場には一時的に混乱が生じた。

 しかし、DeepSeekの発表から数日後、セキュリティベンダーPalo Alto Networksの研究者は、DeepSeek R1に特定の脆弱(ぜいじゃく)性があることを明らかにした。その具体的なリスクとは何なのか。

「DeepSeek」の脆弱性が明らかに 具体的なリスクは?

 Palo Alto Networksの技術チームは、3つの「ジェイルブレーク」(脱獄)技法がDeepSeekのセーフガードを突破したことを明らかにした。ジェイルブレークとは、特定のプロンプト(情報生成のための質問や指示)を入念に作成したり、脆弱性を悪用したりすることで、LLMが備える防御ルールを回避し、モデルが避けるべき出力(バイアスがかかった出力や有害な出力など)を引き出す技法を指す。

 本来、大規模言語モデル(LLM)がマルウェア作成などの不正目的に利用されるのを防ぐべきルールが設定されているが、攻撃者がジェイルブレークを使うことで、容易に回避できてしまう可能性がある。Palo Alto Networksによれば、ジェイルブレークを扱うための専門知識はほとんど、もしくは全く必要なかったという。

 実証では、サイバー犯罪者が関心を持つ分野に関する具体的なガイダンスをDeepSeekから引き出したという。これには、データの不正取得や、マルウェアの作成に関する指示が含まれた他、即席爆発装置(IED)の製造方法に関する情報も生成可能であることが確認された。

 火炎瓶やマルウェアを作成するための情報はインターネット上で簡単に入手できる。一方で、LLMは簡単に使える実用的な情報を整理して出力することができる。「LLMの安全対策が不十分な場合、悪意あるユーザーの参入障壁を下げ、活動が大幅に加速する恐れがある」と同チームは警告する。


 次回は、ジェイルブレークの代表的な手法について詳しく解説する。

Computer Weekly発 世界に学ぶIT導入・活用術

米国Informa TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

From Informa TechTarget

お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。

ITmedia マーケティング新着記事

news205.jpg

「応援広告」の認知度 推し活実施層では約6割に
ジェイアール東日本企画は、推し活の実態と応援広告の浸透状況の把握を目的とした調査を...

news113.png

2024年の国内動画広告市場 「縦型」は前年比171.1%、「CTV」は初の1000億円超え
サイバーエージェントが11回目となる国内動画広告市場の調査結果を発表した。

news033.jpg

CRO(コンバージョン率最適化)とは? 具体的なプロセスと押さえておきたいポイント
購入完了、会員登録、資料請求、アプリダウンロードなど、ビジネスモデルやWebサイトの目...