Meta「Llama」も該当? 名ばかりの「オープンソースAI」がはらむリスク「オープンなAIモデル」とは何か【前編】

「オープン」と称して公開されているAIモデルには、厳しい利用制限が設けられていることがある。こうした名ばかりの公開は、利用企業に深刻な法的トラブルをもたらす可能性がある。本当のリスクとは何か。

2026年07月02日 05時00分 公開
[Sean Michael KernerTechTarget]

 ソフトウェアにオープンソースライセンスが適用されていれば、利用者はそのソースコードを確認し、自由に変更を加えて実行できる。しかし、AIモデルに対しては、こうした従来のオープンソースの常識が通用しない。

 従来のソフトウェアと異なり、AIモデルを構成する要素は独特であり、その構築方法も根本から異なる。それにもかかわらず、ソフトウェア開発者は従来のオープンソースライセンスをそのままAIモデルに適用しようとしてきた。しかし、このアプローチには課題が残されており、必ずしも最適とは言えない。

 状況をさらに混乱させているのが、「オープンウェイト」という言葉の使われ方だ。2026年現在、ライセンスの種類にかかわらず、公開されている、または自社で運用(セルフホスト)できるAIモデル全般が、ひとくくりにオープンウェイトモデルと呼ばれてしまっている。

 Red Hatのプリンシパルコマーシャルカウンセルを務めるリチャード・フォンタナ氏は次のように語る。「AIモデルの仕組みに対する理解不足、利用制限、法的な記述の曖昧さが重なっている。その結果、純粋なオープンソースライセンスのもとでモデルを公開した場合には発生しないような、法的なリスクが生じている」

 これは近年、さまざまな組織が解決に向けて動いてきた課題だ。直近の動きとしては、2026年5月にThe Linux Foundationがライセンスフレームワーク「OpenMDW 1.1」を公開した。同年6月には、日本が主導した「広島AIプロセス」の流れをくむG7デジタル・技術大臣会合が「AIのオープン性の機会と共通言語に関するG7ビジョン」を発表し、AIモデルのオープン性に関する共通言語の策定を呼びかけるとともに、オープンかクローズドかという二者択一の分類を明確にしりぞけた。

AIモデルのライセンスが従来のソフトウェアと異なる理由

 問題の根底には、根本的な前提の不一致がある。そもそもオープンソースライセンスはソフトウェア向けに作られた仕組みだ。AIモデルは従来のソフトウェアとは異なるため、同じ法的な仕組みを当てはめると大きな矛盾が生じる。ソフトウェアのライセンスが機能するのは、著作権の概念が明確だからだ。提供者が「Apache License, Version 2.0」(以下、Apache License 2.0)や「MIT License」でソースコードを公開する場合、これらのライセンスは「著作権の対象となる成果物」に対して利用権を与える。企業の法務部門も、それをどう評価すべきかを熟知している。

 フォンタナ氏は次のように述べる。「少なくとも制約の緩いオープンソースライセンスであれば、そのライセンス条項をAIモデルの利用に当てはめることは比較的容易だ」

 しかし、AIモデル特有の要素が絡むと話が変わる。学習済みのAIモデルは、重み(ウェイト)やパラメータ、学習データ、デプロイ用コード、ドキュメントなどで構成されており、それぞれの法的性質が異なる。米国の著作権局の判断基準に照らし合わせると、重み自体には著作権が認められない可能性さえある。

 オープンソース技術の推進団体The Linux Foundationで法務・戦略プログラム担当シニアバイスプレジデントを務めるマイケル・ドーラン氏は次のように指摘する。「重みやパラメータのファイルは、人が書いた文章とは異なり、カンマが並ぶただのデータ列にしか見えない。その状態では単なるデータであり、著作権が発生する成果物とは言いがたいというのがわれわれの見解だ」

 著作権を前提としたライセンスを、重みやパラメータのファイルに適用してしまうと、法的な有効性が曖昧になり、利用者はAIモデルをどこまで自由に利用してよいかの判断がつかなくなる。ドーラン氏は「目的の作業を実行するために必要な権利を、自分が持っているのかどうかを、利用者は判別できない」と話す。

オープンソースAIライセンスの現状

 ソフトウェアとAIモデルの間にあるライセンスの隔たりを埋めるため、幾つかのアプローチが試みられてきた。

AIモデルへのApache License 2.0の適用

 Apache License 2.0は、ソフトウェア分野で広く普及しているオープンソースライセンスの一つだ。オープンなAIモデルの開発においても、標準的な選択肢になっている。

 フォンタナ氏はApache License 2.0について、「ソフトウェアとAIモデルのどちらの領域でも広く定着しているため、重みや関連プログラムに採用しやすいライセンスだ」と説明する。同時に、「これが唯一の選択肢ではない」という点も強調する。

 より大きな問題となっているのは、重みや学習データ、学習用プログラムを非公開にしたままApache License 2.0を掲げるモデル開発者が存在することだ。G7のビジョンは、こうした実態が伴わないのにオープンソースであると見せかける行為が「オープンウォッシング」につながる懸念を指摘している。

ベンダーが独自に定めた「疑似オープン」ライセンス

 Meta Platformsが公開するAIモデル「Llama」のライセンスは、直近月のアクティブユーザー数が7億を超える場合の無償商業利用を制限するほか、地域や用途の制限も設けている。他モデルの学習への利用については、初期のLlama 2/Llama 3では制限していたが、Llama 3.1以降は派生モデル名の先頭に「Llama」を付けることを条件に許可している。中国企業が開発する「DeepSeek」の初期モデルでも、緩い条項の上に用途制限を重ねた独自のライセンスが採用されていたが、最近の主要モデルはMIT Licenseへの移行が進んでいる。

 このように「オープン」を名乗りながら制約を課すベンダー独自のライセンスは、企業の法務部門にとってコンプライアンス上のリスクになる。「これらの独自ライセンスは一般的ではないものであり、複雑な利用制限が設けられている。開発者に悪意がなくても、法的な解釈が難しいケースが多々ある」とフォンタナ氏は述べる。

OSAID

 オープンソースの定義を管理するOpen Source Initiative(OSI)が2024年10月に策定した基準「Open Source AI Definition 1.0」(OSAID 1.0)は、AIモデルがどう構築されたかを開発者以外の第三者が理解できる十分な情報がない限り、それをオープンソースと呼ぶべきではないと定めている。OSAID 1.0は当初、学習データの公開を求めていたが、最終版ではデータそのものを共有できない場合、学習データに関する詳細なドキュメントの提供を求める内容に落ち着いた。「AIモデルの構築に使われるデータは、機密性などの理由から共有できない状況も珍しくない。厳格な定義にこだわり過ぎると、オープンな配布自体が不可能になってしまう」とドーラン氏は話す。

 一方でフォンタナ氏は、オープンソースコミュニティーの間で「重みを本物のオープンソースライセンスで公開すること」が最低限の基準だという合意が形成されつつあるとみている。その上で同氏は、「AIモデルがどう作られたかを根本から理解するためには、ソフトウェアのソースコードに相当する『学習データ』の公開が不可欠だという強硬な意見も一部から出続けている」と言い添える。

G7による4段階の分類

 2026年5月にG7が採択・発表したフレームワークは、オープンかクローズドかという二極論を排し、段階的なグラデーションとしてAIモデルを分類している(表)。

表 G7によるAIモデルの分類
分類 公開される要素 ライセンスの条件
オープンデータを含むオープンソースAI
(Open Source AI with Open Data)
重み、デプロイ用コード、学習用コード、全ての学習データ OSI承認ライセンス
オープンソースAI
(Open Source AI)
重み、デプロイ用コード、学習用コード、法的に可能な範囲の学習データ OSI承認ライセンス
オープンウェイトAI
(Open Weights AI)
重み、デプロイ用コード OSI承認ライセンス
ウェイトアベイラブルAI
(Weights Available AI)
重み、デプロイ用コード 用途制限付きを含む任意のライセンス

 調査会社RedMonkのスティーブン・オグレディー氏が2026年5月に68種類のAIモデルを調査したところ、非公開ではない40種類のモデルのうち、上記の「オープンソースAI」または「オープンデータを含むオープンソースAI」の基準を満たすものは1つもなかった。半数は「オープンウェイトAI」に、残りの半数は「ウェイトアベイラブルAI」に分類された。つまりG7のフレームワークは、企業のAI技術活用においてオープンウェイトという言葉を専門用語として定着させようとしている。


 次回は、オープンなAIモデルとは何かを定義する「OpenMDW」と、企業がAIモデルを扱う上での注意点を解説する。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

From Informa TechTarget

瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓

瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓
MFA(多要素認証)を入れたから安心という常識が崩れ去っている。フィッシング集団「Tycoon2FA」が摘発されたが、脅威が完全になくなったというわけではない。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...