Meta「Llama」も該当？　名ばかりの「オープンソースAI」がはらむリスク：「オープンなAIモデル」とは何か【前編】

「オープン」と称して公開されているAIモデルには、厳しい利用制限が設けられていることがある。こうした名ばかりの公開は、利用企業に深刻な法的トラブルをもたらす可能性がある。本当のリスクとは何か。

≫ 2026年07月02日 05時00分公開

AIモデルのライセンスが従来のソフトウェアと異なる理由

併せて読みたいお薦め記事

オープンソース化するAIモデル

　問題の根底には、根本的な前提の不一致がある。そもそもオープンソースライセンスはソフトウェア向けに作られた仕組みだ。AIモデルは従来のソフトウェアとは異なるため、同じ法的な仕組みを当てはめると大きな矛盾が生じる。ソフトウェアのライセンスが機能するのは、著作権の概念が明確だからだ。提供者が「Apache License, Version 2.0」（以下、Apache License 2.0）や「MIT License」でソースコードを公開する場合、これらのライセンスは「著作権の対象となる成果物」に対して利用権を与える。企業の法務部門も、それをどう評価すべきかを熟知している。

　フォンタナ氏は次のように述べる。「少なくとも制約の緩いオープンソースライセンスであれば、そのライセンス条項をAIモデルの利用に当てはめることは比較的容易だ」

　しかし、AIモデル特有の要素が絡むと話が変わる。学習済みのAIモデルは、重み（ウェイト）やパラメータ、学習データ、デプロイ用コード、ドキュメントなどで構成されており、それぞれの法的性質が異なる。米国の著作権局の判断基準に照らし合わせると、重み自体には著作権が認められない可能性さえある。

　オープンソース技術の推進団体The Linux Foundationで法務・戦略プログラム担当シニアバイスプレジデントを務めるマイケル・ドーラン氏は次のように指摘する。「重みやパラメータのファイルは、人が書いた文章とは異なり、カンマが並ぶただのデータ列にしか見えない。その状態では単なるデータであり、著作権が発生する成果物とは言いがたいというのがわれわれの見解だ」

　著作権を前提としたライセンスを、重みやパラメータのファイルに適用してしまうと、法的な有効性が曖昧になり、利用者はAIモデルをどこまで自由に利用してよいかの判断がつかなくなる。ドーラン氏は「目的の作業を実行するために必要な権利を、自分が持っているのかどうかを、利用者は判別できない」と話す。

オープンソースAIライセンスの現状

　ソフトウェアとAIモデルの間にあるライセンスの隔たりを埋めるため、幾つかのアプローチが試みられてきた。

AIモデルへのApache License 2.0の適用

　Apache License 2.0は、ソフトウェア分野で広く普及しているオープンソースライセンスの一つだ。オープンなAIモデルの開発においても、標準的な選択肢になっている。

　フォンタナ氏はApache License 2.0について、「ソフトウェアとAIモデルのどちらの領域でも広く定着しているため、重みや関連プログラムに採用しやすいライセンスだ」と説明する。同時に、「これが唯一の選択肢ではない」という点も強調する。

　より大きな問題となっているのは、重みや学習データ、学習用プログラムを非公開にしたままApache License 2.0を掲げるモデル開発者が存在することだ。G7のビジョンは、こうした実態が伴わないのにオープンソースであると見せかける行為が「オープンウォッシング」につながる懸念を指摘している。

ベンダーが独自に定めた「疑似オープン」ライセンス

　Meta Platformsが公開するAIモデル「Llama」のライセンスは、直近月のアクティブユーザー数が7億を超える場合の無償商業利用を制限するほか、地域や用途の制限も設けている。他モデルの学習への利用については、初期のLlama 2／Llama 3では制限していたが、Llama 3.1以降は派生モデル名の先頭に「Llama」を付けることを条件に許可している。中国企業が開発する「DeepSeek」の初期モデルでも、緩い条項の上に用途制限を重ねた独自のライセンスが採用されていたが、最近の主要モデルはMIT Licenseへの移行が進んでいる。

　このように「オープン」を名乗りながら制約を課すベンダー独自のライセンスは、企業の法務部門にとってコンプライアンス上のリスクになる。「これらの独自ライセンスは一般的ではないものであり、複雑な利用制限が設けられている。開発者に悪意がなくても、法的な解釈が難しいケースが多々ある」とフォンタナ氏は述べる。

OSAID

　オープンソースの定義を管理するOpen Source Initiative（OSI）が2024年10月に策定した基準「Open Source AI Definition 1.0」（OSAID 1.0）は、AIモデルがどう構築されたかを開発者以外の第三者が理解できる十分な情報がない限り、それをオープンソースと呼ぶべきではないと定めている。OSAID 1.0は当初、学習データの公開を求めていたが、最終版ではデータそのものを共有できない場合、学習データに関する詳細なドキュメントの提供を求める内容に落ち着いた。「AIモデルの構築に使われるデータは、機密性などの理由から共有できない状況も珍しくない。厳格な定義にこだわり過ぎると、オープンな配布自体が不可能になってしまう」とドーラン氏は話す。

　一方でフォンタナ氏は、オープンソースコミュニティーの間で「重みを本物のオープンソースライセンスで公開すること」が最低限の基準だという合意が形成されつつあるとみている。その上で同氏は、「AIモデルがどう作られたかを根本から理解するためには、ソフトウェアのソースコードに相当する『学習データ』の公開が不可欠だという強硬な意見も一部から出続けている」と言い添える。

G7による4段階の分類

　2026年5月にG7が採択・発表したフレームワークは、オープンかクローズドかという二極論を排し、段階的なグラデーションとしてAIモデルを分類している（表）。

表　G7によるAIモデルの分類
分類	公開される要素	ライセンスの条件
オープンデータを含むオープンソースAI （Open Source AI with Open Data）	重み、デプロイ用コード、学習用コード、全ての学習データ	OSI承認ライセンス
オープンソースAI （Open Source AI）	重み、デプロイ用コード、学習用コード、法的に可能な範囲の学習データ	OSI承認ライセンス
オープンウェイトAI （Open Weights AI）	重み、デプロイ用コード	OSI承認ライセンス
ウェイトアベイラブルAI （Weights Available AI）	重み、デプロイ用コード	用途制限付きを含む任意のライセンス

　調査会社RedMonkのスティーブン・オグレディー氏が2026年5月に68種類のAIモデルを調査したところ、非公開ではない40種類のモデルのうち、上記の「オープンソースAI」または「オープンデータを含むオープンソースAI」の基準を満たすものは1つもなかった。半数は「オープンウェイトAI」に、残りの半数は「ウェイトアベイラブルAI」に分類された。つまりG7のフレームワークは、企業のAI技術活用においてオープンウェイトという言葉を専門用語として定着させようとしている。

　次回は、オープンなAIモデルとは何かを定義する「OpenMDW」と、企業がAIモデルを扱う上での注意点を解説する。

TechTargetジャパントップエンタープライズAI