DeepSeekを超えた? Ai2「新LLM」にこそ“本当の期待”が集まる理由オープンソースLLMを再考する

中国発のAIモデル「DeepSeek」が注目を集める中で、Ai2新LLM「Tülu 3 405B」はオープンソースの在り方について疑問を投げ掛けている。

2025年03月14日 07時15分 公開
[Esther ShittuTechTarget]

関連キーワード

人工知能 | オープンソース


 2025年1月、中国のAI(人工知能)スタートアップDeepSeekが大規模言語モデル(LLM)「DeepSeek-R1」を発表。その性能の高さに加え、開発コストの低さやオープンソースである点が注目を集めた。しかし、これらの主張に対しては懐疑的な見方を示す研究者が少なくない。

 こうした中で、同時期に登場したオープンソースLLM「Tülu 3 405B」にも関心が寄せられている。非営利のAI研究機関であるAllen Institute for Artificial Intelligence(Ai2)が開発した同モデルは、DeepSeekの「DeepSeek V3」やOpenAIの「GPT-4o」を上回る性能を見せるだけでなく、オープンソースLLMの在り方について改めて問い掛ける存在となっている。

なぜDeepSeekではなく「Ai2の新LLM」に期待が集まるのか

 Tülu 3 405Bは、4050億個のパラメーターを持つオープンソースLLMだ。パラメーターとはAIモデルの振る舞いを決定する変数であり、一般的にはパラメーター数が多いほど学習能力や理解能力が高くなる傾向にある。DeepSeek V3は6710億個、GPT-4oは1兆個以上のパラメーターを持つとされている。

 Tülu 3 405Bは、2024年11月にAi2が発表したLLM「Tülu 3」シリーズの一環であり、「RLVR」(検証可能な報酬による強化学習:Reinforcement Learning with Verifiable Rewards)という手法を用いて開発されている。これは、数学の問題解決や指示の理解など、特定のスキルを向上させるよう訓練する手法だ。

 Ai2は、Tülu 3 405Bの開発でパラメーター数や計算能力の拡大に成功したものの、技術的課題にも直面した。Tülu 3 405Bの学習には256基のGPU(グラフィックス処理装置)を並列稼働させる必要があり、計算コストが高くなり過ぎた結果、パラメーターの調整が十分に実施できなかったという。

急成長するオープンソース市場

 DeepSeek-R1とTülu 3 405Bが登場した2025年初頭には、フランスのAIスタートアップMistral AIも、パラメーター数240億個のオープンソースLLM「Mistral Small 3」をオープンソースライセンス「Apache License 2.0」の下で公開している。DeepSeek-R1、Mistral Small 3、Tülu 3 405Bが同じ時期に登場したことは、オープンソース市場の成長を象徴する動きとなった。

 米Informa TechTargetの調査部門Enterprise Strategy Group(ESG)でプリンシパルアナリストを務めるマーク・ベキュー氏は、「Ai2の価値は、単なるAIモデルの精度だけでなく、そのオープン性にある」と話す。

 ベキュー氏は、Ai2がTülu 3 405Bの開発コストが高額であったことを率直に公表している点を強調する。これはDeepSeekとは対照的だ。DeepSeek-R1の学習データやAIモデルの構成要素は非公開であり、本当にオープンソースと呼べるのか疑問視する声も上がっている。開発コストも、当初は約560万ドルと公表されているが、実際には13億ドルに及ぶとの見方もある。

 一方、Ai2は学習データやAIモデルの学習に用いたソースコードを公開している。こうしたオープンな開発アプローチは、AIモデルの精度向上に貢献しているとベキュー氏は話す。

 調査会社Constellation Researchのアナリストであるアンディ・トゥライ氏は、「Ai2の完全にオープンなアプローチは、 データ選択から評価に至るまでのパイプラインを、エンドユーザーが自由にカスタマイズできる環境を保証している」と評価し、今後の普及に期待を寄せる。

Ai2の普及には課題も

 一方でトゥライ氏は、企業向け市場におけるAi2の影響力がまだ限定的である状況を指摘する。「AIモデルの性能はトップクラスであるにもかかわらず、そのマーケティングや宣伝はかなり控えめだ」(トゥライ氏)

 実際、Tülu 3 405Bに関する広報活動はブログ記事2本程度にとどまった。これは、DeepSeek-R1が発表された際に圧倒的なメディア露出を受けた状況とは対照的だ。この背景には、Ai2の非営利的な立場が影響しているとベキュー氏は話す。Ai2は研究を主目的とする非営利組織であり、商業的な成功を第一の目的としていないからだ。

 Tülu 3 405Bモデルは、Ai2の無料Webツール「Ai2 Playground」で試用可能となっており、GitHubやHugging Faceでソースコードが公開されている他、Googleのクラウドサービス群「Google Cloud」でも利用可能となっている。

TechTarget発 世界のインサイト&ベストプラクティス

米国Informa TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

From Informa TechTarget

お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。

ITmedia マーケティング新着記事

news074.jpg

SNS発信のベストな時間帯(2025年版) InstagramとFacebook、TikTokでどう違う?
Hootsuiteが2025年版のソーシャルメディア最適投稿時間を公開。各プラットフォームごとの...

news161.jpg

「動画広告がディスプレイ広告超え」他、電通「2024年 日本の広告費」インターネット広告媒体費の詳細分析
国内電通グループのデジタル領域をけん引する4社は共同で「2024年 日本の広告費」のイン...

news027.png

テレビCMとSNS広告、どちらが有効? アプリのインストールにつながる施策は……
Reproはスマートフォンユーザー1236人を対象に「モバイルアプリのインストール実態調査」...