中国発のAIモデル「DeepSeek」が注目を集める中で、Ai2新LLM「Tülu 3 405B」はオープンソースの在り方について疑問を投げ掛けている。
2025年1月、中国のAI(人工知能)スタートアップDeepSeekが大規模言語モデル(LLM)「DeepSeek-R1」を発表。その性能の高さに加え、開発コストの低さやオープンソースである点が注目を集めた。しかし、これらの主張に対しては懐疑的な見方を示す研究者が少なくない。
こうした中で、同時期に登場したオープンソースLLM「Tülu 3 405B」にも関心が寄せられている。非営利のAI研究機関であるAllen Institute for Artificial Intelligence(Ai2)が開発した同モデルは、DeepSeekの「DeepSeek V3」やOpenAIの「GPT-4o」を上回る性能を見せるだけでなく、オープンソースLLMの在り方について改めて問い掛ける存在となっている。
Tülu 3 405Bは、4050億個のパラメーターを持つオープンソースLLMだ。パラメーターとはAIモデルの振る舞いを決定する変数であり、一般的にはパラメーター数が多いほど学習能力や理解能力が高くなる傾向にある。DeepSeek V3は6710億個、GPT-4oは1兆個以上のパラメーターを持つとされている。
Tülu 3 405Bは、2024年11月にAi2が発表したLLM「Tülu 3」シリーズの一環であり、「RLVR」(検証可能な報酬による強化学習:Reinforcement Learning with Verifiable Rewards)という手法を用いて開発されている。これは、数学の問題解決や指示の理解など、特定のスキルを向上させるよう訓練する手法だ。
Ai2は、Tülu 3 405Bの開発でパラメーター数や計算能力の拡大に成功したものの、技術的課題にも直面した。Tülu 3 405Bの学習には256基のGPU(グラフィックス処理装置)を並列稼働させる必要があり、計算コストが高くなり過ぎた結果、パラメーターの調整が十分に実施できなかったという。
DeepSeek-R1とTülu 3 405Bが登場した2025年初頭には、フランスのAIスタートアップMistral AIも、パラメーター数240億個のオープンソースLLM「Mistral Small 3」をオープンソースライセンス「Apache License 2.0」の下で公開している。DeepSeek-R1、Mistral Small 3、Tülu 3 405Bが同じ時期に登場したことは、オープンソース市場の成長を象徴する動きとなった。
米Informa TechTargetの調査部門Enterprise Strategy Group(ESG)でプリンシパルアナリストを務めるマーク・ベキュー氏は、「Ai2の価値は、単なるAIモデルの精度だけでなく、そのオープン性にある」と話す。
ベキュー氏は、Ai2がTülu 3 405Bの開発コストが高額であったことを率直に公表している点を強調する。これはDeepSeekとは対照的だ。DeepSeek-R1の学習データやAIモデルの構成要素は非公開であり、本当にオープンソースと呼べるのか疑問視する声も上がっている。開発コストも、当初は約560万ドルと公表されているが、実際には13億ドルに及ぶとの見方もある。
一方、Ai2は学習データやAIモデルの学習に用いたソースコードを公開している。こうしたオープンな開発アプローチは、AIモデルの精度向上に貢献しているとベキュー氏は話す。
調査会社Constellation Researchのアナリストであるアンディ・トゥライ氏は、「Ai2の完全にオープンなアプローチは、 データ選択から評価に至るまでのパイプラインを、エンドユーザーが自由にカスタマイズできる環境を保証している」と評価し、今後の普及に期待を寄せる。
一方でトゥライ氏は、企業向け市場におけるAi2の影響力がまだ限定的である状況を指摘する。「AIモデルの性能はトップクラスであるにもかかわらず、そのマーケティングや宣伝はかなり控えめだ」(トゥライ氏)
実際、Tülu 3 405Bに関する広報活動はブログ記事2本程度にとどまった。これは、DeepSeek-R1が発表された際に圧倒的なメディア露出を受けた状況とは対照的だ。この背景には、Ai2の非営利的な立場が影響しているとベキュー氏は話す。Ai2は研究を主目的とする非営利組織であり、商業的な成功を第一の目的としていないからだ。
Tülu 3 405Bモデルは、Ai2の無料Webツール「Ai2 Playground」で試用可能となっており、GitHubやHugging Faceでソースコードが公開されている他、Googleのクラウドサービス群「Google Cloud」でも利用可能となっている。
米国Informa TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
日々情報が増え続ける今、業務に必要な全ての情報を、社内外の関連ニュースや論文、特許情報などから収集していくのは至難の業だ。そこで業務に必要な情報を着実に届けるための仕組み作りに役立つサービスを紹介する。
クラウド利用の拡大に伴い、データが分散・肥大化する中、従来のセキュリティ対策の限界が見え始めている。データの所在や利用状況を可視化し、リスクを事前に把握して対応することが求められる今、有効となる新たなアプローチを探る。
AIの活用が急速に進む一方で、セキュリティリスクの増大が懸念され、企業の対応が急務となっている。本資料では、2024年2~12月までの5365億件のAI/ML(機械学習)トランザクションの分析に基づき、その実態と対策を多角的に考察する。
製造業の設計現場では、設計プロセスの複雑化などの課題が山積している。こうした中、注目を集めているのが生成AIの活用だ。本資料では、生成AIがもたらす設計業務の未来について、詳しく解説する。
多くの企業が業務における生成AIの有用性を実感する一方、高度な活用を目指すに当たり、壁に突き当たっているケースは多い。既存の業務やシステムと生成AIをスムーズに組み合わせ、自社に合った形で活用するには、どうすればよいのか。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...