“思考する”AI「Gemini 2.5 Pro」は「Gemini 2.0」から何が進化した?:加速するGoogleのAI開発【前編】
2025年3月、Googleは新LLM「Gemini 2.5 Pro」の試験運用版を発表した。同モデルはどのような価値をユーザーにもたらすのか。「Gemini 2.0」からの強化点とは。
各AI(人工知能)ベンダーは次々と新しい大規模言語モデル(LLM)を発表しており、その勢いはとどまる気配がない。中でもGoogleの「Gemini」シリーズは注目されるLLMの一つだ。
Googleは2023年12月に「Gemini 1.0」、2024年2月に「Gemini 1.5 Pro」を発表。同年12月には「Gemini 2.0」を発表し、2025年3月には早くも「Gemini 2.5 Pro」の試験運用版を公開しており、Geminiの革新スピードは加速している。Gemini 2.5 Proはどのような進化を遂げているのか。
「Gemini 2.5 Pro」は「Gemini 2.0」から何が進化した?
併せて読みたいお薦め記事
LLMについて理解を深める
Gemini 2.5 Proは、AI研究開発機関Google DeepMindが開発したLLMであり、2025年3月の登場時点でGoogle史上最も高性能なAIモデルと位置付けられている。Gemini 2.5 Proの発表は、以下のような推論モデルがLLM市場で存在感を強める中での動きと捉えることができる。
- DeepSeekの「DeepSeek-R1」
- OpenAIの「OpenAI o3」
- Anthropicの「Claude 3.7 Sonnet」
特に注目すべきは、Gemini 2.5 Proが「思考モデル」(Thinking Model)として設計されている点だ。高度な推論機能が中核に据えられており、2024年12月に発表された試験運用版の推論モデル「Gemini 2.0 Flash Thinking」の進化版と位置付けられる。
Gemini 2.5 Proは、プロンプト(AIモデルに対する指示)の遂行に必要な手順を段階的に推論するChain-of-Thought(CoT:思考の連鎖)手法を内部で自律的に処理する設計を採用しており、文脈に即したより精度の高い出力が可能となっている。
GoogleはGemini 2.5 Proに対し、強化学習や事後学習などの技術を適用することで、さらなる精度向上を図っている。公開時点のコンテキストウィンドウ(生成AIがやりとりの中で保持できる情報量)は最大100万トークン(テキストデータを処理する際の基本的な単位)で、将来的には200万トークンに拡張する計画だ。
Gemini 2.5 Proのその他の主な強化点は以下の通り。
- 推論能力の強化
- Gemini 2.5 Proの最大の特長は、推論性能が強化されたことだ。Googleによれば、同モデルはLLMの知識と推論能力を測るベンチマークテスト「Humanity's Last Exam」において、OpenAI o3の他、Anthropicの「Claude 3.7 Sonnet」、DeepSeekの「DeepSeek R1」などの競合モデルを上回るスコアを記録している。
- コーディング能力の向上
- Gemini 2.5 Proは、ソースコードの生成および実行機能が強化されており、クラウドサービス「Google Cloud」を中心とする開発環境の利便性向上に大きく貢献している。
- 従来モデルに比べてソースコードの生成、デバッグ、関数呼び出し、ワークフロー自動化などの精度が強化されている。ソースコードの自動生成だけでなく、実行結果の検証や改善提案までできるなど、開発支援における実用性が高まっており、ユーザーインタフェース(UI)デザインを含む視覚的に魅力的なアプリケーションの構築にも役立つ。
- ソフトウェア開発タスクのベンチマークテスト「SWE-Bench Verified」では63.8%のスコアを記録。OpenAIの「GPT-4.5」のスコア(49.3%)を上回った一方で、Claude 3.7 Sonnetのスコア(70.3%)にはわずかに及ばない結果となった。
- 数学・科学分野の能力強化
- 2025年に開催された数学コンテスト「American Invitational Mathematics Examination」(AIME)では、86.7%の正答率を達成した。
- 博士号レベルの科学問題を扱うベンチマークテスト「GPQA」の中でも最も最難関とされる「ダイヤモンド」レベルでは、84%の正答率を達成した。
- マルチモーダル機能の強化
- Gemini 2.0と同様マルチモーダルモデルであり、テキスト、音声、画像、動画、ソースコードといった複数のデータ形式を理解できる。ただし、2025年3月時点では画像、動画の生成機能は実装されていない。
- リアルタイム処理
- 多くの機能強化にもかかわらず、処理遅延は抑制されており、リアルタイム性が求められるアプリケーションや、インタラクティブな対話用途にも十分対応可能だ。
次回は、Gemini 2.5 Proの用途や他サービスとの連携について解説する。
TechTarget発 先取りITトレンド
米国Informa TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.