Googleは「Gemini 2.0」において、テキストだけではなく画像や音声を生成できる「マルチモーダル出力」機能を実装し、さまざまな面での性能向上を実現した。この進化はAIアシスタントの利用シーンをどう広げるのか。
Googleは、2024年12月に主力の大規模言語モデル(LLM)「Gemini」シリーズの「Gemini 2.0」を発表した。「Gemini 1.0」から始まったGeminiシリーズは、Googleにとって「PaLM」(Pathways Language Models)シリーズに代わる存在となった。2024年2月には「Gemini 1.5 Pro」がデビューし、さまざまな機能拡張を重ねた後に、AIエージェントとしての機能を全面的に押し出したGemini 2.0が登場した。どのような進化を遂げたのか。
GoogleはGemini 2.0の開発において、複数のステップを経るワークフローを自動化するAIエージェント機能に注力した。AIエージェント機能は、LLMの単純な操作を進化させ、より高度な自動化や適切な出力を追求するために、複数のAIモデルを組み合わせることによって実現する。ワークフローの一部として、メール送信や支払いの実行などの外部機能を呼び出すことも可能だ。
Gemini 2.0で最初に公開されたのは軽量版の「Gemini 2.0 Flash」だった。2024年12月、GoogleはGemini 2.0 Flashよりも推論能力を高めた試験運用版モデル「Gemini 2.0 Flash Thinking」を発表した。
こうした派生モデルも含め、Gemini 2.0はテキストや音声などの複数種類のデータを組み合わせて処理できる「マルチモーダル」なLLMだ。テキスト、画像、音声、動画といったコンテンツについて、生成や要約、分析など、さまざまなタスクをこなせる。
Gemini 2.0は、AIベンダーOpenAIの推論モデル「OpenAI o1」と競合する。先行公開された試験運用版モデル「Gemini 2.0 Flash Thinking」は、思考して推論する能力を強化したGeminiの派生版だ。
Gemini 2.0は、「Gemini 1.0」と「Gemini 1.5」からの進化を継続し、以下の機能強化を実現している。
Gemini 2.0で最初に発表されたのが軽量版に当たるGemini 2.0 Flashだ。Gemini 1.5 Flashの後継モデルだが、Gemini 1.5 Proを上回る性能を持つ。
Gemini 2.0 Flashの主な特徴を以下に示す。
Googleは、同社が提供するサービス全体に、LLMを用いた生成AIを組み込むことを進めている。2025年5月9日時点で、Gemini 2.0は以下のツールで利用可能、または利用可能になる見込みだ。
従来のGeminiと同様、Gemini 2.0もGoogleのサービス以外で利用する方法がある。
Google AI StudioとVertex AIを使って、開発者はどこにでもデプロイ(展開)可能なアプリケーションを開発できる。Googleは、APIを使ってGemini 2.0をさまざまなサードパーティー製のアプリケーションと連携できるようにすると語っている。
Gemini 2.0では、複雑な状況を理解し、計画を立て、エンドユーザーに代わって自律的に行動するAIエージェント機能が強化された。Googleは優れたAIエージェント体験を実現するためのさまざまな実験的取り組みを推進している。Googleが公表したAIエージェント開発計画を以下に挙げる。
GoogleはGemini 2.0のさまざまなバリエーションを段階的に投入している。以下は2025年5月9日時点の情報だ。
米国Informa TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
日々情報が増え続ける今、業務に必要な全ての情報を、社内外の関連ニュースや論文、特許情報などから収集していくのは至難の業だ。そこで業務に必要な情報を着実に届けるための仕組み作りに役立つサービスを紹介する。
クラウド利用の拡大に伴い、データが分散・肥大化する中、従来のセキュリティ対策の限界が見え始めている。データの所在や利用状況を可視化し、リスクを事前に把握して対応することが求められる今、有効となる新たなアプローチを探る。
AIの活用が急速に進む一方で、セキュリティリスクの増大が懸念され、企業の対応が急務となっている。本資料では、2024年2~12月までの5365億件のAI/ML(機械学習)トランザクションの分析に基づき、その実態と対策を多角的に考察する。
製造業の設計現場では、設計プロセスの複雑化などの課題が山積している。こうした中、注目を集めているのが生成AIの活用だ。本資料では、生成AIがもたらす設計業務の未来について、詳しく解説する。
多くの企業が業務における生成AIの有用性を実感する一方、高度な活用を目指すに当たり、壁に突き当たっているケースは多い。既存の業務やシステムと生成AIをスムーズに組み合わせ、自社に合った形で活用するには、どうすればよいのか。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...