GoogleのAIモデル「Gemini」とは? その特徴が分かる“3つの違い”:クラウドAI覇権争いの現在地【前編】
Googleは汎用的なAIモデル「Gemini」を発表した。Geminiには何が可能なのか。他のクラウドサービスでもAI関連サービスが相次いで登場する中で、Geminiの特徴になる点とは。
Googleは2023年12月、汎用(はんよう)的なAI(人工知能)モデルの「Gemini」を発表した。Geminiには処理性能や用途に応じた3つのモデルがある。他にもGoogleは自社AI技術に関連した複数のアップデートを発表している。他のクラウドベンダーもAI関連のサービスを相次いで発表する中で、GoogleのAI関連サービスの強みになるのは何か。Geminiの詳細と共に解説する。
GoogleのAIモデル「Gemini」の特徴は? 3つの違いとは
併せて読みたいお薦め記事
AIを使う前に知っておきたいプロセッサ
Googleが発表したGeminiの3モデルは以下の通りだ。
- Gemini Ultra
- 2024年に提供開始予定。Geminiの中で最もパフォーマンスが高く、複雑なタスクを処理できる
- Gemini Pro
- GoogleのAIチャットbot「Bard」で利用できる
- Gemini Nano
- Googleのスマートフォン「Pixel 8 Pro」で利用できる
Gemini Proは機械学習モデル構築支援ツール「Vertex AI」や、Webベースの開発者ツール「Google AI Studio」から利用できるようになっている。
AI分野におけるGoogleの取り組みはソフトウェア領域にとどまらない。同社は、AI向けに特化して開発した独自プロセッサ「TPU」(テンソル処理ユニット)の新バージョン「Cloud TPU v5e」を2023年11月に発表した。TPU v5pは前モデルのTPU v4と比較して2.8 倍の速度で大規模言語モデル(LLM)をトレーニングできるという。同社は2023年に、TPU v5pを搭載したコンピューティングシステム「AI Hypercomputer」も発表した。
調査会社Constellation Researchのアナリスト、アンディ・スライ氏は「GoogleはGeminiを発表したことで、理論的な技術仕様についてはさまざまな面で先頭に立った」と述べる。
スライ氏によればGeminiには処理性能以外にも、他社のAIモデルと比べた場合の差別化要因になる“3つの特徴”がある。
- Geminiがマルチモーダルなツールであること
- マルチモーダルとは、数値や画像、テキスト、音声など複数種類のデータを組み合わせて、あるいは関連付けて処理できること
- 用途に応じた3つのモデルを用意していること
- 有害コンテンツの生成を回避するための安全策が幾つか用意されていること
3つ目の差別化要因について、GoogleのCEOであるサンダー・ピチャイ氏は次のように述べる。「当社は研究に野心的に向き合い、人々と社会に多大な利益をもたらすことを追求すると同時に、安全策を導入する。政府や専門家と協力しながら、AIの能力向上に伴うリスクに対処する」
ただし、有害コンテンツ対策は、すでにGeminiの頭痛の種となっている。Geminiの発表は当初の計画から延期されたようで、その一因は、英語以外の言語でのチャット応答に問題があったことだと伝えられている。
後編は主要ベンダーのAIツール市場における立ち位置を解説する。
Copyright © ITmedia, Inc. All Rights Reserved.