「Gemini 1.5 Pro」の“マルチな能力”を使いこなす、これだけの方法:Geminiシリーズ新モデルを徹底解剖【後編】
GoogleのLLM「Gemini 1.5 Pro」はGemini 1.0から何が進化し、どのような用途に使えるのか。使いこなすための方法を、利用方法や料金プランと併せて解説する。
Googleの大規模言語モデル(LLM)「Gemini 1.0」の後継となる「Gemini 1.5 Pro」は、Gemini 1.0よりも幅広い機能を備える。具体的にどのような用途でGemini 1.5 Proが使えるのか。企業やエンドユーザーは、どのような方法でGemini 1.5 Proを利用できるのか。利用プランと併せて解説する。
Gemini 1.5 Proの“マルチな能力”を使いこなす方法はこれだ
併せて読みたいお薦め記事
連載:Geminiシリーズ新モデルを徹底解剖
LLMの理解を深める
Gemini 1.5 Proは幅広いタスクに使用できる。Gemini 1.5 Proの主な用途と機能を幾つか紹介する。
- Q&A(質疑応答)
- GeminiはGoogleのトレーニングデータに基づいて、基本的な知識を問う質問に答える。
- マルチモーダル(複数の情報源をまとめて扱うこと)であるため、テキスト、画像、オーディオ、ビデオの情報を組み合わせて質問に回答する。
- 長文コンテンツの分析
- 長文のテキストや書籍、プログラムのソースコード、ビデオなどを分析し、理解する能力がある。
- 要約
- コンテキストウィンドウ(生成AIがやりとりの中で保持する情報量)はGemini 1.0から大幅に拡大し、200万トークン(注1)をサポートする。長文のテキストや、録音した音声、動画コンテンツについて内容を理解し、要約を生成する。
- トークンとはテキストデータを処理する際の基本的な単位で、英語であれば1トークンは4文字程度と考えられる。
- コンテキストウィンドウ(生成AIがやりとりの中で保持する情報量)はGemini 1.0から大幅に拡大し、200万トークン(注1)をサポートする。長文のテキストや、録音した音声、動画コンテンツについて内容を理解し、要約を生成する。
- テキストコンテンツの生成
- 物語の執筆やブログ記事の作成、台本の作成などのタスクを実行できる。
- 視覚情報の分析と説明
- 写真や絵など、ビジュアルコンテンツに関連する記述や説明を生成する。
- 翻訳
- 多言語間での翻訳をする。
- アシスタントチャットbotの構築
- 画像や動画、音声などさまざまな形式のデータを理解し、推測できる会話型AIアシスタントの構築を支援する。
- ソースコードの分析と生成
- アプリケーションのソースコードを理解し、分析して改善を提案する他、ソースコードを解釈して新しいコードスニペット(短いソースコードのまとまり)を生成する。
Gemini 1.5 Proを利用する方法は?
Gemini 1.5 Proは以下のサービスやアプリケーションから利用できる。
- Vertex AI
- Googleの機械学習モデル構築支援ツール「Vertex AI」からGemini 1.5 Proを利用し、AIモデルの構築、デプロイ(配備)、管理ができる。
- Google AI Studio
- Webベースの開発者ツール「Google AI Studio」からGemini 1.5 Proにアクセスできる。Webブラウザ上で試作モデルを作成してプロンプト(指令文)を実行できる。
- Google Workspace
- Gemini 1.5 Proは、Googleのオフィススイート「Google Workspace」に統合されている。「Gmail」「Googleドキュメント」などのアプリケーションから利用できる。
- Gemini API
- Geminiを利用するためのAPI(アプリケーションプログラミングインタフェース)「Gemini API」を利用して、Gemini 1.5 Proをサードパーティーアプリケーションから利用できる。
- Gemini APIでは、構造化データの出力を実現する「JSON」(JavaScript Object Notation)モードと、他システムとの連携を支援するため関数呼び出し機能を強化している。
- モバイルアプリケーション
- Gemini APIとSDK(ソフトウェア開発キット)を用いて、モバイルアプリケーションからGemini 1.5 Proを利用できる。
- Webアプリケーション
- Gemini APIを用いてWebアプリケーションからGemini 1.5 Proを利用できる。チャットbotやコンテンツ生成、データ分析といった用途に使える。
Gemini 1.5 Proのプラン
Googleは2024年6月、開発者向けにGemini 1.5 Proの提供を開始した。
Gemini 1.5 Proには無料プランと有料プランが用意されている。Google AI StudioにおけるGemini 1.5 Proのレート制限(APIにアクセスする回数や範囲の制限)と価格は以下の通り。
- 無料プラン
- 2RPM(1分当たりのリクエスト数)および50RPD(1日当たりのリクエスト数)
- 有料プラン
- 360 RPMおよび1万RPD
- プロンプトが最大12万8000トークンまでの場合は、100万トークン当たり3.5ドル
- プロンプトが12万8000トークンを超える場合は、100万トークン当たり7ドル
Gemini 1.5 Proの軽量版「Gemini 1.5 Flash」は、Gemini 1.5 Proに匹敵する回答精度を持つというが、約10分の1の価格で利用できる。ただし機能はGemini 1.5 Proと比べて限られる。Gemini 1.5 Flashのレート制限と価格は以下の通り。
- 無料プラン
- 15RPMおよび1500RPD
- 有料プラン
- 360RPMおよび1万RPD
- プロンプトが最大12万8000トークンまでの場合は、100万トークン当たり0.35ドル
- プロンプトが12万8000トークンを超える場合は、100万トークン当たり0.7ドル
TechTarget発 先取りITトレンド
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.