「Gemini 1.5 Pro」の“マルチな能力”を使いこなす、これだけの方法Geminiシリーズ新モデルを徹底解剖【後編】

GoogleのLLM「Gemini 1.5 Pro」はGemini 1.0から何が進化し、どのような用途に使えるのか。使いこなすための方法を、利用方法や料金プランと併せて解説する。

2024年07月11日 08時00分 公開
[Sean Michael KernerTechTarget]

関連キーワード

人工知能 | Google


 Googleの大規模言語モデル(LLM)「Gemini 1.0」の後継となる「Gemini 1.5 Pro」は、Gemini 1.0よりも幅広い機能を備える。具体的にどのような用途でGemini 1.5 Proが使えるのか。企業やエンドユーザーは、どのような方法でGemini 1.5 Proを利用できるのか。利用プランと併せて解説する。

Gemini 1.5 Proの“マルチな能力”を使いこなす方法はこれだ

 Gemini 1.5 Proは幅広いタスクに使用できる。Gemini 1.5 Proの主な用途と機能を幾つか紹介する。

  • Q&A(質疑応答)
    • GeminiはGoogleのトレーニングデータに基づいて、基本的な知識を問う質問に答える。
    • マルチモーダル(複数の情報源をまとめて扱うこと)であるため、テキスト、画像、オーディオ、ビデオの情報を組み合わせて質問に回答する。
  • 長文コンテンツの分析
    • 長文のテキストや書籍、プログラムのソースコード、ビデオなどを分析し、理解する能力がある。
  • 要約
    • コンテキストウィンドウ(生成AIがやりとりの中で保持する情報量)はGemini 1.0から大幅に拡大し、200万トークン(注1)をサポートする。長文のテキストや、録音した音声、動画コンテンツについて内容を理解し、要約を生成する。
      • トークンとはテキストデータを処理する際の基本的な単位で、英語であれば1トークンは4文字程度と考えられる。
  • テキストコンテンツの生成
    • 物語の執筆やブログ記事の作成、台本の作成などのタスクを実行できる。
  • 視覚情報の分析と説明
    • 写真や絵など、ビジュアルコンテンツに関連する記述や説明を生成する。
  • 翻訳
    • 多言語間での翻訳をする。
  • アシスタントチャットbotの構築
    • 画像や動画、音声などさまざまな形式のデータを理解し、推測できる会話型AIアシスタントの構築を支援する。
  • ソースコードの分析と生成
    • アプリケーションのソースコードを理解し、分析して改善を提案する他、ソースコードを解釈して新しいコードスニペット(短いソースコードのまとまり)を生成する。

Gemini 1.5 Proを利用する方法は?

 Gemini 1.5 Proは以下のサービスやアプリケーションから利用できる。

  • Vertex AI
    • Googleの機械学習モデル構築支援ツール「Vertex AI」からGemini 1.5 Proを利用し、AIモデルの構築、デプロイ(配備)、管理ができる。
  • Google AI Studio
    • Webベースの開発者ツール「Google AI Studio」からGemini 1.5 Proにアクセスできる。Webブラウザ上で試作モデルを作成してプロンプト(指令文)を実行できる。
  • Google Workspace
    • Gemini 1.5 Proは、Googleのオフィススイート「Google Workspace」に統合されている。「Gmail」「Googleドキュメント」などのアプリケーションから利用できる。
  • Gemini API
    • Geminiを利用するためのAPI(アプリケーションプログラミングインタフェース)「Gemini API」を利用して、Gemini 1.5 Proをサードパーティーアプリケーションから利用できる。
    • Gemini APIでは、構造化データの出力を実現する「JSON」(JavaScript Object Notation)モードと、他システムとの連携を支援するため関数呼び出し機能を強化している。
  • モバイルアプリケーション
    • Gemini APIとSDK(ソフトウェア開発キット)を用いて、モバイルアプリケーションからGemini 1.5 Proを利用できる。
  • Webアプリケーション
    • Gemini APIを用いてWebアプリケーションからGemini 1.5 Proを利用できる。チャットbotやコンテンツ生成、データ分析といった用途に使える。

Gemini 1.5 Proのプラン

 Googleは2024年6月、開発者向けにGemini 1.5 Proの提供を開始した。

 Gemini 1.5 Proには無料プランと有料プランが用意されている。Google AI StudioにおけるGemini 1.5 Proのレート制限(APIにアクセスする回数や範囲の制限)と価格は以下の通り。

  • 無料プラン
    • 2RPM(1分当たりのリクエスト数)および50RPD(1日当たりのリクエスト数)
  • 有料プラン
    • 360 RPMおよび1万RPD
    • プロンプトが最大12万8000トークンまでの場合は、100万トークン当たり3.5ドル
    • プロンプトが12万8000トークンを超える場合は、100万トークン当たり7ドル

 Gemini 1.5 Proの軽量版「Gemini 1.5 Flash」は、Gemini 1.5 Proに匹敵する回答精度を持つというが、約10分の1の価格で利用できる。ただし機能はGemini 1.5 Proと比べて限られる。Gemini 1.5 Flashのレート制限と価格は以下の通り。

  • 無料プラン
    • 15RPMおよび1500RPD
  • 有料プラン
    • 360RPMおよび1万RPD
    • プロンプトが最大12万8000トークンまでの場合は、100万トークン当たり0.35ドル
    • プロンプトが12万8000トークンを超える場合は、100万トークン当たり0.7ドル

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

ITmedia マーケティング新着記事

news095.jpg

キアヌ・リーブスが“AI武装”してセキュリティ企業の広告に登場の謎展開 敏腕CMOの狙いは?
サイバーセキュリティ企業のPalo Alto Networksは、B2Bが「退屈な仕事」ではないことを証...

news049.png

ハンバーガーにいくらまでなら出せる? 消費者が考える食品の上限価格と適正価格
クロス・マーケティングが食品の価格に関する調査を実施。身近な食品の最適価格や「最近...

news193.jpg

B2Bマーケティングや営業戦略はコロナ前後でどう変わったのか?
ALUHAは、B2B企業のマーケティングや営業戦略におけるデジタル活用の意識と課題について...