生成AI“2大ツール”「ChatGPT」と「Gemini」の違いを徹底解説：OpenAIとGoogleの生成AIを比較【第1回】

OpenAIの「ChatGPT」とGoogleの「Gemini」はどちらも代表的な生成AIサービスだ。どちらを選ぶべきか悩むユーザーに向けて、プランや特徴の違いを解説する。

≫ 2024年04月08日 08時15分公開

[Dave Raffo，TechTarget]

生成AIの草分け的存在「ChatGPT」

併せて読みたいお薦め記事

生成AIの実用化に向けて読みたい記事

　生成AIの草分け的存在であるChatGPT。OpenAIのCEOサム・アルトマン氏によると、同サービスは2022年11月のリリースからわずか5日間で、100万人のユーザーを獲得したという。

　ChatGPTの主な用途には、文章作成や要約、ソーシャルメディアやブログに投稿するためのコンテンツ作成などがある。他にも、言語翻訳やソースコード生成、シミュレーション、エンターテインメント向けアプリケーションの構築など、その活躍範囲は広い。

　ユーザーは、WebブラウザやモバイルデバイスでChatGPTを利用できる。開発者なら、API（アプリケーションプログラミングインタフェース）を使ってアプリケーションからChatGPTにアクセスできるようにすることもできる。

ベースとなるLLMは2種類

　ChatGPTのベースとなる大規模言語モデル（LLM）の「Generative Pre-trained Transformer」（GPT）は、データシーケンス（一続きのデータ）の中から特定のパターンを見つけ出す。この仕組みを用いてユーザーのプロンプト（情報生成のための質問や指示）に対する回答を生成し、対話型のインタフェースとして機能する。

　無償版ChatGPTのLLMとして「GPT-3.5」、有償版の「ChatGPT Plus」「ChatGPT Team」「ChatGPT Enterprise」としては「GPT-4」が採用されている。

　GPT-4はGPT-3.5と比較して、回答速度や推論能力、整合性に優れている他、データ分析、画像の説明や作成といったタスクもこなせる。GPT-3.5の教師データは2021年9月に最終更新されたものだが、GPT-4は2023年4月が最終更新となっている。

　さらに、GPT-4はマルチモーダルである点が特徴だ。マルチモーダルとは、数値や画像、テキスト、音声など複数種類のデータを組み合わせて、あるいは関連付けて処理できることを意味する。つまり、プロンプトにテキストだけでなく、画像や音声を含めることができる。

　モバイルOS「iOS」「Android」向けのアプリケーション版ChatGPTでは、音声入力機能を使えばAIモデルと音声でやりとりができる。声は5種類から選べる。

プランは大きく3つ

　ChatGPTには無償版の他、大きく分けて3つの有償プランがある。

ChatGPT Plus
- 個人ユーザー向け。料金はユーザー当たり月額20ドル。
- 利用ピーク時のアクセスが保証されている。無償版の場合はアクセスが集中すると応答が遅くなることがある。
ChatGPT Team
- 法人向け。年間契約の場合、ユーザー当たり月額25ドル。月額契約の場合は30ドル。
- ChatGPT Plusの機能に加えて、時間当たりに送信可能なメッセージ数が多い他、ChatGPT Plusよりも応答速度が速い。
- ワークスペースの管理コンソールがあり、チームでGPTの共有、編集ができる。
ChatGPT Enterprise
- 法人向け。料金は非公開。
- GPT-4への無制限の高速アクセスが保証されている。
- ChatGPTプランの中で最速の応答時間やより長いコンテキストウィンドウ、ワークスペースの管理コンソールやカスタマーサポート、無制限のデータ分析機能などを利用できる。

競争力を高める「Gemini」

　Googleのグループ企業Google DeepMindが2023年12月に発表したAIモデルGemini。2024年2月に最新の「Gemini Advanced」を発表したタイミングで、AIチャットbot「Google Bard」の名称をGeminiに変更した。

　Geminiは、学習データやGoogleのサービスから得た情報を基にプロンプトに回答する仕組みだ。GeminiはGoogleの検索エンジンと連動する他、メールサービス「Gmail」や表計算ツール「Google Sheets」（Google スプレッドシート）など、同社のオフィススイート「Google Workspace」の各アプリケーションで利用できる。この「Gemini for Google Workspace」（旧称Duet AI for Google Workspace）は、MicrosoftのAIアシスタント「Microsoft Copilot」を意識した動きといえる。

　GeminiもGPT-4と同様マルチモーダルAIだ。しかし2024年2月、GoogleはGeminiの画像生成機能を「不正確な出力を生成する可能性がある」として一時停止している。Googleは画像生成機能を改良し、再公開する見込みだ。

　Android搭載デバイスでは、モバイルアプリケーション版Geminiを使用できる。iOS搭載デバイスでは、「Google アプリ」を使ってGeminiを利用できる。

気になるGeminiのプランは？

　Geminiには無償版と有償プランがある。

Gemini
- 無償。LLMは「Gemini Pro」を搭載する。
- Googleによると、開発や研究調査といった用途向けに無料のAIチャットbotとして、Gemini ProとそのAI機能が良い選択肢となるという。Gemini Proを使えば、個人のシンプルなタスクにAIを導入できる。
Gemini Advanced
- オンラインストレージサービス「Google One AI Premium Plan」の一部として提供される。初期費用（2カ月）は無料、以後はユーザー当たり月額19.99ドル。同サービスには2TBのストレージも含まれる。利用できる言語は英語のみ。
- 「Gemini 1.0 Ultra」を搭載。Gemini Proと比較して、性能やより最先端の機能を備えている。Google Advancedには、新機能への早期アクセスも含まれる。GPT-4の強力なライバルと見なされる。

　GoogleのCEOサンダー・ピチャイ氏はGemini 1.0 Ultraについて、「推論能力や指示の遂行能力、コーディング、コラボレーション機能において、Gemini Proよりもはるかに能力が高い」と述べている。ピチャイ氏はGemini Advancedの用途として、個人のスタイルに合わせたチューター（指導員）の他、ビジネス計画やコンテンツ戦略の策定支援などを挙げる。

　2024年2月、Googleは1.5兆個のパラメーターを備えるLLM「Gemini 1.5 Ultra」を発表している。Gemini 1.0 Ultraと同等の性能を、より少ない計算リソースで発揮できるという。これにより、「GPT-4」への競争力を高めたといえる。Gemini 1.5 Proの提供時期は明らかにしていない。

　次回は、ChatGPTとGeminiを4つの視点から比較する。

TechTarget発先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

TechTargetジャパントップエンタープライズAI