OpenAIの「ChatGPT」とGoogleの「Gemini」はどちらも代表的な生成AIサービスだ。どちらを選ぶべきか悩むユーザーに向けて、プランや特徴の違いを解説する。
2022年11月、AI(人工知能)ベンダーOpenAIがAIチャットbot「ChatGPT」を公開したことをきっかけに、テキストや画像を自動生成する「生成AI」(ジェネレーティブAI)が世間の関心を集めた。
この流れに乗じて、各ベンダーは生成AI関連の取り組みに乗り出している。2023年1月、MicrosoftはOpenAIに対する数十億ドル規模の投資を発表。Googleは2023年3月にAIチャットbot「Bard」を発表し、その後にこれを汎用(はんよう)的なAIモデルとしてリブランディングした「Gemini」を発表している。
本連載では市場をけん引する2つの生成AI、ChatGPTとGeminiについて、その違いをさまざまな角度から解説していく。
生成AIの草分け的存在であるChatGPT。OpenAIのCEOサム・アルトマン氏によると、同サービスは2022年11月のリリースからわずか5日間で、100万人のユーザーを獲得したという。
ChatGPTの主な用途には、文章作成や要約、ソーシャルメディアやブログに投稿するためのコンテンツ作成などがある。他にも、言語翻訳やソースコード生成、シミュレーション、エンターテインメント向けアプリケーションの構築など、その活躍範囲は広い。
ユーザーは、WebブラウザやモバイルデバイスでChatGPTを利用できる。開発者なら、API(アプリケーションプログラミングインタフェース)を使ってアプリケーションからChatGPTにアクセスできるようにすることもできる。
ChatGPTのベースとなる大規模言語モデル(LLM)の「Generative Pre-trained Transformer」(GPT)は、データシーケンス(一続きのデータ)の中から特定のパターンを見つけ出す。この仕組みを用いてユーザーのプロンプト(情報生成のための質問や指示)に対する回答を生成し、対話型のインタフェースとして機能する。
無償版ChatGPTのLLMとして「GPT-3.5」、有償版の「ChatGPT Plus」「ChatGPT Team」「ChatGPT Enterprise」としては「GPT-4」が採用されている。
GPT-4はGPT-3.5と比較して、回答速度や推論能力、整合性に優れている他、データ分析、画像の説明や作成といったタスクもこなせる。GPT-3.5の教師データは2021年9月に最終更新されたものだが、GPT-4は2023年4月が最終更新となっている。
さらに、GPT-4はマルチモーダルである点が特徴だ。マルチモーダルとは、数値や画像、テキスト、音声など複数種類のデータを組み合わせて、あるいは関連付けて処理できることを意味する。つまり、プロンプトにテキストだけでなく、画像や音声を含めることができる。
モバイルOS「iOS」「Android」向けのアプリケーション版ChatGPTでは、音声入力機能を使えばAIモデルと音声でやりとりができる。声は5種類から選べる。
ChatGPTには無償版の他、大きく分けて3つの有償プランがある。
Googleのグループ企業Google DeepMindが2023年12月に発表したAIモデルGemini。2024年2月に最新の「Gemini Advanced」を発表したタイミングで、AIチャットbot「Google Bard」の名称をGeminiに変更した。
Geminiは、学習データやGoogleのサービスから得た情報を基にプロンプトに回答する仕組みだ。GeminiはGoogleの検索エンジンと連動する他、メールサービス「Gmail」や表計算ツール「Google Sheets」(Google スプレッドシート)など、同社のオフィススイート「Google Workspace」の各アプリケーションで利用できる。この「Gemini for Google Workspace」(旧称Duet AI for Google Workspace)は、MicrosoftのAIアシスタント「Microsoft Copilot」を意識した動きといえる。
GeminiもGPT-4と同様マルチモーダルAIだ。しかし2024年2月、GoogleはGeminiの画像生成機能を「不正確な出力を生成する可能性がある」として一時停止している。Googleは画像生成機能を改良し、再公開する見込みだ。
Android搭載デバイスでは、モバイルアプリケーション版Geminiを使用できる。iOS搭載デバイスでは、「Google アプリ」を使ってGeminiを利用できる。
Geminiには無償版と有償プランがある。
GoogleのCEOサンダー・ピチャイ氏はGemini 1.0 Ultraについて、「推論能力や指示の遂行能力、コーディング、コラボレーション機能において、Gemini Proよりもはるかに能力が高い」と述べている。ピチャイ氏はGemini Advancedの用途として、個人のスタイルに合わせたチューター(指導員)の他、ビジネス計画やコンテンツ戦略の策定支援などを挙げる。
2024年2月、Googleは1.5兆個のパラメーターを備えるLLM「Gemini 1.5 Ultra」を発表している。Gemini 1.0 Ultraと同等の性能を、より少ない計算リソースで発揮できるという。これにより、「GPT-4」への競争力を高めたといえる。Gemini 1.5 Proの提供時期は明らかにしていない。
次回は、ChatGPTとGeminiを4つの視点から比較する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
AI技術は業務効率化などの恩恵をもたらす一方で、セキュリティやガバナンスに関する課題も顕在化している。本資料では、2025年版AIセキュリティレポートの結果を基に、AIの利用状況、リスク、セキュリティ対策などを多角的に解説する。
研究開発や設計支援など、製造業におけるAIのユースケースは多岐にわたる。企業の競争力を高めるため効果的にAIを活用するためには、ICTインフラ環境の高度化が不可欠であり、用途に合わせた最適なインフラのデザインが求められる。
ビジネスにおける生成AI活用が進む中、多くの企業がPoC(概念実証)から本番環境への移行に課題を抱えている実態が明らかになった。その解決策の1つである「AIプラットフォーム」の必要性や導入価値について解説する。
競合他社に差をつける手段として注目度が高い「生成AI」。ビジネスメリットの話題には事欠かないが、意外にも企業における生成AI活用度は低い。原因の1つが学習機会の欠如だ。生成AIを効果的に導入し、活用できる人材を育成するためには?
エンタープライズ向け生成AIの導入が進む中、期待した成果が得られていない企業もあり、システムの分断やROIの低下といったリスクも顕在化しつつある。このような課題を解消するためには、どのようなツールが求められるのだろうか。
なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...