OpenAIの「ChatGPT」とGoogleの「Gemini」はどちらも代表的な生成AIサービスだ。どちらを選ぶべきか悩むユーザーに向けて、プランや特徴の違いを解説する。
2022年11月、AI(人工知能)ベンダーOpenAIがAIチャットbot「ChatGPT」を公開したことをきっかけに、テキストや画像を自動生成する「生成AI」(ジェネレーティブAI)が世間の関心を集めた。
この流れに乗じて、各ベンダーは生成AI関連の取り組みに乗り出している。2023年1月、MicrosoftはOpenAIに対する数十億ドル規模の投資を発表。Googleは2023年3月にAIチャットbot「Bard」を発表し、その後にこれを汎用(はんよう)的なAIモデルとしてリブランディングした「Gemini」を発表している。
本連載では市場をけん引する2つの生成AI、ChatGPTとGeminiについて、その違いをさまざまな角度から解説していく。
生成AIの草分け的存在であるChatGPT。OpenAIのCEOサム・アルトマン氏によると、同サービスは2022年11月のリリースからわずか5日間で、100万人のユーザーを獲得したという。
ChatGPTの主な用途には、文章作成や要約、ソーシャルメディアやブログに投稿するためのコンテンツ作成などがある。他にも、言語翻訳やソースコード生成、シミュレーション、エンターテインメント向けアプリケーションの構築など、その活躍範囲は広い。
ユーザーは、WebブラウザやモバイルデバイスでChatGPTを利用できる。開発者なら、API(アプリケーションプログラミングインタフェース)を使ってアプリケーションからChatGPTにアクセスできるようにすることもできる。
ChatGPTのベースとなる大規模言語モデル(LLM)の「Generative Pre-trained Transformer」(GPT)は、データシーケンス(一続きのデータ)の中から特定のパターンを見つけ出す。この仕組みを用いてユーザーのプロンプト(情報生成のための質問や指示)に対する回答を生成し、対話型のインタフェースとして機能する。
無償版ChatGPTのLLMとして「GPT-3.5」、有償版の「ChatGPT Plus」「ChatGPT Team」「ChatGPT Enterprise」としては「GPT-4」が採用されている。
GPT-4はGPT-3.5と比較して、回答速度や推論能力、整合性に優れている他、データ分析、画像の説明や作成といったタスクもこなせる。GPT-3.5の教師データは2021年9月に最終更新されたものだが、GPT-4は2023年4月が最終更新となっている。
さらに、GPT-4はマルチモーダルである点が特徴だ。マルチモーダルとは、数値や画像、テキスト、音声など複数種類のデータを組み合わせて、あるいは関連付けて処理できることを意味する。つまり、プロンプトにテキストだけでなく、画像や音声を含めることができる。
モバイルOS「iOS」「Android」向けのアプリケーション版ChatGPTでは、音声入力機能を使えばAIモデルと音声でやりとりができる。声は5種類から選べる。
ChatGPTには無償版の他、大きく分けて3つの有償プランがある。
Googleのグループ企業Google DeepMindが2023年12月に発表したAIモデルGemini。2024年2月に最新の「Gemini Advanced」を発表したタイミングで、AIチャットbot「Google Bard」の名称をGeminiに変更した。
Geminiは、学習データやGoogleのサービスから得た情報を基にプロンプトに回答する仕組みだ。GeminiはGoogleの検索エンジンと連動する他、メールサービス「Gmail」や表計算ツール「Google Sheets」(Google スプレッドシート)など、同社のオフィススイート「Google Workspace」の各アプリケーションで利用できる。この「Gemini for Google Workspace」(旧称Duet AI for Google Workspace)は、MicrosoftのAIアシスタント「Microsoft Copilot」を意識した動きといえる。
GeminiもGPT-4と同様マルチモーダルAIだ。しかし2024年2月、GoogleはGeminiの画像生成機能を「不正確な出力を生成する可能性がある」として一時停止している。Googleは画像生成機能を改良し、再公開する見込みだ。
Android搭載デバイスでは、モバイルアプリケーション版Geminiを使用できる。iOS搭載デバイスでは、「Google アプリ」を使ってGeminiを利用できる。
Geminiには無償版と有償プランがある。
GoogleのCEOサンダー・ピチャイ氏はGemini 1.0 Ultraについて、「推論能力や指示の遂行能力、コーディング、コラボレーション機能において、Gemini Proよりもはるかに能力が高い」と述べている。ピチャイ氏はGemini Advancedの用途として、個人のスタイルに合わせたチューター(指導員)の他、ビジネス計画やコンテンツ戦略の策定支援などを挙げる。
2024年2月、Googleは1.5兆個のパラメーターを備えるLLM「Gemini 1.5 Ultra」を発表している。Gemini 1.0 Ultraと同等の性能を、より少ない計算リソースで発揮できるという。これにより、「GPT-4」への競争力を高めたといえる。Gemini 1.5 Proの提供時期は明らかにしていない。
次回は、ChatGPTとGeminiを4つの視点から比較する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
ハロウィーンの口コミ数はエイプリルフールやバレンタインを超える マーケ視点で押さえておくべきことは?
ホットリンクは、SNSの投稿データから、ハロウィーンに関する口コミを調査した。
なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...
業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...