代表的な生成AIサービスの「ChatGPT」と「Gemini」には、それぞれどのような強みと弱みがあるのか。専門家によるレビューや比較検証の結果を基に、“スペックの比較表”だけでは分からない特徴を解説する。
テキストや画像を自動生成する人工知能技術「生成AI」(ジェネレーティブAI)の市場が活況だ。各ベンダーが生成AIサービスの開発と提供を進める中で、ユーザー企業は自社の用途や使用環境に適したサービスを選ぶ必要がある。
本稿は、代表的な生成AIサービスである、OpenAIのAIチャットbot「ChatGPT」とGoogleのAIモデル「Gemini」(旧称Bard)それぞれの強みや弱みを、複数の専門家によるレビューと検証結果を基に解説する。
一般的に、言語ベースのタスクにはChatGPT、画像や動画も扱いたい場合はマルチモーダルAIのGeminiが適するといわれる。マルチモーダルとは、数値や画像、テキスト、音声など複数種類のデータを組み合わせて、あるいは関連付けて処理できることを意味する。
カーネギーメロン大学(Carnegie Mellon University)とAIベンダーBerriAIは、より公平で詳細な回答ができるAIモデルの開発を目指し、検証を進めている。検証では、10種類の言語ベースのタスクを用いてGeminiのLLM「Gemini Pro」の性能を評価し、ChatGPTのLLM「GPT-3」「GPT-4」の性能と比較した。
結果、Gemini Proは長文や複雑な推論プロセスの処理、言語翻訳が得意なことが分かった。一方で短所として以下が挙げられた。
研究者による総括では、Gemini ProはGPT-3やGPT-4の性能には及ばないが、複雑な推論が可能な点や、推論の深さにおいて強みを発揮する、と結論付けられた。
フューチャリスト(未来学者)であり、書籍「Generative AI in Practice」の著者でもあるバーナード・マー氏は、「Geminiの性能はChatGPTと同じレベルに達しつつある」と評価する。ChatGPTが対話型のユーザーインタフェースとして秀でているのに対し、Geminiは効率的な情報処理やタスクの自動化に向いている、というのがマー氏の見解だ。
ペンシルベニア大学(University of Pennsylvania)でAI技術を研究するイーサン・モリック氏は、Googleが2024年2月に発表した生成AIサービス「Gemini Advanced」について、「ChatGPTとほぼ同等のレベルに達した初のAIモデル」と評価した。
検証によると、Gemini Advancedに搭載されるLLM「Gemini 1.0 Ultra」は説明や検索において優れた性能を発揮したという。一方のGPT-4は、テキストベースの難しいタスクの処理や、ソースコードの生成、解説が得意だった。
モリック氏はChatGPTとGemini Advancedの共通の課題として、「回答に一貫性がなく、想定していた以上に不正確な回答を出力する幻覚(ハルシネーション)が起きた」ことを挙げる。
OpenAIとGoogleは、どちらもハルシネーションのリスクをユーザーに周知している。ChatGPTとGeminiのプロンプト入力画面の下部には免責事項が記載されており、機密情報を入力しないよう警告が出ている。
Geminiの公式WebサイトにおけるFAQ(よくある質問とその答え)には、次のようなアドバイスが掲載されている。
生成AIは日進月歩の技術だ。ChatGPTとGemini以外にも、以下のようなさまざまな生成AIサービスが提供されている。
次回は、ChatGPTとGeminiに同じプロンプトを渡した際の出力内容を比較する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
トランプ氏当選でイーロン・マスク氏に追い風 過去最高の投稿数達成でXは生き延びるか?
2024年の米大統領選の当日、Xの利用者数が過去最高を記録した。Threadsに流れていたユー...
トランプ氏圧勝で気になる「TikTok禁止法」の行方
米大統領選で共和党のトランプ前大統領が勝利した。これにより、TikTokの米国での将来は...
インバウンド消費を左右する在日中国人の影響力
アライドアーキテクツは、独自に構築した在日中国人コミュニティーを対象に、在日中国人...