なぜ「GPT-4o」を使いたくなる? 「GPT-4 Turbo」との実力差を検証:LLM新モデルがもたらす変化【中編】
OpenAIが2024年5月に発表した「GPT-4o」は、「GPT-4 Turbo」から何が進化したのか。実際に試してみた結果と併せて解説する。
AI(人工知能)ベンダーOpenAIが2024年5月に発表した大規模言語モデル(LLM)「GPT-4 Omni」(GPT-4o)は、同社が2023年11月に発表したLLM「GPT-4 Turbo」から大きく4つの点で進化している。前編に引き続き、残り3つのポイントを解説する。
「GPT-4o」「GPT-4 Turbo」の性能やコストを比較
併せて読みたいお薦め記事
連載:LLM新モデルがもたらす変化
生成AIに関する注目の話題
2.処理の効率化
GPT-4oは、GPT-4 Turboと比較してより高速かつ効率的な計算処理が可能だ。OpenAIによると、GPT-4oの処理スピードはGPT-4 Turboの約2倍だという。
米TechTarget編集部は、OpenAIのAIチャットbot「ChatGPT」で、両モデルの応答時間を測定した。その結果、確かにGPT-4oはGPT-4 Turboよりも速く応答し、生成した内容の質はほぼ同等だった。以下は、5つのプロンプト(情報を生成するための指示や質問文)に対するGPT-4oとGPT-4 Turboの応答時間を比較した表だ。
プロンプト | GPT-4oの応答を出力するまでにかかる時間 | GPT-4 Turboの応答を出力するまでにかかる時間 |
---|---|---|
量子コンピューティング技術がIT業界をどのように変えるかをテーマに、500文字のエッセイを書いて | 23秒 | 33秒 |
米国ミシガン州トラバースシティーへの3日間の旅行スケジュールを考えて | 28秒 | 48秒 |
「hello world」と表示するようC言語でソースコードを書いて | 4秒 | 7秒 |
添付画像(ムクドリモドキ の写真)の代替テキストを作成して | 2秒 | 3秒 |
添付ドキュメント(22ページに及ぶ神経科学学術記事)を、5つのリスト形式に要約して | 16秒 | 19秒 |
OpenAIが実施したベンチマークテストでは、GPT-4oは単純な数学問題、言語理解、視覚認識といった項目で、GPT-4 Turboを上回る評価を出している。加えて、GPT-4oはGPT-4 Turboより優れた文脈理解力を持ち、イディオム(慣用句)や比喩表現、特定の文化圏で使用される用語について、より優れた理解力を示すという。
GPT-4oを実際に使った人の意見はさまざまだ。2024年6月時点で、GPT-4oはLLM比較評価サイト「Chatbot Arena」で総合的な最高評価を受けている。しかし一部のユーザーは、この結果を「過大評価」と見なしており、「コーディングや分類、推論といったタスクではGPT-4 Turboの方が優れている」と報告している。
上記で紹介した情報はあくまで参考だ。どちらのモデルが最適か見極めるためには、実際に時間をかけて試すことが重要だ。中には、タスクに応じてGPT-4oとGPT-4 Turboを切り替えながら使用している開発者もいる。
3.コストの軽減
GPT-4oは、処理の効率化とコスト抑制を実現している。コストはそれぞれ以下の通り。
- GPT-4o
- 100万トークン(注)当たり入力5ドル、出力15ドル
- GPT-4-Turbo
- 100万トークン当たり入力10ドル、出力30ドル
この通り、GPT-4-TurboのコストはGPT-4oの倍だ。
※注:トークンとはテキストデータを処理する際の基本的な単位で、英語であれば1トークンは4文字程度と考えられる。
無償版ChatGPTのユーザーにも大きなメリットがある。GPT-4oは「GPT-3.5」に代わって無償版ChatGPTの標準モデルとなる。GPT-4oの登場と併せて、従来は有料版のユーザーのみが利用できた「GPTs」(GPT Builder)を無料版ユーザーも一部利用できるようになった。GPTsは、ユーザーがGPTをカスタマイズし、特定のビジネスニーズに特化したGPTを作成できるサービスだ。
GPT-4 Turboは引き続き、
- ChatGPT Plus
- ChatGPT Team
- ChatGPT Enterprise
といった有料版のユーザーのみが利用できる。
無料版ユーザーと有料版ユーザーでは、モデルの利用制限が異なる点に注意が必要だ。違いは以下の通り。
- 無料版ユーザー
- GPT-4oに質問できる回数は5時間当たり10回まで
- 上限に達するとGPT-3.5に自動で切り替わる
- 有料版ユーザー
- ChatGPT PlusのユーザーがGPT-4oに送信できるメッセージ数は3時間当たり80回まで
- ChatGPT TeamとChatGPT Enterpriseのユーザーは送れるメッセージ数がさらに多い
4.多言語サポートの強化
GPT-4oはGPT-4 Turboと比較して、非英語圏の言語をより的確に扱えるように設計されている。特に、ヒンディー語、中国語、韓国語など、アルファベット以外の言語に対するトークン化のプロセスが改善されたという。AIモデルはトークンごとにデータを処理し、データの予測や生成を実施する。GPT-4oで使用されるトークナイザーは、アルファベット以外の文字で構成されたテキストをより効率よく圧縮でき、より安価かつ迅速にプロンプトを処理できる。
自然言語処理(NLP)の歴史において、AIモデルは西洋言語に最適化され、他地域の言語は軽視される傾向にあった。GPT-4oは、より多くの言語をより正確かつ自然に処理できるため、グローバル市場に適しており、非英語圏の人々にも道を開くことになる。
とはいえ課題もある。GPT-4oの発表から数日後、OpenAIは中国語のトークンにポルノやギャンブルに関する不適切なフレーズが含まれていることを発見した。学習データのクリーニングが不十分であったために、問題のあるトークンが含まれてしまった可能性があるという。AIモデルが不適切なデータを学習してしまうと、セキュリティリスクの増加や回答精度の低下、事実と異なる情報を生成する現象を指す「ハルシネーション」(幻覚) を引き起こしてしまう可能性がある。
次回は、GPT-4oに対して企業がどのような関心を示しているのかを解説する。
TechTarget発 先取りITトレンド
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.