なぜ「GPT-4o」を使いたくなる? 「GPT-4 Turbo」との実力差を検証LLM新モデルがもたらす変化【中編】

OpenAIが2024年5月に発表した「GPT-4o」は、「GPT-4 Turbo」から何が進化したのか。実際に試してみた結果と併せて解説する。

2024年10月24日 07時00分 公開
[Lev CraigTechTarget]

関連キーワード

人工知能


 AI(人工知能)ベンダーOpenAIが2024年5月に発表した大規模言語モデル(LLM)「GPT-4 Omni」(GPT-4o)は、同社が2023年11月に発表したLLM「GPT-4 Turbo」から大きく4つの点で進化している。前編に引き続き、残り3つのポイントを解説する。

「GPT-4o」「GPT-4 Turbo」の性能やコストを比較

2.処理の効率化

 GPT-4oは、GPT-4 Turboと比較してより高速かつ効率的な計算処理が可能だ。OpenAIによると、GPT-4oの処理スピードはGPT-4 Turboの約2倍だという。

 米TechTarget編集部は、OpenAIのAIチャットbot「ChatGPT」で、両モデルの応答時間を測定した。その結果、確かにGPT-4oはGPT-4 Turboよりも速く応答し、生成した内容の質はほぼ同等だった。以下は、5つのプロンプト(情報を生成するための指示や質問文)に対するGPT-4oとGPT-4 Turboの応答時間を比較した表だ。

表 5つのプロンプトに対するGPT-4oとGPT-4 Turboの応答時間
プロンプト GPT-4oの応答を出力するまでにかかる時間 GPT-4 Turboの応答を出力するまでにかかる時間
量子コンピューティング技術がIT業界をどのように変えるかをテーマに、500文字のエッセイを書いて 23秒 33秒
米国ミシガン州トラバースシティーへの3日間の旅行スケジュールを考えて 28秒 48秒
「hello world」と表示するようC言語でソースコードを書いて 4秒 7秒
添付画像(ムクドリモドキ の写真)の代替テキストを作成して 2秒 3秒
添付ドキュメント(22ページに及ぶ神経科学学術記事)を、5つのリスト形式に要約して 16秒 19秒

 OpenAIが実施したベンチマークテストでは、GPT-4oは単純な数学問題、言語理解、視覚認識といった項目で、GPT-4 Turboを上回る評価を出している。加えて、GPT-4oはGPT-4 Turboより優れた文脈理解力を持ち、イディオム(慣用句)や比喩表現、特定の文化圏で使用される用語について、より優れた理解力を示すという。

 GPT-4oを実際に使った人の意見はさまざまだ。2024年6月時点で、GPT-4oはLLM比較評価サイト「Chatbot Arena」で総合的な最高評価を受けている。しかし一部のユーザーは、この結果を「過大評価」と見なしており、「コーディングや分類、推論といったタスクではGPT-4 Turboの方が優れている」と報告している。

 上記で紹介した情報はあくまで参考だ。どちらのモデルが最適か見極めるためには、実際に時間をかけて試すことが重要だ。中には、タスクに応じてGPT-4oとGPT-4 Turboを切り替えながら使用している開発者もいる。

3.コストの軽減

 GPT-4oは、処理の効率化とコスト抑制を実現している。コストはそれぞれ以下の通り。

  • GPT-4o
    • 100万トークン(注)当たり入力5ドル、出力15ドル
  • GPT-4-Turbo
    • 100万トークン当たり入力10ドル、出力30ドル

 この通り、GPT-4-TurboのコストはGPT-4oの倍だ。

※注:トークンとはテキストデータを処理する際の基本的な単位で、英語であれば1トークンは4文字程度と考えられる。

 無償版ChatGPTのユーザーにも大きなメリットがある。GPT-4oは「GPT-3.5」に代わって無償版ChatGPTの標準モデルとなる。GPT-4oの登場と併せて、従来は有料版のユーザーのみが利用できた「GPTs」(GPT Builder)を無料版ユーザーも一部利用できるようになった。GPTsは、ユーザーがGPTをカスタマイズし、特定のビジネスニーズに特化したGPTを作成できるサービスだ。

 GPT-4 Turboは引き続き、

  • ChatGPT Plus
  • ChatGPT Team
  • ChatGPT Enterprise

といった有料版のユーザーのみが利用できる。

 無料版ユーザーと有料版ユーザーでは、モデルの利用制限が異なる点に注意が必要だ。違いは以下の通り。

  • 無料版ユーザー
    • GPT-4oに質問できる回数は5時間当たり10回まで
    • 上限に達するとGPT-3.5に自動で切り替わる
  • 有料版ユーザー
    • ChatGPT PlusのユーザーがGPT-4oに送信できるメッセージ数は3時間当たり80回まで
    • ChatGPT TeamとChatGPT Enterpriseのユーザーは送れるメッセージ数がさらに多い

4.多言語サポートの強化

 GPT-4oはGPT-4 Turboと比較して、非英語圏の言語をより的確に扱えるように設計されている。特に、ヒンディー語、中国語、韓国語など、アルファベット以外の言語に対するトークン化のプロセスが改善されたという。AIモデルはトークンごとにデータを処理し、データの予測や生成を実施する。GPT-4oで使用されるトークナイザーは、アルファベット以外の文字で構成されたテキストをより効率よく圧縮でき、より安価かつ迅速にプロンプトを処理できる。

 自然言語処理(NLP)の歴史において、AIモデルは西洋言語に最適化され、他地域の言語は軽視される傾向にあった。GPT-4oは、より多くの言語をより正確かつ自然に処理できるため、グローバル市場に適しており、非英語圏の人々にも道を開くことになる。

 とはいえ課題もある。GPT-4oの発表から数日後、OpenAIは中国語のトークンにポルノやギャンブルに関する不適切なフレーズが含まれていることを発見した。学習データのクリーニングが不十分であったために、問題のあるトークンが含まれてしまった可能性があるという。AIモデルが不適切なデータを学習してしまうと、セキュリティリスクの増加や回答精度の低下、事実と異なる情報を生成する現象を指す「ハルシネーション」(幻覚) を引き起こしてしまう可能性がある。


 次回は、GPT-4oに対して企業がどのような関心を示しているのかを解説する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

隴�スー騾ケツ€郢晏ク厥。郢ァ�、郢晏現�ス郢晢スシ郢昜サ」�ス

製品レビュー ストックマーク株式会社

AI技術を使って必要な情報を自動で抽出/要約する「情報収集サービス」の実力

日々情報が増え続ける今、業務に必要な全ての情報を、社内外の関連ニュースや論文、特許情報などから収集していくのは至難の業だ。そこで業務に必要な情報を着実に届けるための仕組み作りに役立つサービスを紹介する。

製品資料 ゼットスケーラー株式会社

セキュリティリーダー必見:データセキュリティの複雑化によるリスクの解消方法             

クラウド利用の拡大に伴い、データが分散・肥大化する中、従来のセキュリティ対策の限界が見え始めている。データの所在や利用状況を可視化し、リスクを事前に把握して対応することが求められる今、有効となる新たなアプローチを探る。

市場調査・トレンド ゼットスケーラー株式会社

AI/MLトランザクション分析から読み取る、企業のリスク管理とセキュリティ課題

AIの活用が急速に進む一方で、セキュリティリスクの増大が懸念され、企業の対応が急務となっている。本資料では、2024年2~12月までの5365億件のAI/ML(機械学習)トランザクションの分析に基づき、その実態と対策を多角的に考察する。

事例 富士通株式会社

富士通が実践、AI時代に最適な設計プロセスを実現する方法

製造業の設計現場では、設計プロセスの複雑化などの課題が山積している。こうした中、注目を集めているのが生成AIの活用だ。本資料では、生成AIがもたらす設計業務の未来について、詳しく解説する。

製品資料 富士通株式会社

チャットbotだけで終わらせない、生成AIの“高度な活用”を実現するには?

多くの企業が業務における生成AIの有用性を実感する一方、高度な活用を目指すに当たり、壁に突き当たっているケースは多い。既存の業務やシステムと生成AIをスムーズに組み合わせ、自社に合った形で活用するには、どうすればよいのか。

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...