いまさら聞けない「GPT-4o」と「GPT-4 Turbo」の違いはこれだLLM新モデルがもたらす変化【前編】

OpenAIが2024年5月に発表したLLM「GPT-4o」は、「GPT-4 Turbo」から何が進化したのか。押さえておくべきポイントを解説する。

2024年10月17日 07時00分 公開
[Lev CraigTechTarget]

関連キーワード

人工知能


 AI(人工知能)ベンダーOpenAIが2024年5月に発表した大規模言語モデル(LLM)「GPT-4 Omni」(GPT-4o)は、同社が提供してきたLLMを基に改良が施された新たなLLMだ。同社が2023年11月に発表したLLM「GPT-4 Turbo」からどのような点が進化したのか。

「GPT-4 Turbo」から「GPT-4o」へ 何が進化した?

 GPT-4oとGPT-4 TurboはどちらもOpenAIのAIチャットbot「ChatGPT」のベースとなるLLMだ。対話形式のやりとりが可能で、エンドユーザーのプロンプト(情報を生成するための指示や質問文)に応じて文脈に沿った回答を生成する。過去のやりとりのデータを保持し、内容に反映することもできる。

 両LLMのコンテキストウィンドウ(生成AIがやりとりの中で保持する情報量)は最大12万8000トークン(注)。GPT-4oの学習データは2023年10月までの情報に基づいており、GPT-4 Turboの学習データは2023年12月までの情報に基づく。

※注:トークンとはテキストデータを処理する際の基本的な単位で、英語であれば1トークンは4文字程度と考えられる。

 それではGPT-4oは、GPT-4 Turboから何が大きく進化したのか。以降で紹介する内容は、米TechTarget編集部がChatGPT上で両モデルを使用した結果と、以下の情報に基づく。

  • OpenAIの発表や技術文書
  • ソーシャルメディア「Reddit」
  • 技術系ブログ
  • OpenAIの開発者フォーラム「OpenAI Developer Forum」のレビュー

1.マルチモーダル機能の強化

 GPT-4oとGPT-4 Turboはどちらも、テキストだけでなく画像や音声など複数の形式のデータを扱えるマルチモーダルなモデルだ。ChatGPT上でどちらのモデルを選択しても、画像の読み込みや生成、音声対話といった機能を利用できる。

 一方で、その仕組みは大きく異なるようだ。

 GPT-4 Turboはテキスト処理を目的に設計されており、画像や音声、動画を処理するための機能は組み込まれていない。そのためChatGPTでは、GPT-4 Turboでテキスト以外のデータを扱う場合、画像生成モデル「Dall-E」や音声認識モデル「Whisper」といった他のOpenAI製モデルを呼び出して処理する仕組みとなっている。

 対してGPT-4oは、名称に「Omni」(ラテン語で「全ての」を意味する接頭辞)を冠することから分かるように、マルチモーダル機能が組み込まれている。OpenAIはGPT-4oについて、「テキストや画像、動画、音声を含む全ての入出力を、単一のニューラルネットワーク(人間の脳の神経回路を模倣したもの)で処理できる」と説明している。

 GPT-4oは画像解析など、複数のデータ形式を扱うタスクにおいて、処理速度がGPT-4 Turboよりも高速化している。OpenAIが2024年5月に実施したGPT-4oのデモでは、人間が数学の問題を解く様子をビデオ撮影し、GTP-4oがその内容をリアルタイムで解析して音声フィードバックを提供していた。


 次回は引き続き、GPT-4 TurboからGPT-4oの進化を解説する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

髫エ�ス�ス�ー鬨セ�ケ�つ€驛「譎擾スク蜴・�。驛「�ァ�ス�、驛「譎冗樟�ス�ス驛「譎「�ス�シ驛「譏懶スサ�」�ス�ス

製品資料 エス・アンド・アイ株式会社

コンタクトセンター運営の課題を解消、テキスト生成AIの活用方法と導入効果

顧客対応の窓口となるコンタクトセンターにおいて、生成AIを使い業務改善につなげる動きが加速している。その導入でどのようなメリットが得られるのか。テキスト生成機能に焦点を当て、活用方法や導入効果を解説する。

製品資料 株式会社ecbeing

ECサイトを構築した後も残る「FAX注文」、AI-OCRとの連携でどう解決する?

取引先との受発注をFAXからECサイトに切り替えたものの、取引先の都合でFAX注文が残り、二重入力の手間や人的ミスの発生といった課題が発生しているケースは多い。その解決策として、AI-OCRを使ったECサイトとの連携について紹介する。

製品資料 ニュータニックス・ジャパン合同会社

AIの実装/管理を成功させる4つのポイント:データやコストの課題と解決策

AIは生産性や顧客満足度の向上などさまざまな効果をもたらすが、その導入時に、AIモデルの管理/監視、従業員のスキルギャップ、データの一貫性などの課題に悩まされる企業は多い。これらを解消するために必要な、AI戦略の進め方とは?

製品資料 ニュータニックス・ジャパン合同会社

PoC段階で30%の企業が導入を断念、生成AIプロジェクトを成功に導くためには?

企業にとって生成AIは、生産性向上や収益性増加をもたらす重要な技術だが、導入には多くの課題が存在する。PoC(概念実証)段階で約30%の企業が導入を断念するといわれる生成AIプロジェクトを成功に導くための方法を紹介する。

製品資料 日本マイクロソフト株式会社

“普通の社員”のPC活用が根底から変わる、Copilot+ PCがもたらすAI改革の姿

生成AIによって既存業務の生産性向上といった成果を上げる企業が増えている今、AIをより効果的に活用するための鍵になるといわれているのが、AI処理に特化した「Copilot+ PC」だ。AI PCが具体的にどのような変化をもたらすのかを解説する。

アイティメディアからのお知らせ

郢晏生ホヲ郢敖€郢晢スシ郢ァ�ウ郢晢スウ郢晢ソスホヲ郢晢ソスPR

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

いまさら聞けない「GPT-4o」と「GPT-4 Turbo」の違いはこれだ:LLM新モデルがもたらす変化【前編】 - TechTargetジャパン エンタープライズAI 隴�スー騾ケツ€髫ェ蛟�スコ�ス

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...