OpenAIが2024年5月に発表した「GPT-4o」は、「GPT-4 Turbo」から何が進化したのか。実際に試してみた結果と併せて解説する。
AI(人工知能)ベンダーOpenAIが2024年5月に発表した大規模言語モデル(LLM)「GPT-4 Omni」(GPT-4o)は、同社が2023年11月に発表したLLM「GPT-4 Turbo」から大きく4つの点で進化している。前編に引き続き、残り3つのポイントを解説する。
GPT-4oは、GPT-4 Turboと比較してより高速かつ効率的な計算処理が可能だ。OpenAIによると、GPT-4oの処理スピードはGPT-4 Turboの約2倍だという。
米TechTarget編集部は、OpenAIのAIチャットbot「ChatGPT」で、両モデルの応答時間を測定した。その結果、確かにGPT-4oはGPT-4 Turboよりも速く応答し、生成した内容の質はほぼ同等だった。以下は、5つのプロンプト(情報を生成するための指示や質問文)に対するGPT-4oとGPT-4 Turboの応答時間を比較した表だ。
プロンプト | GPT-4oの応答を出力するまでにかかる時間 | GPT-4 Turboの応答を出力するまでにかかる時間 |
---|---|---|
量子コンピューティング技術がIT業界をどのように変えるかをテーマに、500文字のエッセイを書いて | 23秒 | 33秒 |
米国ミシガン州トラバースシティーへの3日間の旅行スケジュールを考えて | 28秒 | 48秒 |
「hello world」と表示するようC言語でソースコードを書いて | 4秒 | 7秒 |
添付画像(ムクドリモドキ の写真)の代替テキストを作成して | 2秒 | 3秒 |
添付ドキュメント(22ページに及ぶ神経科学学術記事)を、5つのリスト形式に要約して | 16秒 | 19秒 |
OpenAIが実施したベンチマークテストでは、GPT-4oは単純な数学問題、言語理解、視覚認識といった項目で、GPT-4 Turboを上回る評価を出している。加えて、GPT-4oはGPT-4 Turboより優れた文脈理解力を持ち、イディオム(慣用句)や比喩表現、特定の文化圏で使用される用語について、より優れた理解力を示すという。
GPT-4oを実際に使った人の意見はさまざまだ。2024年6月時点で、GPT-4oはLLM比較評価サイト「Chatbot Arena」で総合的な最高評価を受けている。しかし一部のユーザーは、この結果を「過大評価」と見なしており、「コーディングや分類、推論といったタスクではGPT-4 Turboの方が優れている」と報告している。
上記で紹介した情報はあくまで参考だ。どちらのモデルが最適か見極めるためには、実際に時間をかけて試すことが重要だ。中には、タスクに応じてGPT-4oとGPT-4 Turboを切り替えながら使用している開発者もいる。
GPT-4oは、処理の効率化とコスト抑制を実現している。コストはそれぞれ以下の通り。
この通り、GPT-4-TurboのコストはGPT-4oの倍だ。
※注:トークンとはテキストデータを処理する際の基本的な単位で、英語であれば1トークンは4文字程度と考えられる。
無償版ChatGPTのユーザーにも大きなメリットがある。GPT-4oは「GPT-3.5」に代わって無償版ChatGPTの標準モデルとなる。GPT-4oの登場と併せて、従来は有料版のユーザーのみが利用できた「GPTs」(GPT Builder)を無料版ユーザーも一部利用できるようになった。GPTsは、ユーザーがGPTをカスタマイズし、特定のビジネスニーズに特化したGPTを作成できるサービスだ。
GPT-4 Turboは引き続き、
といった有料版のユーザーのみが利用できる。
無料版ユーザーと有料版ユーザーでは、モデルの利用制限が異なる点に注意が必要だ。違いは以下の通り。
GPT-4oはGPT-4 Turboと比較して、非英語圏の言語をより的確に扱えるように設計されている。特に、ヒンディー語、中国語、韓国語など、アルファベット以外の言語に対するトークン化のプロセスが改善されたという。AIモデルはトークンごとにデータを処理し、データの予測や生成を実施する。GPT-4oで使用されるトークナイザーは、アルファベット以外の文字で構成されたテキストをより効率よく圧縮でき、より安価かつ迅速にプロンプトを処理できる。
自然言語処理(NLP)の歴史において、AIモデルは西洋言語に最適化され、他地域の言語は軽視される傾向にあった。GPT-4oは、より多くの言語をより正確かつ自然に処理できるため、グローバル市場に適しており、非英語圏の人々にも道を開くことになる。
とはいえ課題もある。GPT-4oの発表から数日後、OpenAIは中国語のトークンにポルノやギャンブルに関する不適切なフレーズが含まれていることを発見した。学習データのクリーニングが不十分であったために、問題のあるトークンが含まれてしまった可能性があるという。AIモデルが不適切なデータを学習してしまうと、セキュリティリスクの増加や回答精度の低下、事実と異なる情報を生成する現象を指す「ハルシネーション」(幻覚) を引き起こしてしまう可能性がある。
次回は、GPT-4oに対して企業がどのような関心を示しているのかを解説する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
GoogleやMicrosoftが警鐘 中国発ネット工作の危険性(無料eBook)
GoogleやMicrosoftの報告が示すのは、中国発のAIを活用したネット工作が世界的な問題とな...
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年1月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
Netflix、さらなる成長戦略は「アドテク自社開発」 広告主のメリットは?
Netflixは2024年第4四半期に1890万人の加入者を増加させ、広告収入を前年同期比で倍増さ...