OpenAIが2025年2月に発表した「GPT-4.5」は、自然な会話と感情理解に特化した最新モデルだ。「GPT-4o」などの従来モデルと比べて何が優れるのか。OpenAIはどのような取り組みで性能を向上させたのか。
2022年11月、AI(人工知能)ベンダーOpenAIは「ChatGPT」を公開し、画像やテキストを自動生成するAI技術「生成AI」ブームの火付け役になった。ChatGPTの中核を成すのが、OpenAIの大規模言語モデル(LLM)「GPT」ファミリーだ。
2025年2月27日(現地時間)、OpenAIはGPTファミリーの最新版として「GPT-4.5」のリサーチプレビュー(検証段階のプレビュー)版を発表した。同社のCEOサム・アルトマン氏は、「GPT-4.5は思慮深い人と会話しているように感じる初めてのモデルだ」と短文投稿サイト「X」(旧「Twitter」)にメッセージを投稿し、GPT-4.5の会話能力と感情知能の強化を強調した。GPT-4.5はこれまでのモデルとはどう違うのか。GPT-4.5の能力や特徴を見ていこう。
OpenAIは「o1」「o3」といったモデルでは推論に重点を置いていたが、GPT-4.5では方向性を変え、汎用(はんよう)LLMとして人のように自然で滑らかな対話を実現することを目指している。
OpenAIがGPT-4.5のリサーチプレビューを公開した時点では、OpenAIのLLM群の中では最も高性能なGPTファミリーのLLMであり、「GPT-4o」「GPT-4」などの以前のLLMの性能を上回っている。
GPTは「Generative Pre-trained Transformer」の頭字語だ。「Transformer」は現代の生成AIを支える主要技術で、入力された情報を理解し、新しい情報を生成するニューラルネットワーク(人の脳を模した数理モデル)の一種だ。GPT-4.5も従来モデルと同様、Transformerをベースにしている。
OpenAIは、GPT-4oなどのこれまでのGPTファミリーにおいて、数値や画像、テキスト、音声など複数の形式(モダリティー)の情報を理解、生成できる「マルチモーダル」機能を重視していた。これに対してGPT-4.5では、微妙なニュアンスの理解や自然な対話能力の向上、ハルシネーション(事実とは異なる情報の生成)の抑制に重点を置いている。
GPT-4.5は、途中の考え方や手順を段階的に生成する「思考の連鎖」による推論ではなく、データの中からAIモデル自身が正解を見つける「教師なし学習」の進化を重視したものだ。o1やo3のような、思考の連鎖を用いて複雑な問題の答えを導き出す推論モデルとは異なり、GPT-4.5は学習データとパターン認識能力に基づいて応答する。こうした特性を備えるため、複雑な数学、科学や論理的な問題に特化した推論モデルと比べて、より多様な用途に利用できる。
OpenAIはGPT-4.5の発表時、パラメータ数などの正確なモデルの規模を明らかにしておらず、「これまでで最も大規模かつ高性能」なモデルだと説明する。同社によると、GPT-4.5は公開データ、提携先から入手したデータ、社内で開発したカスタムデータなど、多様なデータセットを用いて学習されたモデルだ。
GPT-4.5は、競合他社の動きが活発化する中で登場した。2025年2月24日(現地時間)、OpenAIの元メンバーが設立したAnthropicがフラグシップモデル「Claude 3.7」を発表した。その少し前の2025年2月19日(現地時間)には、xAIが「Grok 3」のβ版を発表した。
GPT-4.5の開発と学習において、OpenAIはGPT-4oの技術基盤を踏襲しつつ、さまざまな技術的改良を加えている。同社が採用した技法は以下の通りだ。
OpenAIは、GPT-4.5が従来モデルから進化した以下の能力を有すると説明する。
OpenAIはGPT-4.5をリサーチプレビュー版で公開した。今後利用できる範囲が拡大する見込みだ。2025年4月時点では、以下の方法でリサーチプレビュー段階のGPT-4.5を利用可能だ。
GPT-4.5は、GPT-4およびGPT-4oが確立した技術基盤の上に成り立っている。OpenAIは精度、感情理解力、会話の自然さ、エンドユーザーの意図との整合性といった面で、従来モデル大幅に強化している。
GPT-4o | GPT-4.5 | |
---|---|---|
公開日 | 2024年5月13日 | 2025年2月27日 |
主な重点 | マルチモーダル機能 | 教師なし学習の拡大 |
扱えるデータ形式 | テキスト、画像、音声 | テキストと画像 |
コンテキストウィンドウ | 12万8000トークン | 12万8000トークン |
知識のカットオフ | 2023年10月 | 2024年10月 |
MMLU(注1) | 81.5% | 85.1% |
GPQA(注2) | 53.6% | 71.4% |
SimpleQA(注3)の精度 | 38.2% | 62.5% |
SimpleQAのハルシネーション率 | 61.8% | 37.1% |
API利用料金 | 入力100万トークン当たり2.5ドル 出力100万トークン当たり10ドル |
入力100万トークン当たり75ドル 出力1Mトークン当たり150ドル |
※注1:57個の分野における質問への正答率を測るベンチマーク。
※注2:大学院レベルの専門的な科学分野における質問への正答率を測るベンチマーク。
※注3:単純な質問に対して正確な回答を生成できた割合を測るベンチマーク。
米国Informa TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。