OpenAIが2025年2月に発表した「GPT-4.5」は、自然な会話と感情理解に特化した最新モデルだ。「GPT-4o」などの従来モデルと比べて何が優れるのか。OpenAIはどのような取り組みで性能を向上させたのか。
2022年11月、AI(人工知能)ベンダーOpenAIは「ChatGPT」を公開し、画像やテキストを自動生成するAI技術「生成AI」ブームの火付け役になった。ChatGPTの中核を成すのが、OpenAIの大規模言語モデル(LLM)「GPT」ファミリーだ。
2025年2月27日(現地時間)、OpenAIはGPTファミリーの最新版として「GPT-4.5」のリサーチプレビュー(検証段階のプレビュー)版を発表した。同社のCEOサム・アルトマン氏は、「GPT-4.5は思慮深い人と会話しているように感じる初めてのモデルだ」と短文投稿サイト「X」(旧「Twitter」)にメッセージを投稿し、GPT-4.5の会話能力と感情知能の強化を強調した。GPT-4.5はこれまでのモデルとはどう違うのか。GPT-4.5の能力や特徴を見ていこう。
OpenAIは「o1」「o3」といったモデルでは推論に重点を置いていたが、GPT-4.5では方向性を変え、汎用(はんよう)LLMとして人のように自然で滑らかな対話を実現することを目指している。
OpenAIがGPT-4.5のリサーチプレビューを公開した時点では、OpenAIのLLM群の中では最も高性能なGPTファミリーのLLMであり、「GPT-4o」「GPT-4」などの以前のLLMの性能を上回っている。
GPTは「Generative Pre-trained Transformer」の頭字語だ。「Transformer」は現代の生成AIを支える主要技術で、入力された情報を理解し、新しい情報を生成するニューラルネットワーク(人の脳を模した数理モデル)の一種だ。GPT-4.5も従来モデルと同様、Transformerをベースにしている。
OpenAIは、GPT-4oなどのこれまでのGPTファミリーにおいて、数値や画像、テキスト、音声など複数の形式(モダリティー)の情報を理解、生成できる「マルチモーダル」機能を重視していた。これに対してGPT-4.5では、微妙なニュアンスの理解や自然な対話能力の向上、ハルシネーション(事実とは異なる情報の生成)の抑制に重点を置いている。
GPT-4.5は、途中の考え方や手順を段階的に生成する「思考の連鎖」による推論ではなく、データの中からAIモデル自身が正解を見つける「教師なし学習」の進化を重視したものだ。o1やo3のような、思考の連鎖を用いて複雑な問題の答えを導き出す推論モデルとは異なり、GPT-4.5は学習データとパターン認識能力に基づいて応答する。こうした特性を備えるため、複雑な数学、科学や論理的な問題に特化した推論モデルと比べて、より多様な用途に利用できる。
OpenAIはGPT-4.5の発表時、パラメータ数などの正確なモデルの規模を明らかにしておらず、「これまでで最も大規模かつ高性能」なモデルだと説明する。同社によると、GPT-4.5は公開データ、提携先から入手したデータ、社内で開発したカスタムデータなど、多様なデータセットを用いて学習されたモデルだ。
GPT-4.5は、競合他社の動きが活発化する中で登場した。2025年2月24日(現地時間)、OpenAIの元メンバーが設立したAnthropicがフラグシップモデル「Claude 3.7」を発表した。その少し前の2025年2月19日(現地時間)には、xAIが「Grok 3」のβ版を発表した。
GPT-4.5の開発と学習において、OpenAIはGPT-4oの技術基盤を踏襲しつつ、さまざまな技術的改良を加えている。同社が採用した技法は以下の通りだ。
OpenAIは、GPT-4.5が従来モデルから進化した以下の能力を有すると説明する。
OpenAIはGPT-4.5をリサーチプレビュー版で公開した。今後利用できる範囲が拡大する見込みだ。2025年4月時点では、以下の方法でリサーチプレビュー段階のGPT-4.5を利用可能だ。
GPT-4.5は、GPT-4およびGPT-4oが確立した技術基盤の上に成り立っている。OpenAIは精度、感情理解力、会話の自然さ、エンドユーザーの意図との整合性といった面で、従来モデル大幅に強化している。
GPT-4o | GPT-4.5 | |
---|---|---|
公開日 | 2024年5月13日 | 2025年2月27日 |
主な重点 | マルチモーダル機能 | 教師なし学習の拡大 |
扱えるデータ形式 | テキスト、画像、音声 | テキストと画像 |
コンテキストウィンドウ | 12万8000トークン | 12万8000トークン |
知識のカットオフ | 2023年10月 | 2024年10月 |
MMLU(注1) | 81.5% | 85.1% |
GPQA(注2) | 53.6% | 71.4% |
SimpleQA(注3)の精度 | 38.2% | 62.5% |
SimpleQAのハルシネーション率 | 61.8% | 37.1% |
API利用料金 | 入力100万トークン当たり2.5ドル 出力100万トークン当たり10ドル |
入力100万トークン当たり75ドル 出力1Mトークン当たり150ドル |
※注1:57個の分野における質問への正答率を測るベンチマーク。
※注2:大学院レベルの専門的な科学分野における質問への正答率を測るベンチマーク。
※注3:単純な質問に対して正確な回答を生成できた割合を測るベンチマーク。
米国Informa TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
AIをビジネスで生かし、大きな成果を得るには、「AI対応データ」が必要だ。しかし、AI対応データを手に入れるためには、地道なデータ準備が不可欠となる。本資料では、AI対応データを準備するための6つのステップを紹介する。
カスタマーエクスペリエンス(CX)向上を目的としたAI活用が広がっているが、自社の対応の遅れを危惧している企業も少なくない。そこで、1000人のCXリーダーを対象とした調査の結果から、AIの導入を成功に導くためのヒントを紹介する。
生成AIがビジネスの現場に浸透し、業務の効率化や意思決定の迅速化に貢献している。一方で、期待していたような成果を得られていないという声も聞かれる。その理由とともに、生成AIの価値を最大化するデータ基盤の在り方について解説する。
AI導入の成否は、その土台となるインフラに左右されると言っても過言ではない。企業がAIモデルの性能を最大限に引き出すために、インフラ構築時に検討すべきポイントを体系的に解説する。
文書作成の効率化、マーケティング支援、顧客対応補助など、業務に生成AIの活用を考えている企業は多い。本資料では、生成AIの基本的な仕組みから、ビジネス現場での活用例までを紹介。失敗しない生成AI導入に役立てることができる。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...