「GPT-4.5」は感情を理解する? 従来モデルとの違いと実力「思慮深い人」のように対話

OpenAIが2025年2月に発表した「GPT-4.5」は、自然な会話と感情理解に特化した最新モデルだ。「GPT-4o」などの従来モデルと比べて何が優れるのか。OpenAIはどのような取り組みで性能を向上させたのか。

2025年05月02日 07時00分 公開
[Sean Michael KernerTechTarget]

 2022年11月、AI(人工知能)ベンダーOpenAIは「ChatGPT」を公開し、画像やテキストを自動生成するAI技術「生成AI」ブームの火付け役になった。ChatGPTの中核を成すのが、OpenAIの大規模言語モデル(LLM)「GPT」ファミリーだ。

 2025年2月27日(現地時間)、OpenAIはGPTファミリーの最新版として「GPT-4.5」のリサーチプレビュー(検証段階のプレビュー)版を発表した。同社のCEOサム・アルトマン氏は、「GPT-4.5は思慮深い人と会話しているように感じる初めてのモデルだ」と短文投稿サイト「X」(旧「Twitter」)にメッセージを投稿し、GPT-4.5の会話能力と感情知能の強化を強調した。GPT-4.5はこれまでのモデルとはどう違うのか。GPT-4.5の能力や特徴を見ていこう。

GPT-4.5はこれまでのモデルと何が違う?

 OpenAIは「o1」「o3」といったモデルでは推論に重点を置いていたが、GPT-4.5では方向性を変え、汎用(はんよう)LLMとして人のように自然で滑らかな対話を実現することを目指している。

 OpenAIがGPT-4.5のリサーチプレビューを公開した時点では、OpenAIのLLM群の中では最も高性能なGPTファミリーのLLMであり、「GPT-4o」「GPT-4」などの以前のLLMの性能を上回っている。

 GPTは「Generative Pre-trained Transformer」の頭字語だ。「Transformer」は現代の生成AIを支える主要技術で、入力された情報を理解し、新しい情報を生成するニューラルネットワーク(人の脳を模した数理モデル)の一種だ。GPT-4.5も従来モデルと同様、Transformerをベースにしている。

 OpenAIは、GPT-4oなどのこれまでのGPTファミリーにおいて、数値や画像、テキスト、音声など複数の形式(モダリティー)の情報を理解、生成できる「マルチモーダル」機能を重視していた。これに対してGPT-4.5では、微妙なニュアンスの理解や自然な対話能力の向上、ハルシネーション(事実とは異なる情報の生成)の抑制に重点を置いている。

 GPT-4.5は、途中の考え方や手順を段階的に生成する「思考の連鎖」による推論ではなく、データの中からAIモデル自身が正解を見つける「教師なし学習」の進化を重視したものだ。o1やo3のような、思考の連鎖を用いて複雑な問題の答えを導き出す推論モデルとは異なり、GPT-4.5は学習データとパターン認識能力に基づいて応答する。こうした特性を備えるため、複雑な数学、科学や論理的な問題に特化した推論モデルと比べて、より多様な用途に利用できる。

 OpenAIはGPT-4.5の発表時、パラメータ数などの正確なモデルの規模を明らかにしておらず、「これまでで最も大規模かつ高性能」なモデルだと説明する。同社によると、GPT-4.5は公開データ、提携先から入手したデータ、社内で開発したカスタムデータなど、多様なデータセットを用いて学習されたモデルだ。

 GPT-4.5は、競合他社の動きが活発化する中で登場した。2025年2月24日(現地時間)、OpenAIの元メンバーが設立したAnthropicがフラグシップモデル「Claude 3.7」を発表した。その少し前の2025年2月19日(現地時間)には、xAIが「Grok 3」のβ版を発表した。

GPT-4.5の学習方法

 GPT-4.5の開発と学習において、OpenAIはGPT-4oの技術基盤を踏襲しつつ、さまざまな技術的改良を加えている。同社が採用した技法は以下の通りだ。

  • 教師ありファインチューニング
    • OpenAIはGPT-4.5を、人の期待に応え、効果的に指示に従う能力を持つようチューニングした。チューニングの過程で、有害なコンテンツの影響を抑えるための高度なデータフィルタリングを導入した。
  • 人のフィードバックを活用した強化学習
    • 人の評価者が、モデルの出力を品質、有用性、安全性の観点からランク付けして、そのフィードバックを基にモデルを洗練させた。
  • 命令階層学習
    • エンドユーザーの命令とシステムの命令が競合する場合、システムの命令を優先するように学習された。
    • 攻撃者が悪意のあるプロンプト(生成AIへの指示)を入力してユーザーをだましたり、データを盗んだりする「プロンプトインジェクション」攻撃を防ぐことを目的としている。

GPT-4.5でできること

 OpenAIは、GPT-4.5が従来モデルから進化した以下の能力を有すると説明する。

  • 自然な会話能力
    • GPTファミリーの特徴は自然言語処理だ。GPT-4.5は会話中のニュアンスの理解力が向上し、より自然な会話になるよう調整されている。
  • 感情理解力
    • GPT-4.5は優れた感情分析能力を有しており、エンドユーザーの問いかけに感情が込もっている場合、助言すべきか、単に耳を傾けるべきかを判断できる。
  • 多様なコンテンツの生成
    • GPT-4.5は物語や詩といったクリエイティブな文章をはじめ、さまざまな形式のテキストコンテンツを生成する能力に秀でる。
  • コンテンツの要約
    • GPT-4.5は長文や大量の情報を、従来モデルよりも詳細な情報を残しつつ、明確かつ簡潔に要約できる。
  • 知識に基づく質疑応答
    • GPT-4.5は幅広い知識を有し、従来モデルよりも的確に回答する。
  • アップロードファイルからの情報抽出
    • GPT-4.5はエンドユーザーがアップロードした画像などのファイルを参照し、そこに含まれる情報を利用してデータを分析する。
  • プログラミング支援
    • GPT-4.5はコーディングアシスタントとして機能するため、アプリケーションの開発に活用できる。

GPT-4.5を使う方法

 OpenAIはGPT-4.5をリサーチプレビュー版で公開した。今後利用できる範囲が拡大する見込みだ。2025年4月時点では、以下の方法でリサーチプレビュー段階のGPT-4.5を利用可能だ。

  • ChatGPT Pro
    • 月額200ドルの最上位プラン。
    • 制限付きで利用可能。
  • ChatGPT Plus
    • 月額20ドルの有料プラン。
    • 制限付きで利用可能。
  • API(アプリケーションプログラミングインタフェース)経由
    • OpenAIが提供するAPIを使って、アプリケーションにGPT-4.5を組み込むことが可能。
    • 入力コストは100万トークン当たり75ドル。
    • 出力コストは100万トークン当たり150ドル。
  • Microsoftの「Azure OpenAI Service」
    • Azure OpenAI Serviceは、OpenAIが開発したAIモデルを、Microsoftのクラウドサービス群「Microsoft Azure」のインフラで運用するサービス。
    • OpenAIの他のモデルと同様、Azure OpenAI ServiceでGPT-4.5を利用可能。

GPT-4oとGPT-4.5の違い

 GPT-4.5は、GPT-4およびGPT-4oが確立した技術基盤の上に成り立っている。OpenAIは精度、感情理解力、会話の自然さ、エンドユーザーの意図との整合性といった面で、従来モデル大幅に強化している。

表 GPT-4oとGPT-4.5の違い
GPT-4o GPT-4.5
公開日 2024年5月13日 2025年2月27日
主な重点 マルチモーダル機能 教師なし学習の拡大
扱えるデータ形式 テキスト、画像、音声 テキストと画像
コンテキストウィンドウ 12万8000トークン 12万8000トークン
知識のカットオフ 2023年10月 2024年10月
MMLU(注1) 81.5% 85.1%
GPQA(注2) 53.6% 71.4%
SimpleQA(注3)の精度 38.2% 62.5%
SimpleQAのハルシネーション率 61.8% 37.1%
API利用料金 入力100万トークン当たり2.5ドル
出力100万トークン当たり10ドル
入力100万トークン当たり75ドル
出力1Mトークン当たり150ドル

※注1:57個の分野における質問への正答率を測るベンチマーク。
※注2:大学院レベルの専門的な科学分野における質問への正答率を測るベンチマーク。
※注3:単純な質問に対して正確な回答を生成できた割合を測るベンチマーク。

TechTarget発 先取りITトレンド

米国Informa TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news025.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。

news014.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news046.png

「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。