「GPT-4」や「GPT-4o」とGPT-3の違いとは “OpenAI製LLMの進化”を解説GPT-4とは何か?

OpenAIの大規模言語モデル(LLM)「GPT-4」は、「GPT-3」などの同社製LLMとは何が違うのか。GPT-4の主な機能や利用方法を説明する。

2024年07月04日 14時30分 公開
[Ben LutkevichTechTarget]

関連キーワード

人工知能 | チャットbot | 機械学習


 「GPT-4」はAI(人工知能)ベンダーOpenAIが開発した大規模言語モデル(LLM)だ。テキストや画像の入力内容を基にテキストを生成する。OpenAIは米国のAI開発企業で、画像処理AIモデルの「Dall-E」やAIチャットbotサービスの「ChatGPT」、GPT-4の前バージョンのLLMである「GPT-3」などを開発している。過去のGPTモデルよりも複雑なタスクを処理できるのが、GPT-4の特徴だ。

GPT-4とは何を意味するのか?

 GPT-4は「Generative Pre-Trained Transformer 4」の略称だ。GPTは、人間のようなテキストで入力に応答するLLMで、以下の特徴がある。

  • 生成的(Generative)
    • 新たな情報を生成する。
  • 訓練済み(Pre-Trained)
    • 大量の学習データであらかじめ学習し、基礎的な知識や回答パターンを出力可能にしている。この事前訓練によって、モデルは微調整するだけで特定の用途に対して利用可能になる。
  • トランスフォーマー(Transformer)
    • GPTはトランスフォーマーという自然言語処理(NLP)に特化した深層学習モデルを使用している。このモデルは連続した単語や文章同士の関係を追跡することで、文脈を把握できるようにする。GPTはTransformerを利用することで、文章中の単語を追跡し、次に来る単語を予測する。

 GPTの処理能力は、そのモデルが持つパラメーター(機械学習の調整に利用するための数値)の数と共に向上する。新しいGPTモデルは、一般的に前のモデルよりも多くのパラメーターを持っている。「GPT-1」は1億1700万個、GPT-2は15億個、GPT-3は1750億個以上のパラメーターを持っている。GPT-4のパラメーターの正確な数は不明だが、1兆個以上のパラメーターを持つと推測されている。

GPT-4は何が新しいのか

 2023年秋にOpenAIはGPT-4の改良版である「GPT-4 Turbo」を発表した。従来のGPT-4の回答は2022年1月までの情報に基づいていたが、GPT-4 Turboでは2023年4月までの情報に基づいた答えを提供できるようになった。画像分析機能の「GPT-4 Turbo with Vision」も追加された。このバージョンではモデルのコンテキストウィンドウ(AIモデルが一度に処理できるテキストの範囲)が拡大した。ChatGPTと他システムの連携サービスである「ChatGPT API」の入出力トークン(GPTが処理するテキストの単位)ごとの料金はGPT-4と比較して抑えられているため、開発者はLLMの利用コストを削減できるようになった。

 2024年5月、OpenAIは新バージョンの「GPT-4 Omni」(GPT-4o)を発表した。これにより応答速度や、音声と画像、テキストを認識する能力がさらに向上した。GPT-4oは画面や音声、テキストを同時に処理できるため、ユーザーが画面や機能を切り替える必要がなくなった。GPT-4oは、一般消費者向けと開発者向けの各種サービスで利用可能だ。

GPT-4の学習の仕組み

 各GPTのモデルは、人間からのフィードバックを用いた強化学習を使って訓練されている。モデルは望ましい行動やルールを順守した時に報酬を得る仕組みだ。GPT-4は人類にとって有害な回答を出すことを防ぐための学習も実施している。しかし他の言語モデルと同様に、GPT-4は事実とは異なる情報を出力する幻覚(ハルシネーション)を起こしたり、バグのあるソースコードを生成したりすることがある。人種や性別による偏見の影響を受けた回答を出力する可能性もある。

 OpenAIはGPT-4の技術論文で、セキュリティに関する理由と、競争が激化する市場の状況から、システムの訓練に使われた学習データの内容を公開しないと述べている。しかし同社は、GPT-4がWebに公開されているデータと、第三者からライセンスを得たデータの双方で訓練されたことを認めている。

GPT-4とGPT-3の違い

 GPT-3は、テキスト処理専用に設計されているLLMだ。GPT-4はマルチモーダルなLLMで、テキストや画像、音声などの複数の種類のデータを一度に処理できる。

 GPT-4とGPT-3の主な違いは以下の通りだ。

  • 言語理解
    1. 他の同社のLLMよりも回答精度に優れる傾向にある。
  • プロンプトの処理能力
    1. GPT-4はGPT-3よりも長いプロンプト(モデルに与える指示)を処理可能だ。具体的には英語で最大2万5000語のテキストを分析、読解、生成できる。
  • プログラムの作成
    • GPT-4はソースコードを生成する能力がGPT-3よりも高く、より複雑なプログラムが作成できる。
  • ステアラビリティ(制御可能性)
    • GPT-4はGPT-3と比較して、ユーザーが制御しやすい。GPT-3は一様な話し方で応答するが、GPT-4ではユーザーの指示で応答の仕方を指定できる。これによりプロンプトの作成が容易になり、プロンプトエンジニアリング(モデルに対して適切な指示や質問を設計する技術)が改善しやすくなる。ユーザーはChatGPTの動作を定義するシステムメッセージを使用して、GPT-4の動作を用途に合わせてカスタマイズできる。
  • 有害な応答の抑制
    • GPT-4は有害な応答をする可能性を抑え、許可されていないユーザーの要求には応答しないようにトレーニングされている。例えば危険な化学物質の合成方法について回答することを拒否したり、タバコの購入に関する質問には喫煙を奨励しない形で答えたりするように訓練されている。
  • 数学の基本処理
    • GPT-4はGPT-3よりも基本的な数学の計算が正確にできる。

Copyright © ITmedia, Inc. All Rights Reserved.

譁ー逹€繝帙Ρ繧、繝医�繝シ繝代�

事例 SB C&S株式会社

SB C&S本気の生成AI導入、「全社利用率70%」を達成させた秘訣とは?

生成AIのビジネス活用には、既存サービスを利用する方法と、生成AIツールを自社開発する方法がある。その後者の好例として、自社ビジネスに適したAIチャットツールを、あるクラウドサービスを活用して開発したSB C&Sの事例を紹介する。

製品資料 FastLabel株式会社

生成AIの精度を左右する“追加学習データ”作成で陥りがちな課題と解決策

インストラクションチューニングは、生成AIの応答精度を向上させるために重要なステップだが、その学習データを作成する際は、設計面/実務面/運用面で課題が発生しやすい。本資料では、現場でよくある課題と解決策について解説する。

製品資料 FastLabel株式会社

「企業知」を高度活用、生成AI開発のデータ問題を解決するサービスとは

労働人口減少や技能継承問題などを背景に「企業知」の活用ニーズが高まる一方、既存AI技術の限界から十分な成果を得られずにいるケースは多い。リコー他6社による生成AI開発事例より、データの課題を解決するサービスについて紹介する。

製品資料 株式会社ハイレゾ

生成AI開発を加速する、GPUクラウドサービスという選択肢

生成AIの開発には、高性能なGPUが不可欠だ。しかし、GPUサーバをオンプレミスで運用するには、高額な初期費用や設置場所の確保などの課題がネックになる。そこで注目したいのが、サブスクリプション形式で利用できるGPUクラウドサービスだ。

事例 富士通株式会社

富士通が実践、AI時代に最適な設計プロセスを実現する方法

製造業の設計現場では、設計プロセスの複雑化などの課題が山積している。こうした中、注目を集めているのが生成AIの活用だ。本資料では、生成AIがもたらす設計業務の未来について、詳しく解説する。

アイティメディアからのお知らせ

From Informa TechTarget

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...