「GPT-3.5」と「GPT-4」は結局、何が決定的に違うのか?OpenAIのLLMを比較【前編】

OpenAIは大規模言語モデル(LLM)「GPT」の改良を進めている。「GPT-3.5」とその改良版「GPT-4」は何が違うのか。それぞれの特徴と違いをまとめた。

2024年05月09日 08時30分 公開
[Will KellyTechTarget]

関連キーワード

人工知能


 テキストや画像などを自動生成するAI(人工知能)技術「生成AI」(ジェネレーティブAI)をビジネスに活用する動きが広がっている。生成AIを活用するに当たってまず重要なのが、適切なモデルの選択だ。

 AIベンダーOpenAIは、大規模言語モデル(LLM)「GPT」(Generative Pre-trained Transformer)の改良に取り組んでおり、「GPT-3.5」や「GPT-4」など複数のモデルを発表している。それぞれ何が違い、どのような特徴があるのか。

GPT-3.5、GPT-4の違い

 OpenAIは2022年11月にGPT-3.5を、2023年3月にはGPT-4を発表している。それぞれの特徴と、違いをまとめた。

GPT-3.5

 GPT-3.5は自然言語を理解し、回答を生成する。自然言語処理に関する幅広いタスクをこなすことができる。主要な用途は以下の通り。

  • 文章要約
  • メール本文の作成
  • 翻訳
  • ソースコード生成
  • チャットbot/仮想アシスタント

 開発者は改良版のモデルである「GPT-3.5 Turbo」を使い、独自にモデルをトレーニングする「ファインチューニング」を実施することで、特定の用途向けに最適化することができる。パラメーター(モデルのトレーニングに使う変数)の変更をせずに、少数の例文を提示するだけでタスクを解決できる「フューショット学習」(Few-shot Learning)機能も提供する。

 OpenAIはAIチャットbot「ChatGPT」のLLMを利用するためのAPI(アプリケーションプログラミングインタフェース)「Chat Completions API」を公開している。外部のアプリケーションやサービスから、GPT 3.5 Turboの以下のモデルにアクセスできる。

  • gpt-3.5-turbo-0125
    • 対話能力に特化したモデル。1万6385トークン(トークンはテキストデータを処理する際の単位)のコンテキストウィンドウ(生成AIがやりとりの中で保持する情報量)を備える。
  • gpt-3.5-turbo-instruct
    • 一問一答のような単純なタスク処理に特化したモデル。4096トークンのコンテキストウィンドウを備える。

GPT-4

 GPT-4は、OpenAIの企業向けプラン「ChatGPT Team」「ChatGPT Enterprise」が採用しているモデルだ。基本的な機能はGPT-3.5と同じだが、回答の信頼性やクリエイティブ性に優れており、プロンプト(生成AIに対して出す質問や指示)の微細な意図をくみ取ることが可能だという。

 その他の大きな違いは以下の通りだ。

  1. マルチモーダルAI機能
    • GPT-4は、数値や画像、テキスト、音声など複数種類のデータを組み合わせて、あるいは関連付けて処理できるモデルだ。入力した画像のキャプション生成や分析などができる。
  2. コンテキストウィンドウサイズ
    • コンテキストウィンドウのサイズについて、GPT-4は8192トークンと、一部開発者向けに3万2768トークンの2種類を提供する。後者は約2万5000語を扱うことができ、長文コンテンツ生成などに活用できる。
  3. ナレッジベース
    • トレーニングに使用する学習データの範囲が、2023年4月時点までに拡張された。
  4. 安全性と整合性
    • OpenAIはGPT-4の安全性向上に取り組み、改良を加えている。2023年3月にOpenAIが発表した内部評価によると、GPT-4は未許可コンテンツに対するリクエストへの応答率がGPT-3.5と比較して82%低下し、事実に基づいた応答の生成率が40%高くなっている。

 開発者は、Chat Completions APIからGPT-4を利用できる。OpenAI によると、2023年7月時点でAPI経由のGPT利用のうち97%をGPT-4が占める。


 後編は、GPTの各モデルを精度とコストの面から比較する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

ITmedia マーケティング新着記事

news065.jpg

アップルのiPad Pro炎上CMにサムスンが一撃 「クリエイティビティーはCrushできない」
Appleらしからぬマーケティングの失敗から数日後、Samsungは「Galaxy Tab S9」を訴求する...

news063.jpg

電話・スマホでのコミュニケーションは「通話」? 「テキスト」?
クロス・マーケティングが全国の20〜69歳男女を対象にした調査によると、電話やスマホで...

news061.png

商品のパッケージが変わると購入意欲につながる?
商品のパッケージデザインの一新が新規購入とその後のリピート購入にどの程度つながって...