2024年5月、OpenAIはLLM「GPT-4o」を発表した。同LLMをさらに“人間に近づけた”機能とは。具体的な特徴や、活用方法をまとめて解説する。
AI(人工知能)ベンダーOpenAIが2022年11月に発表したAIチャットbot「ChatGPT」は、提供からわずか2カ月で1億人のユーザーを獲得した。ChatGPTに使われている大規模言語モデル(LLM)「GPT-3」「GPT-4」の精度の高さや、応用範囲の広さ、利用の容易さから、同社のサービスは世界の強い関心を集めた。
2024年5月、OpenAIは同社主催のイベント「Spring Updates」で、LLM「GPT-4 Omni」(GPT-4o)を発表した。前身モデルからの特徴的な進化や、具体的な機能をまとめて解説する。
GPTは「Generative Pre-Trained Transformer」の略だ。深層学習モデル「Transformer」をベースに、文章や情報を理解して新しい回答を生成できる仕組みを提供する。GPT-4oは、OpenAIが2023年11月に発表した「GPT-4 Turbo」に続き、GPT-4に対する2回目のアップデートとなる。
GPT-4oは、OpenAIのLLMポートフォリオの最上位モデルであり、回答精度など性能面でGPT-4 Turboを上回るとされる。その用途は、文章要約から質問への回答、論理的推論、数学問題の解答、コーディングなど幅広い。
GPT-4oの大きな特徴が、音声入力と音声応答機能を実装したことだ。OpenAIによると、平均応答時間は320ミリ秒。人間との会話に近いスピードを実現しており、ユーザーは違和感なくGPT-4oと音声対話できる。AIモデルが生成した音声とも対話が可能だ。
その他、GPT-4oの特徴として以下がある。
次の表は、GPT-4、GPT-4 Turbo、GPT-4oの違いを簡単にまとめたものだ。
モデル | GPT-4 | GPT-4 Turbo | GPT-4o |
---|---|---|---|
発表時期 | 2023年3月 | 2023年11月 | 2024年5月 |
コンテキストウィンドウ | 8192トークン | 12万8000トークン | 12万8000トークン |
ナレッジカットオフ(注1) | 2021年9月 | 2023年4月 | 2023年10月 |
コスト/100万トークン | 入力30ドル、出力60ドル | 入力10ドル、出力30ドル | 入力5ドル、出力15ドル |
※注1:ChatGPTが最後にトレーニングデータを受け取った時点のこと
GPT-4oは以下のような機能を持つ。
後編は、GPT-4oを使う方法について解説する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
マーケターを成功に導くデータとAI Brazeは「ハイパーパーソナライゼーション」をどう実現するのか?
Brazeは、2024年9月24日に開催された「Forge 2024」において、大幅な製品アップデートを...
「多くの人はマツダを知らない」 残念な現実で栄光を取り戻すための戦略は?
業績好調のマツダが1990年代にロードスターブームを巻き起こした初代「MX-5 Miata」をフ...
フリーランスの生成AI利用 今後活用を検討している業務カテゴリー1位は?――ランサーズ調査
ランサーズは、「生成AI業務活用実態」調査を実施し、結果を公表した。今後期待される活...