2024年5月、OpenAIはLLM「GPT-4o」を発表した。同LLMをさらに“人間に近づけた”機能とは。具体的な特徴や、活用方法をまとめて解説する。
AI(人工知能)ベンダーOpenAIが2022年11月に発表したAIチャットbot「ChatGPT」は、提供からわずか2カ月で1億人のユーザーを獲得した。ChatGPTに使われている大規模言語モデル(LLM)「GPT-3」「GPT-4」の精度の高さや、応用範囲の広さ、利用の容易さから、同社のサービスは世界の強い関心を集めた。
2024年5月、OpenAIは同社主催のイベント「Spring Updates」で、LLM「GPT-4 Omni」(GPT-4o)を発表した。前身モデルからの特徴的な進化や、具体的な機能をまとめて解説する。
GPTは「Generative Pre-Trained Transformer」の略だ。深層学習モデル「Transformer」をベースに、文章や情報を理解して新しい回答を生成できる仕組みを提供する。GPT-4oは、OpenAIが2023年11月に発表した「GPT-4 Turbo」に続き、GPT-4に対する2回目のアップデートとなる。
GPT-4oは、OpenAIのLLMポートフォリオの最上位モデルであり、回答精度など性能面でGPT-4 Turboを上回るとされる。その用途は、文章要約から質問への回答、論理的推論、数学問題の解答、コーディングなど幅広い。
GPT-4oの大きな特徴が、音声入力と音声応答機能を実装したことだ。OpenAIによると、平均応答時間は320ミリ秒。人間との会話に近いスピードを実現しており、ユーザーは違和感なくGPT-4oと音声対話できる。AIモデルが生成した音声とも対話が可能だ。
その他、GPT-4oの特徴として以下がある。
次の表は、GPT-4、GPT-4 Turbo、GPT-4oの違いを簡単にまとめたものだ。
モデル | GPT-4 | GPT-4 Turbo | GPT-4o |
---|---|---|---|
発表時期 | 2023年3月 | 2023年11月 | 2024年5月 |
コンテキストウィンドウ | 8192トークン | 12万8000トークン | 12万8000トークン |
ナレッジカットオフ(注1) | 2021年9月 | 2023年4月 | 2023年10月 |
コスト/100万トークン | 入力30ドル、出力60ドル | 入力10ドル、出力30ドル | 入力5ドル、出力15ドル |
※注1:ChatGPTが最後にトレーニングデータを受け取った時点のこと
GPT-4oは以下のような機能を持つ。
後編は、GPT-4oを使う方法について解説する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
ハロウィーンの口コミ数はエイプリルフールやバレンタインを超える マーケ視点で押さえておくべきことは?
ホットリンクは、SNSの投稿データから、ハロウィーンに関する口コミを調査した。
なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...
業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...