「OpenAI o1」の実力は？　苦手だった“あの問題”をついに克服？：さらなる進化を遂げたOpenAIのLLM【前編】

2024年7月、OpenAIは“Strawberry”というコードネームの新モデルを発表し、同年9月にその新モデルを「OpenAI o1」として提供開始した。その実力とは。

≫ 2024年11月06日 07時30分公開

[Sean Michael Kerner，TechTarget]

印刷／PDF

メール通知

連載「TechTarget発　先取りITトレンド」の新着をメールで通知

「OpenAI o1」の実力は？　“あの問題”は大幅に改善

会員登録（無料）が必要です

併せて読みたいお薦め記事

　OpenAIの他のLLMと同様、OpenAI o1は深層学習モデル「Transformer」（トランスフォーマー）をベースにしており、文章要約やコンテンツ生成、質問への回答、ソースコードの記述といったタスクをこなすことができる。

　OpenAI o1の大きな特徴は、強化された推論能力だ。時間をかけて問題解決の最適なアプローチを考えることができ、複雑なクエリや、複数段階の推論が必要な問題にも対処できる。OpenAIは推論能力を強化するに当たり、Chain-of-Thought（CoT：思考の連鎖）プロンプティングを採用した。これは、まずLLMに問題の解き方を考えるよう指示して、そのステップを一つずつ説明させる手法だ。段階的に問題を解くことで、LLMは精度の高い回答を出力できる。

　2024年10月時点で、OpenAI o1にはプレビュー版の「OpenAI o1-preview」と、軽量版モデル「OpenAI o1-mini」がある。OpenAI o1-previewは複雑な問題を解くのが得意で、OpenAI o1-miniは小型モデルのためコストパフォーマンスに優れる特徴を持つ。

OpenAI o1のユースケースとは？

　OpenAI o1に適するユースケースとして以下のようなものがある。

複雑な問題の推論
- OpenAI o1は、特にSTEM（科学、技術、工学、数学）分野の複雑なタスクをこなせるように最適化されている。
科学研究
- OpenAI o1は細胞の塩基配列データにラベル付けをしたり、量子光学分野の複雑な数式を扱ったりする上で役に立つ。
コーディング
- OpenAIによると、OpenAI o1はプログラムの生成やバグの修正が得意で、「HumanEval」「Codeforces」などのベンチマークテストで優れた成績を収めている。複数のプロセスが必要な作業についても、高精度で支援が可能だ。
数学
- OpenAI o1は数学分野で優れた力を発揮しており、国際数学オリンピックの予選で83％の正答率を達成している。一方、GPT-4oの正答率は13％だった。
- 「American Invitational Mathematics Examination 」（AIME）など、他の数学コンテストでもその能力は実証されており、物理学の分野で使われる複雑な数式を生成する助けになる可能性もある。
セルフファクトチェック
- OpenAI o1は生成した回答が正しいかどうかを確認するセルフファクトチェックという仕組みを回答精度の向上に役立てている。
アイデアの創出
- 創造的なアイデアや解決策を生み出す上でも価値を発揮する。

　次回は、OpenAI o1の利用方法や機能面、安全性について細かく見ていく。

TechTarget発先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

TechTargetジャパントップエンタープライズAI