Appleが「推論モデル」の限界を指摘する論文を発表し、AI業界に一石を投じた。肯定的な見方と否定的な見方が飛び交う中、論文が示す本当の意図を読み解く。
AI(人工知能)市場では、与えられた情報に対して途中の考え方や手順を段階的に生成し、未知の問題を解決したり結論を導き出したりすることを目指したAIモデル「推論モデル」への投資が盛んになっている。そうした中、Appleは2025年6月に推論モデルの精度に疑問を呈する論文を発表した。この論文が賛否両論を呼んでいる。同社の警鐘の意図と、その受け止め方を探る。
Appleが公開した論文は「The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity」だ。この中で同社は、2024年後半から2025年初頭にかけて公開された大半の推論モデルはベンチマークで性能向上を示しているものの、見過ごされている課題があると主張する。
論文によると、これらの推論モデルは、単純な問題に対しては思考プロセスの初期段階で正解を導き出せるものの、その後も不要な思考を続けてしまうことがある。思考しているように見える動作は単なるパターンマッチングにすぎず、「あたかも思考しているかのような錯覚」を生み出しているとの見解も示す。
Appleがこの論文を公開したのは、開発者向けイベント「WWDC25」の開催中だった。WWDC25においてAppleは、AIアプリケーションに関する新しい開発ツール群「Foundation Models」(Foundation Modelフレームワーク)を発表した。これはサードパーティーの開発者が、Apple製AIモデルを自社のアプリケーションに組み込むことを可能にするAPI(アプリケーションプログラミングインタフェース)として提供される。こうした動きにもかかわらず、AppleのAIモデルはOpenAIやMeta PlatformsといったAI技術開発の先進ベンダーの後手に回っているという意見が一定数存在する。
このような背景から、今回Appleが発表した論文は、AIモデルの開発が遅れていることを隠したい同社が、自社に都合の良い主張をしたと見る向きもある。調査会社The Futurum Groupのチーフアドバイザーであるデービッド・ニコルソン氏は、Appleが論文を発表した動機は自社の利益のためでしかないと考えている。「他社を批判する前に、自社の音声アシスタント『Siri』をより賢くするための研究に集中すべきではないか」と厳しい姿勢だ。その一方で同氏は、「Appleが提起した議論には一考の価値がある」とも付け加える。
AI市場は拡大を続けている。Meta Platforms、Amazon.com、Alphabet(Googleの親会社)、Microsoftといった大手ベンダーは、2025年もAI技術に積極的に投資するとみられる。
これほど注目されているにもかかわらず、AI技術は投資対効果(ROI)が見えにくいのも事実だ。ニコルソン氏は、ベンダーのAI技術に対する投資を後押ししているのは「魔法のような技術に対する過熱気味の期待感」だと話す。同氏はLLM(大規模言語モデル)の文章生成を例に挙げ、「LLMは統計に基づいて単語を並べているだけなのに、エンドユーザーは人間と対話しているかのように感じる」と説明する。同氏によれば、Appleの論文は「競合他社の加熱するAI技術への投資に水を差す」ものだ。同社がAI技術開発に後れを取っていることをごまかし、その間にAI技術を開発して追い付くための「時間稼ぎ」をしている側面があるという。
イリノイ大学シカゴ校(University of Illinois Chicago)でデータサイエンスおよびAI戦略担当の準副学長を務めるマイケル・G・ベネット氏は、Appleの研究がある程度の反発を招いたのは当然だと考える。同社の研究が、推論モデルに関する一般的な見解に疑問を投げ掛けるものだったためだ。
AIベンダーは、Appleの研究論文を軽視すべきではないとベネット氏は主張する。「私はこの論文を全面的、あるいは無批判に受け入れるわけではないが、業界の主要企業がこのような論文を発表した際には、その主張に耳を傾けることに価値があると感じる」と同氏は語る。
ベネット氏は、Appleの警告を無視すれば、AI業界は深刻な結果を招きかねないと付け加える。AI技術、特に推論モデルには「人間の能力では解決できない問題を解決してくれる」という期待が寄せられている。同社が指摘した推論モデルの弱点をベンダーが無視し続ければ、投資の浪費だけではなくAIモデルの誤判断といった実社会への危害が発生し得るからだ。
「推論モデルに対してそのような期待を抱くことは問題ないが、仮に推論モデルがある程度複雑なタスクさえこなせないのであれば、ベンダーはその限界を早い段階で理解しておくべきだ」(ベネット氏)
Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。
なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...