Anthropicが「Mythos級」のAIモデル「Claude Fable 5」を公開した。Stripeが「2カ月の工数を1日で終えた」と語るほどのコーディング力と推論力を備える一方、高度すぎる能力故の強固な安全策や30日間のデータ保持義務という新たな制約も伴う。
Anthropicは2026年6月10日、一般利用向けに安全性を確保したMythos級のAIモデル、「Claude Fable 5」(以下、Fable 5)をリリースした。
Fable 5は、ソフトウェアエンジニアリング、ナレッジワーク、ビジョン(視覚)、科学研究など、テストしたほぼ全てのベンチマークで世界最高水準(SOTA)を記録。サイバーセキュリティなどの分野での悪用を防ぐため、特定のトピックについてのクエリでは、Claude Opus 4.8(以下、Opus 4.8)が代わりに回答する仕組みを導入した。ガードレールは保守的に調整されており、セッションの平均5%未満で無害なリクエストを誤検知することがあるとしている。
また、サイバー防衛担当者やインフラ事業者など限定されたグループ向けに、「Claude Mythos 5」(以下、Mythos 5)も公開した。Mythos 5はFable 5と同一の基盤モデルだが、特定の領域でガードレールを解除したもの。当面は、2024年4月に開始した「Project Glasswing」を通じ、Claude Mythos Previewのアップグレード版として配備される。
Fable 5とMythos 5の価格は、入力100万トークン当たり10ドル、出力100万トークン当たり50ドル。Fable 5は、全ての地域で利用可能となり、Claude APIを通じて「claude-fable-5」を利用できる。
サブスクリプションプラン(Pro、Max、Team、Enterprise)では、6月22日まで追加料金なしでFable 5を利用できる。6月23日以降は一時的にプランから除外され、利用には別途クレジットが必要となる。十分なキャパシティーが確保され次第、標準機能として復帰させる予定だ。
以下では、各分野での具体的な活用例と改善された能力を紹介する。
早期テストで、Stripeは「Fable 5により数カ月分のエンジニアリング作業が数日に短縮された」と報告した。5000万行のRubyコードベースで、チーム全員で2カ月以上かかるような移行作業を、Fable 5は1日で完了させたという。また、CognitionのFrontierCode評価(高品質なプロダクションコードの基準を満たしつつ難解なコーディング課題をクリアできるかを測定)で、Fable 5は最高スコアを記録した。
Hebbiaのシニアレベル推論ベンチマーク(Finance Benchmark)で、Fable 5はドキュメントベースの推論、図表の解釈、問題解決の各項目で最高スコアを獲得した。IMCは、事実調査、概念的推論、根本原因分析、期待値分析を含むトレイディング分析評価のほぼ全てで、Fable 5が満点を取ったと言及している。
詳細な科学的図表から正確な数値を抽出したり、スクリーンショットからWebアプリケーションのソースコードを再構築したりできる。また、従来のモデルは追加のツール(ハーネス)なしでは『ポケットモンスター ファイアレッド』のプレイに苦労していたが、Fable 5は視覚情報のみの最小限の構成でゲームをクリアしている。
数百万トークンに及ぶ長期的なタスクでも、自身のメモを参照して出力を改善できる。デッキ構築型ゲーム『Slay the Spire』を用いた実験では、永続的なファイルベースのメモリにアクセスさせることで、Opus 4.8と比較してパフォーマンスが3倍向上し、最終章に到達する頻度も3倍になった。
Mythos 5により、タンパク質設計のプロセスを約10倍加速、人間の介在なしで熟練の専門家に匹敵、あるいは凌駕する成果を出したという。結合部位の選定からツールの実行、エラーからの回復まで全工程を自律的に実行した。研究でターゲットとした14のタンパク質のうち、9つで有望な創薬候補が得られ、現在調査が進んでいる。
Opus級とのブラインド比較テストでは、同社の科学者の約80%がMythos 5の仮説を支持し、そのうち数件は実験的評価に進んでいる。大腸菌(E. coli)タンパク質の新しいメカニズムについての仮説の1つは、独立して同じ問題に取り組んでいた外部の研究室による調査結果と一致した。
1週間以上にわたるほぼ自律的な作業により、独自のゲノミクス研究を遂行した。138種の動物にわたる数百万個の単細胞データを統合し、遠縁の生物間で同じ役割を果たす細胞を特定するためのカスタム機械学習モデルを設計・訓練した。人間の最小限の指示だけで構築されたこのモデルは、科学誌『Science』に掲載された最新モデルを上回る性能を示したという。
Mythos級のモデルはソフトウェアの脆弱(ぜいじゃく)性の発見や悪用で高い能力を有すため、攻撃の容易化とそのコストを低下させるリスクが指摘されている。「Project Glasswing」では初期モデルを限定公開した際、「悪用を確実に防ぐ強力なガードレールが開発されれば、全てのユーザーにこの能力を開放したい」としていた。
Fable 5では、サイバーセキュリティ、生物学、化学に関連するリクエストが検知された場合、回答は自動的にOpus 4.8に引き継がれるようになっている。Mythos 5でも、生物学および化学に関連するリクエストの大半がOpus 4.8に引き継がれるという。
また、フロンティアモデルの能力を蒸留(ディスティレーション)により抽出し、自らのモデルを訓練しようとする試みが一部で確認されている。Fable 5では、蒸留の試みとフラグが立てられたリクエストはOpus 4.8へ引き継がれるようになっている。
一般公開に耐え得る堅牢(けんろう)なガードレールを備えたことで、現時点では無害なリクエストでも安全分類器が反応してしまうことがあるが、リリース後の更新を通じて誤検知を減らしていくという。
Fable 5、Mythos 5以降で、ビジネス顧客のデータ処理方法が変更される。Mythos級の全トラフィックに、30日間のデータ保持を義務付ける。同データはモデルの訓練には使用されず、複雑な攻撃や新たな脱獄手法の防御、および誤検知の特定と削減にのみ利用される。データへの人間によるアクセスは全てログに記録され、30日後に削除される。
Copyright © ITmedia, Inc. All Rights Reserved.
Anthropicの「Mythos」はどこがすごいのか Cloudflareが震えた検証結果
Claude Mythos Previewは誰が使える? "攻撃もできるAI"を巡る静かな争奪戦
Anthropicの「Mythos」登場で強まる“連鎖ハッキング”への恐怖
27年前のバグをAIが暴いた日 「Claude Mythos」が起こすサイバー防衛の地殻変動
Claude Mythosで激変するセキュリティの新ルール 勝敗を決めるのは「修復のスピード」
瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓
MFA(多要素認証)を入れたから安心という常識が崩れ去っている。フィッシング集団「Tycoon2FA」が摘発されたが、脅威が完全になくなったというわけではない。

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...