AIが「脆弱性ハンター」になった日——セキュリティの常識が覆される
2026年4月、サイバーセキュリティの世界に衝撃が走った。米Anthropicが発表した最新AIモデル「Claude Mythos Preview」が、主要なOSとWebブラウザ全てにわたる数千件(累計1万件超)の高深刻度ゼロデイ脆弱性を自律的に発見したのだ。しかも、その多くは人間のセキュリティ研究者がこれまで長年にわたって見逃してきた古い脆弱性だった。
これは単なる技術的進歩ではない。「脆弱性は見つからないもの」という前提が崩れ、「より早く見つけられてしまうもの」へと根本から変わった瞬間だ。防御側にとっても攻撃側にとっても、AIが脆弱性発見の主役になる新時代が幕を開けた。
Claude Mythosとは何か——桁違いの脆弱性発見能力
Claude Mythosは、Anthropicが提供する対話型AI「Claude」の新たな最上位モデルだ。古代ギリシャ語で「神話」を意味する名を持つこのモデルは、従来の最上位モデル「Opus」をはるかに超える能力を持つ。
その能力を示す驚異的な数字
- 開始約1か月で深刻な脆弱性を1万件超検出(Project Glasswing初期成果)
- 英国AI Security Institute(AISI)の独立評価でエキスパートレベルのCTF(Capture The Flag)課題で73%の成功率を記録(2025年4月以前はどのAIモデルも達成不可能だった水準)
- 複数の脆弱性を連鎖させた攻撃(マルチプリミティブ)で72%のエクスプロイト成功率を実現
- サイバーセキュリティ企業DeepStrikeの集計では、2024年1年間のゼロデイ攻撃はわずか75件——Mythosの検知ペースは桁違いの水準にある
- 発見された脆弱性には、27年前のOpenBSDや17年前のFreeBSDに潜む未修正の脆弱性も含まれる
Anthropicはこのモデルが悪用された際の破壊的な影響を考慮し、一般向けの公開を見送った。その上で、同技術をサイバー防衛に特化して活用する業界横断の枠組み「Project Glasswing」を立ち上げた。
Project Glasswing——防衛のための業界連合
Project Glasswingには、AWS、Apple、Cisco、CrowdStrike、Google、Microsoft、NVIDIA、Palo Alto Networks、JPMorgan Chase、Linux Foundationなど12社以上が参画している。参加企業はMythosを防御目的で利用し、システムに潜む脆弱性を攻撃者よりも先に発見して修正を施す体制の構築を進めている。
「脆弱性は『見つからないもの』ではなく、『より早く見つけられてしまうもの』へと変わり始めています。この変化は、防御側だけでなく攻撃側にも同時に影響します。」
——株式会社リチェルカセキュリティ ホワイトペーパーより
AIセキュリティ脆弱性の急増——数字が示す現実
MythosはAIセキュリティ問題の「氷山の一角」に過ぎない。業界全体で脆弱性は急増している。
最新データで見るAI脆弱性の深刻化
- AI関連CVEは2025年だけで2,130件公開——前年比34.6%増(トレンドマイクロ「AIセキュリティレポート2026」)
- 評価済みのAI脆弱性の約半数が「高」または「緊急」に分類
- 2025年に公開された脆弱性(CVE)の総数は4万8,000件超——2023年比で38%増
- 2030年にはCVEが100万件超に達するとの予測も出ている
- Sysdigの調査では、AIを使ったクラウド環境への侵入から管理者権限の奪取まで8分しかかからなかった事例も報告されている
さらにトレンドマイクロのÆSIR(AESIR)プラットフォームは、2025年半ば以降だけでもNVIDIA、Tencent、MLflowなどを対象に21件の重大なCVEを発見しており、AIによる自律的な脆弱性発見が産業規模で進んでいることを示している。
ビジネス視点:経営者・CISOが今すぐ認識すべきこと
Cisco SVP & CPOのJeetu Patel氏は2026年RSAカンファレンスで「セキュリティとセーフティは、AIエラーの定義上の課題だ。エージェントAIはリスクを倍増させる。新しいエージェントはそれぞれが攻撃面を増やす」と断言した。
企業が直面する3つの構造的リスク
- 年1回の脆弱性診断では対応不可能:AIが1か月で1万件超の脆弱性を発見できる時代に、年1回のペネトレーションテストは形骸化しつつある。継続的なASM(Attack Surface Management)・CTEMへの移行が急務だ。
- AIエージェントへの過大な権限付与:Slack、Jira、Salesforce、社内DBを操作し、コードをコミットし、メールを送るAIエージェントに「全権限」を付与している企業が多い。最小権限の原則(Principle of Least Privilege)の徹底が不可欠だ。
- 防衛力の非対称性:Project GlasswingにアクセスできるJPMorganのような大手と、そうでない中小金融機関・企業の間で、防衛力の格差が急拡大している可能性がある。
セキュリティ企業Halcyonは「攻撃者が侵入する前に止めるという戦略に依存しているなら、Mythosはその問題をより困難にする」と指摘し、侵入を前提としたレジリエンス重視の戦略への転換を提言している。
消費者・生活者への影響——私たちの日常に及ぶリスク
「AIセキュリティ問題は企業だけの話」と思ってはいけない。今回発見された脆弱性は主要なOS(Windows、macOS、Linux)やWebブラウザ全てに及んでおり、私たちが日常的に使うスマートフォンやパソコンにも影響する可能性がある。
- 個人情報・金融データの漏洩リスク:銀行アプリやECサイトが動くOSやブラウザの脆弱性が悪用されれば、個人の口座情報やクレジットカード番号が危険にさらされる。
- ディープフェイク詐欺の高度化:AIを悪用したディープフェイク詐欺やAI生成マルウェアの脅威が増大している。
- 医療・ライフラインへの影響:2025年には290社超のヘルスケアプロバイダーがランサムウェア被害を受けており、医療サービスの停止リスクも現実化している。
また、GitHubのREADMEやWebページに悪意ある指示を埋め込む「間接プロンプトインジェクション」によって、企業が導入したAIエージェントが知らない間に個人情報を外部に送信するリスクも高まっている。
専門家の見解——業界が警告する「AI脆弱性の大惨事」
GoogleのセキュリティSVP Heather Adkins氏と、セキュリティ企業KnosticのCEO Gadi Evron氏は、2025年8月に連名で「AI脆弱性の大惨事が迫っている(The AI Vulnerability Cataclysm is Coming)」という文書を公開し、「AIは6か月以内に、サイバー防御を破るほどの速さで攻撃を実行できるようになる可能性がある」と警告した。
OWASPはこの変化を認識し、2025年12月に「アジェンティックアプリケーション向けTop 10」を別途公開した。エージェント特有の最重要リスクとして以下を挙げている。
- ASI01:エージェントゴールハイジャック——攻撃者がエージェントの意思決定プロセスを乗っ取る最も深刻なリスク
- LLM01:プロンプトインジェクション——2025年時点でもLLMセキュリティの最重要課題
- LLM06:過剰な権限委譲——ツール呼び出しや外部データ取得の組み合わせが致命的な脆弱性になる
- LLM07:システムプロンプト漏洩——エージェントの設計思想が外部に露出するリスク
国際比較——各国政府・規制当局の緊急対応
Mythosの衝撃は各国の規制当局を動かした。
🇺🇸 米国
Project Glasswingを通じてAWS、Google、Microsoftなどの主要IT企業が防衛連合を結成。OpenAIも同様に「GPT-5.5-Cyber」をTrusted Access for Cyber(TAC)プログラム経由で、認証済み防御者に限定提供を開始した。
🇬🇧 英国
英国AI Security Institute(AISI)がMythosの独立評価を実施。その圧倒的な能力を公式に確認した。
🇯🇵 日本
自由民主党は2026年4月20日、AnthropicやOpenAIの担当者を招いた合同会議を開催し、政府にサイバー防衛体制の抜本的強化を求める緊急提言を取りまとめた。米国のProject Glasswingをモデルとした企業連合の国内創設を提言している。また2026年5月22日には金融庁と日本銀行が全金融機関に対し、Project YATA-Shieldに連動した9項目の短期対応を約1か月での実装を求める異例の通達を発出。日本政府は2026年4月より「能動的サイバー防御」に係る新法を順次施行している。
🌐 国際機関
IMFは2026年5月7日、AIが金融システムへのサイバー攻撃を加速させると警告する論考を公開。レジリエンス基準の整備・サイバーストレステスト・国際協調を対策として提言した。
今後の展望——「AI対AI」の防衛パラダイムへ
この問題の構造は複雑だ。AIは「攻撃」と「防御」の両面で同時に機能する。今後注目すべきポイントを整理する。
注目すべき3つのトレンド
- 継続的脆弱性管理(CTEM)の標準化:年1回の診断から、AIを活用した常時稼働型の脆弱性管理へ移行する企業が急増する見込みだ。
- Mythos級モデルの拡散リスク:Anthropicは現在一般公開を制限しているが、類似能力を持つモデルが他社・国家から登場する可能性があり、同様の自制が保証されるとは限らない。
- AIエージェントのセキュリティ認証制度の整備:OWASPの「アジェンティックTop 10」やNISTのフレームワーク更新など、エージェント型AIに特化したセキュリティ基準の整備が国際的に加速すると見られる。
バグバウンティプログラムにおいても変化が起きている。curlプロジェクトでは2025年にHackerOneへの提出件数が約8倍に急増した一方、有効な脆弱性として認定されたのはわずか5%にとどまり、残る95%がトリアージで除外された。このうち約20%は明確にAI生成と判断されており、バグバウンティという仕組み自体の信頼性を揺るがす構造問題として認識され始めている。
まとめ:今すぐ押さえるべき3つのポイント
- 🔴 Mythosが1か月で1万件超の脆弱性を発見:AIが脆弱性発見の主役となる新時代が到来。年1回の診断という従来の安全神話は崩壊しつつある。
- 🟡 AIエージェント導入企業は今すぐ権限設計を見直すべき:プロンプトインジェクション、過剰な権限委譲、システムプロンプト漏洩が新たな攻撃の三大経路となっている。OWASPのアジェンティックTop 10の活用を推奨。
- 🟢 日本でも官民連携の防衛体制構築が急務:金融庁・日銀通達、自民党の緊急提言、能動的サイバー防御新法の施行と、制度的枠組みは急ピッチで整備が進んでいる。企業は政策動向を注視しながら先手を打つことが求められる。
参考情報
- フロンティアAIが脆弱性を大量発見する時代へ——金融庁・日銀、全金融機関に要請(innovaTopia)
- Anthropicの「Mythos」による金融サイバーリスク、自民党が政府に対策要請(ビジネス+IT)
- アンソロピックの最強AI「ミュトス」、1万件超の脆弱性を発見(BigGo ファイナンス)
- 【2026年4月最新】Mythos Preview|全OS脆弱性自律発見の衝撃(株式会社Uravation)
- Mythosで何が変わったのか——AI脆弱性診断の現実と内製化の判断基準(リチェルカセキュリティ・PR TIMES)
- AI for security を真剣に考えるために学ぶ、AI脆弱性診断の能力と限界(三井物産セキュアディレクション)
- 予言されていた「Mythos」の登場、AIによる脆弱性発見は転換点に(日経クロステック)
- TrendAI™ AIセキュリティレポート2026 ~AIエコシステムの断層~(トレンドマイクロ)
- Claude Mythos Preview×IMF警告:AIサイバー攻撃が金融システムを揺らす日(innovaTopia)
- What Mythos Actually Changes About Ransomware (And What It Doesn't)(Halcyon)
- 【2026年最新】AIエージェントセキュリティ完全ガイド|OWASP対応(株式会社Uravation)
- AIエージェント時代のセキュリティ設計|脅威の73%は検知困難(NRIセキュアテクノロジーズ)
- Claude Mythos(クロード・ミュトス)とは(日本経済新聞)
著者プロフィール
伊東雄歩(いとうゆうほ) / ゆぽゆぽ
株式会社ウォーカー代表取締役 / MENSA会員 / NLPマスタープラクティショナー
IQ130超のADHD経営者。「社会不適合」ゆえに会社員を2年で挫折し、フリーランスを経由せずいきなり起業。訴訟4回、2000万円の損失、役員の裏切り、オフショア開発の地獄を乗り越え10年生き残る。心理学・教育学に1000万円投資し、独自の「成長力学」を確立。現在は生成AI教育に注力し、「3年を2日に変える」AIプログラミング2Daysキャンプを全国展開中。AIフレンズコミュニティを運営。
夢は「世界征服」——世界の常識を変え、新しい価値観を提示すること。
