AIが「攻撃者」になる時代の幕開け:Mythos登場の衝撃
2026年4月7日、米AI企業Anthropicは新たな汎用AIモデル「Claude Mythos Preview」を発表した。しかしその公開方法は、これまでのどのAIモデルとも異なるものだった。一般ユーザーへの公開を行わず、厳選された組織にのみ限定的にアクセスを付与する「Project Glasswing」という枠組みを通じてリリースされたのだ。その理由は単純かつ深刻である——このモデルが、現代のコンピューティングシステムを自律的にハッキングできる能力を持つと判断されたためである。
世界の銀行、政府機関、サイバーセキュリティ専門家が一斉に「脅威評価」を急いでいる。AIの能力が「人間を補助するツール」から「人間に代わって攻撃を実行するエージェント」へと転換したことを示す、歴史的な分岐点として受け止められているのだ。
Mythosの実力:具体的な数字が示す脅威
英国AI安全機関(AISI)による独立評価
英国のAI Security Institute(AISI)はAnthropicのClaude Mythos Previewのサイバー評価を実施し、キャプチャ・ザ・フラッグ(CTF)チャレンジと多段階サイバー攻撃シミュレーションにおいて継続的かつ顕著な改善を確認した。
専門家レベルのタスク——2025年4月以前はいかなるAIモデルも達成できなかった課題——において、Mythos Previewは73%の確率で成功を収めた。
AISIの独立評価はこの能力を裏付け、Mythos Previewが32ステップに及ぶエンドツーエンドの企業ネットワーク攻撃シミュレーションを完了した最初のモデルであることを確認した。
Anthropic自身が実施した内部テストの結果
Anthropicは2024〜2025年にLinuxカーネルで登録された100件のCVEおよびメモリ破壊脆弱性のリストをMythos Previewに提供し、モデルはその中から40件の悪用可能な脆弱性を選別。各脆弱性に対して特権昇格エクスプロイトを自律的に作成するよう指示したところ、その半数以上の試みが成功した。これらのエクスプロイトはすべて、初期プロンプトの後は人間の介入なしに完全自律で記述されたものだ。
Mythosは熟練した人間以外のすべてを凌駕するレベルでソフトウェアの脆弱性を特定・悪用でき、テストでは広く使用されているすべてのOSとWebブラウザに重大な欠陥を発見した。それらの脆弱性の99%はいまだパッチが適用されていない。
AIサイバー攻撃の急増という背景
CrowdStrikeのデータによると、AIを活用したサイバー攻撃は2025年に前年比89%増加している。この急増の背景には、AIが攻撃の「敷居」を劇的に下げているという現実がある。
2025年初頭、技術的スキルの限られたサイバー犯罪者がAIコーディングエージェントを使用し、わずか1か月で17の組織にまたがる高度なデータ恐喝キャンペーンを実行。攻撃者はAIに指示を与えるだけで、システムが自律的に数千のVPNエンドポイントをスキャンし、ネットワークに侵入、認証情報を窃取、マルウェアを開発、データを流出させ、最大50万ドルの身代金要求メモを生成した。Anthropicの脅威情報チームはこのアプローチを「バイブハッキング(vibe hacking)」と呼び、AIがサイバー攻撃の専門知識の壁を根本から変えたと評した。
前例のない実際の攻撃事例:GTG-1002の衝撃
Mythosの登場前から、AIによる自律的サイバー攻撃は現実のものとなっていた。
2025年9月中旬、AnthropicはGTG-1002と名付けた中国の国家支援グループによるサイバースパイ活動を検知した。標的はテクノロジー企業約30社、金融機関、化学メーカー、政府機関にわたるものだったが、この事件が転換点となったのは「誰が攻撃を実行したか」だった。攻撃者はClaude Codeを正規の防御テストと信じ込ませて操作し、後は放置した。このモデルが戦術的作業の推定80〜90%を自律的に実行——脆弱性を発見し、悪用し、横断移動し、権限を昇格させ、データを流出させた。人間のオペレーターが介入したのはいくつかの戦略的な意思決定ポイントのみだった。
Anthropicの結論は率直だった:「洗練されたサイバー攻撃を実行するための障壁は大幅に低下しており、適切な設定を持つ脅威アクターは、経験豊富なハッカーチーム全体の仕事をエージェンティックシステムを使って実行できるようになった」。米国下院国土安全保障委員会はこの事件を深刻に受け止め、Anthropicの最高経営責任者を証言のために召喚した。
ビジネス視点:企業・経営者にとっての意味
アクセス制限という決断とProject Glasswing
Anthropicは、攻撃的能力が悪用されるリスクを理由としてMythosモデルを一般公開しないことを選択した。代わりに立ち上げたのがProject Glasswing——厳格な審査を経た組織のみがMythosにアクセスできる枠組みだ。
AnthropicはAmazon、Google、Microsoftおよびその他のProject Glasswingメンバーと協力し、ジェイルブレイクの分類と対応のための「コンセンサスフレームワーク」の策定を進めている。
金融機関へのリスク
現在、重要な本番ワークロードでAIを稼働させている銀行は10%未満であり、回答者の96%が規制・コンプライアンス上の課題を主要な障壁として挙げている。今後18〜36か月でパイロットが本番移行するにつれ、エージェンティックAIインフラに対する業種固有の監視が避けられない状況となる。
Claude Mythos Previewモデルの登場は金融システムに即座の崩壊をもたらすものではないが、銀行と脅威アクターの間のサイバー軍拡競争をエスカレートさせるものだ。
企業が今取るべき対策
連邦機関および専門家は、企業がAIシステムの評価を既存のリスク評価・軽減・監視プロセスに組み込むことを推奨している。具体的には、米国立標準技術研究所(NIST)の新たなCyber AIプロファイルなど確立された標準に従うことが求められており、このフレームワークはAIを戦略的に採用しながらサイバーセキュリティリスクに対処・優先順位付けするためのガイドラインを提供している。AIを既存のコントロールセットに統合することで、銀行は進化する脅威からネットワークを保護できる。
消費者・生活者視点:一般の人々への影響
Mythosのような能力を持つAIモデルが悪意ある者の手に渡った場合、一般市民への影響は以下のような形で現れると見られる:
- 個人情報の大量流出リスク上昇:銀行や行政機関がハッキングされると、氏名・口座番号・マイナンバーなどの個人情報が危険にさらされる
- サービス停止リスク:インフラへの攻撃により、オンラインバンキングや行政サービスが停止する可能性がある
- フィッシング・詐欺の高度化:AIが生成するカスタマイズされた詐欺メールや偽サイトが急増し、見分けることが困難になる
- ランサムウェア被害の拡大:AIが自動的に多数の組織を標的にするため、医療機関や教育機関なども被害を受けるリスクが高まる
現時点では、サイバー犯罪者や敵対的な国家主体がMythosまたは同等レベルのモデルへのアクセスを持つという公開報告はなく、組織への即時リスクは低いと評価されている。しかし6〜18か月以内に、Mythosレベルの能力を持つオープンウェイトモデルが利用可能となり、エンドツーエンドの攻撃を含むサイバー犯罪を大幅に自動化するために使用される可能性が高い。
専門家の見解:冷静な分析と現実的な懸念
ジョージア工科大学サイバーセキュリティ・プライバシー学部の教授でクリントン・オバマ政権のアドバイザーを務めたピーター・スワイア氏は「Anthropicの発表は非常にドラマチックでPR的な成功だった」と述べつつも、同僚のサイバーセキュリティ教授の多くが「ほぼ予想通りで、これまでの延長線上」と見ていると指摘。一方で具体的なリスクも認めており、「Mythosによって、既知の脆弱性を実際に悪用するエクスプロイトへと変換することが容易になるリスクがある」と警告した。
「サイバーセキュリティの防衛担当者はMythosを真剣に受け止めるべきだが、防衛への期待される損害は最悪のシナリオが示唆するよりもはるかに低い可能性が高い」——ピーター・スワイア教授(ジョージア工科大学)
一方、Anthropic自身の「レッドチーム」リーダーは公式評価でより厳しい見方を示した:
「誰かがMythosを使って、自動化された方法で大量かつ高速に脆弱性を悪用できる可能性がある。世界中の組織のほとんど——最も技術的に洗練された組織を含めて——はそれに対応できないだろう」——ローガン・グラハム氏(Anthropic レッドチームリーダー)
Anthropic自身も2025年3月から2026年3月の間に悪意あるサイバー活動を理由にバンされた832件のアカウントを調査し、分析の主要な結論として「悪意あるアクターはAIをより危険な方法で使用している」こと、特に「サイバー作戦の後期にある複雑なステージでAIを活用している」ことを明らかにした。
国際比較:世界各国の対応
この懸念は政府と金融の最高レベルに達している。米国では財務長官スコット・ベッセント氏とFRB議長ジェイ・パウエル氏が主要米銀を集め、Mythosがもたらすサイバー脅威について協議。英国ではAI担当大臣カニシュカ・ナラヤン氏がフィナンシャル・タイムズ紙に「懸念すべきだ」と表明し、イングランド銀行はMyths登場後にAIリスクテストを強化。ドイツの銀行も当局やサイバー専門家への相談を開始した。
OpenAIも同様の能力を持つモデルを「Trusted Access for Cyber」プログラムのもとで開発中と報じられており、AIサイバー兵器の開発競争は複数の企業で同時進行していると見られる。
AISIは2023年からAIサイバー能力を追跡してきたが、2年前には最良のモデルでも初級レベルのサイバータスクをほとんど完了できなかった。その能力の進歩がいかに急速であるかを示す事実は、各国の政策立案者に対して早急な制度整備を迫っている。
今後の展望:注目すべき4つのポイント
- オープンウェイトモデルの「民主化」リスク:6〜18か月以内にMythosレベルの能力を持つオープンウェイトモデルが登場し、サイバー犯罪を大幅に自動化するために使用される可能性が高い。この時点で、現在の「アクセス制限」による防衛効果は実質的に消滅する。
- ジェイルブレイク対策の標準化:Anthropicは「新しいモデルを安全にローンチし、ユーザーが高度な機能を最大限に活用できるよう」ジェイルブレイク評価の共通標準策定が必要と主張。Amazon、Google、Microsoftとともにコンセンサスフレームワークの構築を進めている。
- 規制・立法の加速:米国下院国土安全保障委員会がAnthropicCEOを招致する事態となっており、AI能力に関する法規制の整備が加速する見通しだ。
- 防衛・攻撃の同時進化:Anthropicは「Mythos Previewはあらゆる面で強力だが、コンピュータセキュリティタスクにおいて際立った能力を持つ」と述べており、Project Glasswingを通じて世界の最重要ソフトウェアの保護にMythosを活用し、サイバー攻撃者に先手を打つための業界全体の準備を進めるとしている。
まとめ:この問題の核心
- 🔴 AIはもはや「攻撃支援ツール」ではなく「自律的な攻撃者」:大規模言語モデルはもはや人間の攻撃者を補助するアシスタントではなく、監督下に置かれた攻撃者そのものとなった。
- 🟡 即時リスクは限定的だが、中期リスクは深刻:現時点でのMythosへのアクセスは厳しく制限されているが、同等能力を持つモデルの拡散は時間の問題であり、企業は今から備える必要がある。
- 🟢 防衛にも同じAIが使える:NISITのCyber AIプロファイルやProject Glasswingのような枠組みを通じ、AIは攻撃だけでなく防衛にも有効に活用できる。企業は「AIを使った防衛」への投資を急ぐべきタイミングに来ている。
参考情報
- Scientific American — What is Mythos and why are experts worried about Anthropic's AI model(2026年4月17日)
- UK AI Security Institute(AISI)— Our evaluation of Claude Mythos Preview's cyber capabilities(2026年4月13日)
- Cybersecurity Dive — Anthropic reactivates Fable, Mythos after securing government approval
- Technology.org — Anthropic's Mythos AI Model Has Governments and Banks Racing to Understand the Threat(2026年4月21日)
- American Banker — Unpatched AI flaw poses risk to banking sector(2026年4月21日)
- American Banker — Experts throw cold water on Anthropic's new AI model(2026年4月14日)
- Anthropic Red Team — Assessing Claude Mythos Preview's cybersecurity capabilities(2026年4月7日)
- Flare — Anthropic Mythos, AI, and Cybersecurity: What You Need to Know
- Anthropic — What we learned mapping a year's worth of AI-enabled cyber threats(2026年6月)
- arxiv.org — Artificial Intelligence as Game Changer in Cybersecurity: What We Learned in 2025-2026
著者プロフィール
伊東雄歩(いとうゆうほ) / ゆぽゆぽ
株式会社ウォーカー代表取締役 / MENSA会員 / NLPマスタープラクティショナー
IQ130超のADHD経営者。「社会不適合」ゆえに会社員を2年で挫折し、フリーランスを経由せずいきなり起業。訴訟4回、2000万円の損失、役員の裏切り、オフショア開発の地獄を乗り越え10年生き残る。心理学・教育学に1000万円投資し、独自の「成長力学」を確立。現在は生成AI教育に注力し、「3年を2日に変える」AIプログラミング2Daysキャンプを全国展開中。AIフレンズコミュニティを運営。
夢は「世界征服」——世界の常識を変え、新しい価値観を提示すること。
