Anthropicは、最新のAIモデル「Claude Mythos Preview」が主要なオペレーティングシステムやウェブブラウザにおいて数千ものサイバーセキュリティ脆弱性を発見したことを受け、このモデルを一般公開せず、限定的な提供を開始しました。同社は「Project Glasswing」と称するこの取り組みを通じて、Amazon Web Services、Apple、Google、Microsoft、Nvidiaといったインターネットの基盤を支える40以上の主要なテクノロジー企業やインフラ維持組織に対し、モデルへのアクセスを供与しています。これは、AIが高度なセキュリティ脆弱性を自律的に特定し、さらには悪用できるレベルに達したことを示しており、AIモデルの公開戦略とセキュリティ対策のあり方に新たなパラダイムをもたらす画期的な動きです。
「Claude Mythos Preview」は、サイバーセキュリティ作業のために特別に訓練されたモデルではなく、コード理解、推論、そして自律性といった汎用的な能力の向上に伴い、偶発的に脆弱性発見能力が飛躍的に高まったとAnthropicは説明しています。このモデルは既存のセキュリティベンチマークをほぼ完全にクリアする性能を示し、その焦点はすでに、これまで知られていなかったゼロデイ脆弱性の発見へと移行しています。実際に、OpenBSDに存在する27年前のバグや、FreeBSDのNFSサーバーに影響を与える17年前のリモートコード実行脆弱性(CVE-2026-4747)を、人間を介さずに完全に自律的に特定し、悪用することに成功した事例も報告されています。Anthropicは、この「Project Glasswing」の取り組みに対し、モデル利用クレジットとして最大1億ドル、さらにオープンソースセキュリティ組織への直接寄付として400万ドルを投じています。
このAnthropicの戦略は、インターネットの基盤を支える主要なテクノロジー企業や組織に直接的な影響を与えます。これらの企業は、自社製品やサービスに潜む未知の脆弱性をAIの力で早期に発見し、対処する前例のない機会を得る一方で、AIがもたらす新たなセキュリティリスクへの対応も迫られます。AIが高度な脆弱性を自律的に発見・悪用できる能力は、サイバーセキュリティの攻防における新たな局面を開き、AI開発企業がその技術の公開と管理において極めて大きな責任を負うことを明確に示しています。この技術の進化は、セキュリティ業界における既存のパワーバランスを大きく揺るがし、人間の専門家による発見・対処から、AI主導の防御・攻撃へとパラダイムシフトを促す可能性を秘めており、一般ユーザーにとっては、基盤となるソフトウェアの安全性がAIによって強化される期待が高まる一方で、AIが悪用された場合の潜在的な脅威の増大にも警戒が必要となります。
今後注目すべきは、「Project Glasswing」を通じて発見された数千もの脆弱性がどれだけ迅速かつ効果的に修正され、インターネット全体のセキュリティ向上に貢献するかという点です。また、Anthropicがこの極めて強力なAIモデルの管理と倫理的利用に関してどのような枠組みを構築し、その透明性をどのように確保していくかにも、国際社会からの注目が集まるでしょう。AIがセキュリティの守護者としての役割を果たす一方で、悪用された場合の潜在的なリスクも増大するため、AIの安全性とセキュリティに関する国際的な協力体制の構築や、新たな規制の議論がさらに加速することが予想されます。
※詳細は元記事をご確認ください
