Anthropic презентувала результати свого проєкту Glasswing, використовуючи модель Claude Mythos Preview для пошуку кібервразливостей. У співпраці з близько 50 партнерами ця AI-система виявила понад 10 000 вразливостей високого або критичного рівня у програмному забезпеченні, що є ключовим для функціонування інтернет-інфраструктури та інших критичних систем. Це значне досягнення у сфері безпеки, але воно також висвітлює серйозну проблему: швидкість виявлення помилок AI вже перевищує здатність команд верифікувати, оприлюднювати та патчити їх.
Прорив у пошуку вразливостей
Партнери Anthropic працюють над програмним забезпеченням, яке є основою інтернету та критичної інфраструктури. За словами компанії, кожен із партнерів виявив сотні критичних вразливостей. Деякі з них повідомили про збільшення темпів пошуку помилок більш ніж у десять разів. Наприклад, Cloudflare зафіксував 2 000 вразливостей, причому 400 із них були класифіковані як високого або критичного рівня. При цьому показник хибних спрацювань (false positive rate) моделі Claude Mythos перевершив результати людських тестувальників.
Порівняння з попередніми моделями
Модель демонструє значний прогрес порівняно з її попередниками. Mozilla виявила та виправила 271 вразливість у Firefox 150, що більш ніж удвічі більше, ніж знайшла Claude Opus 4.6 у Firefox 148. Незалежна платформа безпеки XBOW назвала Mythos Preview великим кроком вперед порівняно з усіма попередніми моделями, відзначаючи її «безпрецедентну точність». Anthropic також підтверджує перевагу Mythos Preview на академічних бенчмарках ExploitBench та ExploitGym.
Вплив на індустрію та відкритий код
Ефект від використання моделі відчувається не лише у пошуку помилок серед партнерів. Anthropic також просканувала понад 1 000 проєктів з відкритим кодом за допомогою Mythos Preview. Модель оцінила виявлення 6 202 вразливостей високого або критичного рівня, при загальній кількості знахідок у всіх категоріях серйозності — 23 019. З огляду на те, що 90.6 відсотка цих знахідок виявилися справжніми позитивами, Anthropic оцінює, що Mythos Preview викрила близько 3 900 підтверджених критичних вразливостей у коді з відкритим доступом.
Потенційні ризики та перспективи
Хоча ця технологія обіцяє значно підвищити рівень кібербезпеки, вона створює і нові виклики. Швидкість роботи AI-моделей може призвести до «секуристичної щілини» (security gap), коли кількість невиправлених вразливостей зростає швидше, ніж їх можна усунути. Anthropic зазначає, що компанія продовжуватиме сканування та вивчення можливостей Mythos Preview, оскільки ця технологія може радикально змінити підхід до захисту критичної інфраструктури.
EVERYTHING