За даними Decrypt, американські регулятори впровадили жорсткі обмеження на використання нових інструментів від Anthropic, які були випущені лише кілька днів тому. Директива стосується як іноземних національностей, так і власних співробітників компанії, що змусило розробників повністю відключити доступ до Fable 5 та Mythos 5 для всієї клієнтської бази.
Причини обмежень та позиція Anthropic
Уряд США вважає, що було виявлено метод обходу захисних бар'єрів у публічно доступній моделі Fable 5. Особливо критичною вважається модель Mythos 5, яка має менше обмежень і демонструє високу ефективність у пошуку вразливостей у системах кібербезпеки. Проте Anthropic заявляє, що надані владою докази є лише усними та стосуються вузького сценарію — запиту моделі на аналіз конкретного коду для виявлення програмних помилок.
Представники компанії підкреслюють наступне:
- Виявлені вразливості є відносно простими та не є універсальними.
- Аналогічні можливості вже широко доступні у конкурентних моделях, зокрема OpenAI GPT-5.5, без необхідності використання спеціальних методів обходу.
- Компанія працює над відновленням доступу якнайшвидше після виконання вимог регуляторів.
Конфлікт щодо безпеки та попередження галузі
Попри виконання директиви, Anthropic попереджає про небезпечний прецедент. Компанія стверджує, що якщо такі стандарти застосувати до всієї індустрії, це може фактично зупинити розгортання будь-яких нових фронтирних моделей від усіх постачальників. Ситуація також викликала критику з боку David Sacks, співголови Ради рад президента з науки і технологій.
За словами David Sacks у мережі X, довірений партнер Anthropic та уряду США під час тестування Fable виявив можливість обходу захисту. Він зазначає: «Адміністрація попросила [CEO Anthropic] Dario Amodei виправити джейлбрейк або відкликати модель. Dario відмовився». Sacks додає, що реакція компанії суперечить її публічним заявам про пріоритет безпеки AI, стверджуючи, що Anthropic поставила доступ до споживчої моделі вище за вимоги щодо захисту.
Наразі інші моделі від Anthropic залишаються доступними для користувачів без змін.