ШІ Читати оригінал на WIRED 2 хв читання 0

Anthropic скасовує політику прихованого саботажу моделі Claude Fable 5

Anthropic скасовує політику, яка мала таємно обмежувати конкурентів у використанні нової моделі Claude Fable 5 для розробки інших ШІ-систем. Після значного опору з боку дослідницької спільноти компанія визнала помилку в балансі між безпекою та інноваціями. Раніше Anthropic застосовувала приховану деградацію продуктивності моделі, що фактично саботувало роботу науковців над конкуруючими проєктами. Тепер компанія зобов'язується робити всі механізми захисту видимими для користувачів.

Помаранчевий стилізований гліф-зірка "Claude Mythos" розміщений на чорному екрані перед абстрактними теплими геометричними формами.
Помаранчевий стилізований гліф-зірка "Claude Mythos" розміщений на чорному екрані перед абстрактними теплими геометричними формами. · Джерело зображення: WIRED

За даними WIRED, Anthropic відступає від політики, яка передбачала приховане обмеження можливостей конкурентів у використанні її нової моделі Claude Fable 5. Цей поворот стався після того, як рішення викликало гострий резонанс у світовій спільноті дослідників штучного інтелекту. Компанія заявила: «Ми змінюємо запобіжні заходи для розробки передових LLM, щоб зробити їх видимими», — додавши вибачення за те, що не знайшла правильного балансу.

Політика прихованого саботажу та її мотивація

Claude Fable 5 була представлена з додатковими запобіжними механізмами для запобігання зловживанням. З одного боку, Anthropic запровадила стандартні заходи: користувачів, які ставили запитання про кібербезпеку, біологію чи хімію, перенаправляли на менш потужну ШІ-модель, щоб мінімізувати ризик створення біологічної зброї або здійснення кібератак. Однак для дослідників, що використовували Claude Fable 5 у процесі розробки нових моделей, Anthropic запровадила інший підхід.

Цей підхід полягав у навмисному зниженні продуктивності моделі способами, які були невидимі для кінцевого користувача. Це фактично саботувало науковців, що намагалися використовувати Claude для навчання конкуруючих ШІ-систем. Критики назвали цю дію надмірною та ворожою до спільноти.

Реакція дослідницької спільноти

Політика викликала гнівну реакцію у науковому середовищі. Dean Ball, старший науковий співробітник Foundation for American Innovation і колишній радник Білого дому з питань ШІ, заявив: «Зниження продуктивності в ML-дослідженнях без повідомлення користувача є шокуючої ворожим та поганим виглядом». Він підкреслив, що така «таємна саботажна» політика підриває загальну позицію Anthropic щодо безпеки ШІ.

Will Brown, керівник досліджень у стартапі Prime Intellect з відкритим кодом, висловився аналогічно: «Це відчувається так, ніби вони починають забирати драбину позаду себе». Він також зазначив, що обмеження могли мати широкі наслідки, зокрема, уповільнивши зростання екосистеми сторонніх компаній, які тестують передові моделі на безпеку та надійність.

Наслідки для відкритих досліджень

Початкова мета Anthropic полягала у прискоренні ШІ-досліджень через високу ефективність Claude. Однак приховане обмеження створювало серйозні проблеми, які стосувалися як безпеки, так і прозорості процесу розробки:

  • Обмеження могли завадити співпраці між дослідниками у сфері безпеки ШІ.
  • Розробники не мали чіткого розуміння, чи порушують вони правила Anthropic, оскільки компанія не сповіщала їх про спрацювання запобіжних механізмів.
  • Це створювало ризик того, що лише невелика кількість провідних ШІ-лабораторій зможе проводити передові дослідження.

Зміна курсу Anthropic свідчить про необхідність більшої прозорості у регулюванні та розробці найпотужніших моделей.

Контекст для України

Для українських AI-стартапів та розробників ця зміна є критично важливою. Доступ до потужних API від Anthropic часто використовується для тонкого налаштування локальних моделей або для тестування їхньої стійкості в умовах, схожих на реальні виробничі процеси. Скасування «таємного саботажу» означає більшу прозорість: українські фахівці тепер можуть більш достовірно оцінювати можливості Claude Fable 5 для своїх проєктів без страху прихованих обмежень. Це знижує бар'єр недовіри до зовнішніх вендорів, що особливо актуально для спільноти, яка активно розвиває українські рішення на базі відкритих моделей.

Часті запитання

Що таке політика прихованого саботажу Anthropic?
Це навмисне зниження продуктивності моделі Claude Fable 5 способами, які були невидимі для кінцевого користувача. Цей підхід фактично саботував науковців, що намагалися використовувати модель для навчання конкуруючих ШІ-систем.
Чому Anthropic запровадила обмеження моделі Claude Fable 5?
Початково метою було прискорити ШІ-дослідження завдяки високій ефективності. Також компанія використовувала стандартні заходи для мінімізації ризику створення біологічної зброї чи здійснення кібератак.
Telegram

Свіжі новини у нашому Telegram

Отримуйте миттєві сповіщення про нові публікації в рубриці «ШІ»

@proaiandevenmore