За даними IBM, новий реліз OpenAI відзначається зміною стратегії виходу на ринок. Замість миттєвого доступу для всіх користувачів, компанія впроваджує фазове розгортання, що подібне до підходу Anthropic із моделями Mythos. Цей крок викликав активні дискусії серед експертів щодо балансу між швидкістю інновацій та контролем ризиків.
Багатошарова архітектура безпеки Sol
Флагманська модель Sol використовує концепцію «defense in depth» — стратегію наскрізного захисту, де кілька незалежних рівнів безпеки перетинаються для мінімізації помилок. Як зазначив IBM Fellow Kush Varshney, система захисту Sol не покладається лише на один класифікатор для фільтрації шкідливого контенту. Натомість вона додає додаткове навчання та бар'єри, після чого відповіді пропускаються через модель міркування, яка перевіряє результат перед фінальною видачею.
Ефективність у наукових розрахунках
OpenAI заявляє, що Sol демонструє високі результати у наукових міркуваннях, зокрема у прогнозуванні зв'язування малих молекул із білковими цілями. Проте експерти виявляють нюанси в метриках:
- Точність моделі у цьому тесті склала 7%, що є низьким показником для складних завдань.
- OpenAI знизила поріг звітності за цим бенчмарком з 50% до 30%.
- Sol досягає своїх результатів, використовуючи значно менше токенів міркування порівняно з моделями Anthropic.
IBM Distinguished Engineer Chris Hay припускає, що обмеження кількості токенів для міркування є навмисним кроком OpenAI. Це може запобігати надто довгим ланцюгам думок, які можуть вивести модель у небезпечну або непередбачувану область.
Регуляторний контекст та відкритість
Скептицизм щодо закритого доступу підкріплюється тим, що вікно для добровільного перегляду фронтирних моделей регуляторами скоротилося з 90 до 30 днів. Поки приблизно 20 організацій отримують ранній доступ до Sol, частина спільноти виступає за відкритість. Як зазначив Chris Hay: «Якщо я справді думаю про етику відкритого коду, найкраще, що можна зробити з точки зору моделі — це випустити все у світ, і тоді всі виявлять справжні проблеми, а потім ви зможете їх виправити». Попри закритість початкового етапу, архітектурні рішення OpenAI продовжують визначати стандарти безпеки в індустрії.