Як повідомляє The-decoder, Anthropic представила Claude Opus 4.8 як свій новітній флагманський продукт, який перевершує GPT-5.5 та Gemini 3.1 Pro у багатьох категоріях тестування. Однією з найбільш помітних переваг моделі є її покращена чесність: Anthropic зазначає, що Opus 4.8 частіше сигналізує про невизначеності щодо своїх висновків і рідше робить необґрунтовані заяви. Це вирішує загальновизнану проблему ШІ-моделей — схильність до поспішних висновків.
Продуктивність у складних завданнях
Модель демонструє високі показники в критично важливих для інженерії та науки сферах. Зокрема, у завданні агентського кодування (SWE-Bench Pro) Claude Opus 4.8 досягає результату 69.2 відсотка. Це є значним підвищенням порівняно з 64.3 відсотка для попередньої версії Opus 4.7 та 58.6 відсотка для GPT-5.5. Також модель показала найкращі в галузі результати у багатодисциплінарному мисленні (Humanity's Last Exam): вона набирає 49.8 відсотка без використання інструментів і 57.9 відсотка при їх застосуванні.
Нові функції: динамічні воркфлоу та контроль зусиль
Крім самого апгрейду моделі, Anthropic випустила низку функцій, які можуть мати більший вплив на користувачів. Найважливішою є впровадження «динамічних воркфлоу». Це дозволяє Claude Code з Opus 4.8 планувати завдання та запускати сотні паралельних суб-агентів за один сеанс. Ця функція дає змогу обробляти міграції цілих кодових баз, що складаються з сотень тисяч рядків.
Для кращого управління процесом Anthropic додала механізм контролю зусиль (effort control) у інтерфейсах claude.ai та Cowork. Ця функція дозволяє користувачеві самій вирішувати, наскільки глибоко має працювати ШІ над відповіддю:
- High (високий): Стандартний рівень обробки.
- Extra / Xhigh: Максимальна глибина мислення для складних завдань.
- Max: Найбільш інтенсивний режим, що вимагає більше токенів.
Економічні аспекти та стратегічне значення
Щодо ціноутворення API, Anthropic зберегла стандартні ставки порівняно з Opus 4.7: $5 за мільйон вхідних токенів і $25 за мільйон вихідних токенів. Однак для швидкого режиму (Fast Mode), який працює зі швидкістю у 2.5 рази, ціна знижена до $10 за мільйон вхідних токенів та $50 за мільйон вихідних токенів. Ці зміни підкреслюють стратегічний фокус компанії на підвищенні якості моделі при збереженні доступності для розробників, хоча й із чітким розділенням між швидкістю та глибиною обробки.
EVERYTHING