За даними Tech, GitHub впроваджує значну зміну у бізнес-моделі свого AI-асистента Copilot. Раніше платформа працювала за моделлю фіксованого «преміум-запиту», що дозволяло компанії субсидувати важких користувачів, маскуючи справжні витрати на обчислення. Тепер GitHub переносить економічні наслідки інференсу безпосередньо на кінцевих користувачів, запроваджуючи токен-метринг.
Перехід від субсидії до реальної економіки
Ця зміна стала необхідною через стрімке зростання витрат на обчислення. Коли можливості моделей та інтенсивність використання збільшуються, вартість запуску складних агентських робочих процесів стає непідйомною для підтримки старої моделі субсидування. Раніше незалежно від того, чи користувач став просте синтаксичне питання, чи запустив багатогодинну сесію агента, це коштувало один «преміум-запит». Тепер вартість визначається обсягом використаних токенів.
Токенна грамотність як ключова навичка
Розробники змушені адаптувати свій підхід до роботи з AI, починаючи мислити як архітектори хмарних рішень. Це вимагає оптимізації витрат за кожну взаємодію замість того, щоб просто фокусуватися на функціональності. З’являється необхідність у «токенній свідомості» — здатності ефективно керувати контекстом та формулювати промпти.
Дослідження показують, що добре структурований запит із точним контекстом споживає значно менше кредитів, ніж неструктурована розмова з необмеженою історією. Це відображає ширшу тенденцію у світі SaaS-продуктів, де моделі «необмеженого» використання поступово замінюються на реальні системи оплати за обсяг.
Прогноз ринку AI: метринг як стандарт
Зміна в Copilot є сигналом для всієї індустрії. Коли лідер ринку переходить до моделі з вимірюванням використання, конкуренти стикаються із вибором: або повторити цю модель, або тимчасово пропонувати щедрі фіксовані тарифи, які вони, ймовірно, не зможуть довго підтримувати. Очікується, що протягом наступного року інші AI-асистенти для кодування також запровадять подібні системи кредитування.
Таким чином, ера безкоштовних «AI-обідів» добігає кінця не через жадібність компаній, а тому, що обчислювальна економіка складного AI-асистування нарешті зрівнялася із ціновими моделями.