Як повідомляє Letsdatascience, CEO OpenAI Sam Altman під час трансляції про корпоративне впровадження звернув увагу на феноменальне зростання обсягів використання токенів. Він зазначив, що лідер серед користувачів OpenAI споживає приблизно 100 мільярдів токенів на місяць. Цей показник значно вищий за дані шести півкроків тому, коли топ-користувач використовував лише близько 100 тисяч токенів на місяць, що становить зростання приблизно у 1 000 000 разів.
Виклики масштабування та внутрішня культура
Цей рівень споживання не є ізольованим. Business Insider документує існування внутрішнього «token leaderboard» в OpenAI, де фіксуються надзвичайно великі обсяги. Згідно з цими даними, були зафіксовані випадки використання 603 мільярдів токенів протягом 30 днів та 210 мільярдів токенів лише за тиждень. Altman сам визнав, що такі витрати стали «раптово величезною проблемою» для клієнтів і попередив про майбутні інфраструктурні виклики.
Технічні наслідки високого споживання
Швидке зростання токенів на користувача створює подвійний тиск на інженерних командах. Це стосується як підтримки стабільного обчислення для інференсу, так і необхідності зберігання стану для довготривалих сесій або агентських систем. Споживання в масштабах 100 мільярдів токенів на місяць свідчить про активне використання потокового інференсу, великих контекстних вікон чи високочастотних взаємодій з агентами.
Для фахівців галузі, які стикаються зі схожими масштабами, вирішення полягає у:
- Оптимізації токенів (quantization, caching, distilled models).
- Впровадженні пакетної обробки та асинхронних пайплайнів.
- Багаторівневому обслуговуванні для контролю одиничних витрат.
Зміна парадигми в корпоративному секторі
Цей епізод демонструє, як корпоративне впровадження зміщує фокус обговорень з можливостей функціоналу на безперервне управління витратами. Згідно зі словами Yahoo Finance, існують приклади, коли фінансові директори випадково генерували рахунки на 500 мільйонів доларів під час експериментів із великомасштабним використанням.
Наступні місяці спостерігатимуть зміни у ціноутворенні вендорів, появу механізмів обмеження швидкості (rate-limiting) на рівні продукту та розвиток інструментарію для оптимізації витрат. Ці операційні важелі стануть ключовими для зменшення несподіваних рахунків і підвищення ROI при великомасштабному розгортанні.