ШІ Читати оригінал на Letsdatascience 1 хв читання 0

Sam Altman: Як корпорації споживають мільярди токенів у OpenAI

Sam Altman, CEO OpenAI, виявив експоненційне зростання споживання токенів у корпоративному секторі. За його словами, лідер серед користувачів OpenAI щомісяця використовує близько 100 мільярдів токенів. Це свідчить про колосальний стрибок порівняно з показниками шести півкроків тому. Збільшення обсягів викликів створює серйозний інфраструктурний виклик та перетворює питання функціоналу на критичне управління витратами для великих підприємств.

Сем Альтман у шкіряній куртці демонструє невеликий токен або чип на темному фоні під час виступу.
Сем Альтман у шкіряній куртці демонструє невеликий токен або чип на темному фоні під час виступу. · Джерело зображення: Letsdatascience

Як повідомляє Letsdatascience, CEO OpenAI Sam Altman під час трансляції про корпоративне впровадження звернув увагу на феноменальне зростання обсягів використання токенів. Він зазначив, що лідер серед користувачів OpenAI споживає приблизно 100 мільярдів токенів на місяць. Цей показник значно вищий за дані шести півкроків тому, коли топ-користувач використовував лише близько 100 тисяч токенів на місяць, що становить зростання приблизно у 1 000 000 разів.

Виклики масштабування та внутрішня культура

Цей рівень споживання не є ізольованим. Business Insider документує існування внутрішнього «token leaderboard» в OpenAI, де фіксуються надзвичайно великі обсяги. Згідно з цими даними, були зафіксовані випадки використання 603 мільярдів токенів протягом 30 днів та 210 мільярдів токенів лише за тиждень. Altman сам визнав, що такі витрати стали «раптово величезною проблемою» для клієнтів і попередив про майбутні інфраструктурні виклики.

Технічні наслідки високого споживання

Швидке зростання токенів на користувача створює подвійний тиск на інженерних командах. Це стосується як підтримки стабільного обчислення для інференсу, так і необхідності зберігання стану для довготривалих сесій або агентських систем. Споживання в масштабах 100 мільярдів токенів на місяць свідчить про активне використання потокового інференсу, великих контекстних вікон чи високочастотних взаємодій з агентами.

Для фахівців галузі, які стикаються зі схожими масштабами, вирішення полягає у:

  • Оптимізації токенів (quantization, caching, distilled models).
  • Впровадженні пакетної обробки та асинхронних пайплайнів.
  • Багаторівневому обслуговуванні для контролю одиничних витрат.

Зміна парадигми в корпоративному секторі

Цей епізод демонструє, як корпоративне впровадження зміщує фокус обговорень з можливостей функціоналу на безперервне управління витратами. Згідно зі словами Yahoo Finance, існують приклади, коли фінансові директори випадково генерували рахунки на 500 мільйонів доларів під час експериментів із великомасштабним використанням.

Наступні місяці спостерігатимуть зміни у ціноутворенні вендорів, появу механізмів обмеження швидкості (rate-limiting) на рівні продукту та розвиток інструментарію для оптимізації витрат. Ці операційні важелі стануть ключовими для зменшення несподіваних рахунків і підвищення ROI при великомасштабному розгортанні.

Контекст для України

Для українських AI-стартапів та розробників це означає підвищення бар'єру входу. Якщо великі корпоративні клієнти вимагають такого рівня токен-ефективності, локальні компанії, як Reface чи Grammarly, повинні інтегрувати оптимізацію на рівні API, щоб утримувати конкурентну ціну для українського ринку. Доступність потужних моделей залишається прив'язаною до обсягів витрат; тому зростання цін і необхідність складного cost governance може сповільнити розвиток місцевих AI-продуктів та збільшити операційні витрати для менших команд.
Telegram

Свіжі новини у нашому Telegram

Отримуйте миттєві сповіщення про нові публікації в рубриці «ШІ»

@proaiandevenmore