За даними Nvidianews, компанія NVIDIA представила процесор Vera, який вирішує ключову проблему сучасних AI-фабрик: необхідність високопродуктивного та енергоефективного апаратного забезпечення для роботи автономних агентів. Це не просто оновлення існуючої архітектури; це створення нового класу процесорів, оптимізованих під парадигму агентивної системи, де ШІ виконує складні багатоетапні завдання.
Перехід від інференсу до дій
Традиційні моделі штучного інтелекту часто фокусуються на інференсі — тобто генерації відповідей. Однак Vera призначений для ери, коли агенти повинні не лише генерувати текст, а й взаємодіяти зі світом: виконувати код, аналізувати результати та приймати рішення. Це вимагає значно більшої обчислювальної потужності на рівні CPU порівняно з попередніми завданнями.
Згідно з тестуванням Phoronix, NVIDIA Vera продемонстрував найвищу загальну продуктивність серед агентських робочих процесів. Ці робочі процеси включають компіляцію коду, обробку даних у Python та Java і роботу з базами даних — завдання, які знаходяться в критичній зоні сучасних AI-фабрик.
Економіка токенів: нові вимоги до обладнання
Економічна модель AI-фабрик змінюється: акцент зміщується від кількості ядер на долар до кількості токенів на долар. Це вимагає процесорів, які можуть забезпечити високу пропускну здатність і швидкість реакції для підтримки інтерактивності агентів. Vera відповідає цим вимогам, підвищуючи ефективність обробки даних у центрах обробки.
- Спеціалізація під агенти: Vera був розроблений для роботи з AI-агентами на гіпермасштабі (hyperscale), забезпечуючи виняткову продуктивність та програмованість.
- Ключові партнери: Серед клієнтів, які досліджують можливості Vera, є фінансовий лідер NYSE, який планує використовувати чипи для оптимізації латентності при обробці понад 1.1 трильйона повідомлень щодня.
- Інтеграція в інфраструктуру: Системні виробники світового рівня, такі як Dell Technologies, HPE та Lenovo, вже інтегрують Vera у свої рішення для AI-інфраструктури.
Як зазначив James Bradbury, керівник відділу обчислень Anthropic, «Масштабування обчислювальних потужностей є важливим каталізатором зростання моделей. Ми раді бачити, як Vera виходить на ринок як перспективна частина екосистеми для вирішення агентських завдань».
Таким чином, впровадження NVIDIA Vera сигналізує про перехід індустрії від простого збільшення розміру мовних моделей до створення складних, самостійних систем, що вимагають радикально нової архітектури обчислень. Цей процесор є ключовим елементом у побудові наступного покоління AI-суперкомп'ютерів.