Groq отримала $650 мільйонів на розвиток інференсу ШІ від Nvidia

Groq, компанія-розробник спеціалізованого обладнання для ШІ, оголосила про залучення 650 мільйонів доларів від існуючих інвесторів для посилення свого бізнесу в сфері хмарних інференсів. Це фінансування відбувається через півроку після унікальної угоди на $20 мільярдів, яку Nvidia уклала з Groq. Ця транзакція не була повним придбанням компанії; замість цього, вона включала виплату інвесторам грошових коштів, ліцензування технології чипів Groq та переведення кількох ключових старших інженерів до Nvidia. Після цієї стратегічної реорганізації Groq зосередилася на відновленні своєї діяльності навколо моделі 'inference-as-a-service'. Інференс — це процес обробки даних після того, як користувач подав запит ШІ (наприклад, відповідь Claude чи ChatGPT). Цей ринок значно випереджає тренування моделей і вимагає спеціалізованих кремнієвих рішень. Groq стверджує, що її архітектура LPU забезпечує вищу швидкість та нижчі витрати на токени порівняно з традиційними GPU від Nvidia.

За даними Thenextweb, Groq шукає фінансування у розмірі 650 мільйонів доларів серед своїх поточних інвесторів для підтримки свого бізнесу хмарних інференсів. Це рішення є прямим наслідком стратегічного маневру Nvidia у грудні минулого року, який був нетиповим для галузі. Замість поглинання компанії, Nvidia здійснила фінансове «скидання» Groq: вона виплатила інвесторам гроші за максимально високою ціною та отримала ліцензію на технології чипів Groq, а також найняла висококваліфікованих інженерів.

Інференс як домінуючий ринок ШІ

Сфера обробки запитів (інференсу) стала критично важливішою за тренування моделей. Кожен запит користувача, будь то через ChatGPT чи AI-агента, вимагає потужної обчислювальної спроможності. Економіка цього процесу схиляє до використання спеціалізованих кремнієвих рішень, які можуть генерувати токени швидше та дешевше, ніж універсальні GPU. Архітектура LPU від Groq була розроблена саме для цього робочого навантаження.

Компанія вже постачала свої чипи різним провайдерам моделей і хмарним клієнтам. Швидкість інференсу, виміряна в токенах за секунду, постійно демонструвала перевагу Groq над рішеннями на базі GPU Nvidia при порівнянні цін. Попри те, що компанія була технічно ослаблена відходу ключового персоналу до Nvidia, вона фокусується на вужчій, але потенційно дуже прибутковій моделі інференсу як послуги (inference-as-a-service).

Конкуренція та ринкові виклики

Ринок чипів для інференсу приваблює капітал екстраординарними темпами. Наприклад, компанія Cerebras вийшла на біржу з оцінкою у 95 мільярдів доларів завдяки оптимізації під інференс. Проте Groq стикається зі значними викликами. З одного боку, DeepSeek нещодавно знизила ціни на V4 Pro на 75%, що створює тиск на економіку доходів за токен. З іншого — Nvidia активно розвиває власні можливості в сфері інференсу. Платформи Blackwell та майбутня Vera Rubin розроблені для того, щоб зменшити технологічну перевагу Groq.

Ця раунд фінансування на $650 мільйонів є ставкою: чи зможе Groq відновити свій інженерний потенціал, масштабувати хмарну платформу та зберегти економічну вигоду проти як покращень апаратного забезпечення Nvidia, так і агресивних знижень цін з боку провайдерів моделей. Інвестори, які отримали гроші від угоди на $20 мільярдів, тепер мають можливість поставити ще один капітал у меншу та більш сфокусовану версію цієї компанії.

Інференс як домінуючий ринок ШІ

Конкуренція та ринкові виклики

Свіжі новини у нашому Telegram