ШІ Читати оригінал на The-decoder 1 хв читання 0

OpenAI та Broadcom анонсували чип Jalapeño для інференсу LLM

Компанія OpenAI спільно з Broadcom анонсувала Jalapeño — перший спеціалізований «процесор інтелекту», розроблений виключно для інференсу великих мовних моделей. Цей кастомний чип має забезпечити значне покращення продуктивності на ват, що критично важливо для масштабування складних AI-систем. Масштабне розгортання обладнання планується до кінця 2026 року, причому Microsoft вже підтвердила готовність закупити 40 відсотків першої партії чипів.

Сем Альтман та Хок Тан тримають велику прозору нагороду з круглим дизайном у центрі, посміхаючись перед дерев’яною стінкою.
Сем Альтман та Хок Тан тримають велику прозору нагороду з круглим дизайном у центрі, посміхаючись перед дерев’яною стінкою. · Джерело зображення: The-decoder

За даними The-decoder, OpenAI та Broadcom офіційно представили Jalapeño — спеціалізований акселератор, який стане основою багатопокоєнної платформи для роботи з великими мовними моделями. Цей крок знаменує перехід OpenAI від чисто програмного забезпечення до контролю над повним технологічним стеком, включаючи власне залізо. Під час презентації CEO Broadcom Hock Tan та президент Charlie Kawwas передали першу пластину чипа керівництву OpenAI, зокрема Sam Altman та Greg Brockman.

Архітектурні особливості та виробничий цикл

На відміну від модифікованих універсальних процесорів, Jalapeño розроблявся з нуля саме під завдання інференсу сучасних LLM. OpenAI відповідає за архітектурне проектування чипа, тоді як Broadcom забезпечує технології виробництва кремнію та мережеві рішення, зокрема використання своїх Tomahawk networking chips. Інтеграцію систем, включаючи розробку плат, стійок та загальну збірку, виконуватиме компанія Celestica.

Особливою відміткою став надшвидкий цикл розробки: від першого проекту до готовності до виробництва (tape-out) минуло лише дев'ять місяців. OpenAI стверджує, що це найшвидший цикл створення високопродуктивних ASIC у галузі. Компанія змогла прискорити процес завдяки використанню власних моделей для оптимізації етапів проектування заліза.

Продуктивність та плани розгортання

Попередні тести показують, що Jalapeño демонструє «суттєво кращі» показники продуктивності на ват порівняно з поточними галузевими стандартами. Хоча офіційні цифри ще не фіналізовані і чекають на детальний технічний звіт, архітектура чипа спрямована на мінімізацію переміщення даних та максимізацію утилізації ресурсів до теоретичного максимуму. Наразі інженерні зразки вже використовуються в лабораторіях для виконання ML-навантажень, зокрема для моделі GPT-5.3-Codex-Spark.

Масштабне розгортання чипів планується на кінець 2026 року у масштабах гігаватів спільно з Microsoft та іншими партнерами. Для забезпечення першого етапу постачання Broadcom висунула вимогу до Microsoft гарантувати викуп 40 відсотків виробництва. Контроль над залізом дозволить OpenAI забезпечити швидшу, надійнішу та дешевшу роботу моделей у промисловому масштабі.

Контекст для України

Для українського ринку поява Jalapeño означає потенційне зниження вартості API для розробників завдяки оптимізації витрат на інференс. Це може зробити складніші моделі доступними для локальних стартапів, таких як Reface або MacPaw, які інтегрують AI у свої продукти. Оскільки Microsoft є ключовим партнером, українські компанії, що використовують Azure, можуть отримати доступ до потужніших обчислень швидше за інших. Крім того, це стимулює українських інженерів вивчати архітектуру спеціалізованих чипів замість стандартних рішень.

Часті запитання

Які компанії брали участь у створенні чипа Jalapeño?
За архітектурне проектування відповідає OpenAI, Broadcom забезпечує технології виробництва кремнію та мережеві рішення на базі своїх Tomahawk networking chips. Інтеграцію систем, включаючи розробку плат та стійок, виконуватиме компанія Celestica.
Для яких моделей вже використовуються зразки чипа?
Наразі інженерні зразки Jalapeño вже застосовуються в лабораторіях для виконання ML-навантажень, зокрема для роботи моделі GPT-5.3-Codex-Spark.
Коли планується масштабне розгортання нового обладнання?
Масштабне розгортання чипів у масштабах гігаватів спільно з Microsoft та іншими партнерами заплановано на кінець 2026 року.
Telegram

Свіжі новини у нашому Telegram

Отримуйте миттєві сповіщення про нові публікації в рубриці «ШІ»

@proaiandevenmore