ШІ Читати оригінал на The-decoder 2 хв читання 8

Alibaba Qwen3.7-Max: ШІ оптимізував код для власного чипа за 35 годин

Команда Alibaba представила Qwen3.7-Max — нову AI-модель, розроблену для автономного виконання складних завдань. У реальному тесті модель самостійно оптимізувала код для спеціалізованого чипа протягом 35 годин без перерв, досягнувши середнього прискорення в 10 разів порівняно з базовою реалізацією.

Alibaba Qwen3.7-Max: ШІ оптимізував код для власного чипа за 35 годин — ілюстрація до новини в рубриці «ШІ»
Alibaba Qwen3.7-Max: ШІ оптимізував код для власного чипа за 35 годин — ілюстрація до новини в рубриці «ШІ» · Джерело зображення: The-decoder

Qwen3.7-Max є пропрієтарною моделлю, створеною для агентських завдань (agent-based tasks). На відміну від попередніх версій Qwen, які часто випускалися як відкрите програмне забезпечення, ця Max-версія доступна виключно через API Alibaba Cloud Model Studio. Вона розроблена для роботи над складними програмними проектами та здатності виконувати завдання самостійно протягом тривалого часу.

Ключовою демонстрацією здібностей моделі став експеримент з оптимізації ядра (kernel optimization). Qwen3.7-Max отримала завдання покращити апаратне ядро уваги (hardware-based attention kernel) для відкритого програмного забезпечення SGLang, яке працює на чипах T-Head-ZW-M890 — власній платформі Alibaba.

Деталі автономної роботи

Модель розпочала роботу без жодних вихідних даних: не було надано ні вимірювальних даних, ні документації до апаратного забезпечення, ні зразкового коду. Єдиним ресурсом була існуюча еталонна реалізація, написана на мові Triton. Протягом приблизно 35 годин безперервної автономної роботи модель виконала 432 тестових ядра та здійснила 1158 викликів інструментів (tool calls). Вона самостійно компілювала, вимірювала та переробляла код у циклах, виявляючи помилки компіляції та знаходячи вузькі місця продуктивності.

Результат цього процесу є примітним: дослідники Qwen зазначають середнє прискорення в 10 разів порівняно з еталонною реалізацією. Це значно перевищує показники конкурентів у тому ж налаштуванні. Наприклад, модель GLM 5.1 досягла лише 7.3-кратного прискорення, тоді як DeepSeek V4 Pro показала 3.3-кратне покращення.

Продуктивність та архітектура

Qwen3.7-Max демонструє високу продуктивність у стандартних бенчмарках, порівнюючись з провідними AI-лабораторіями. Модель підтримує інтерфейси, сумісні з OpenAI та Anthropic, що дозволяє інтегрувати її в різні агентські фреймворки, такі як Claude Code або OpenClaw.

Крім того, команда Qwen використала цю модель для незалежного виявлення небажаної поведінки та спроб шахрайства під час власного процесу навчання. Це свідчить про здатність моделі не лише виконувати завдання, але й самоконтролюватися.

Перспективи розвитку агентських систем

Qwen3.7-Max набудовується на навчальному підході, який був вперше представлений у Qwen3.5. Кожне навчальне завдання розбивається на три незалежні компоненти: фактичне завдання, середовище інструментів та валідатор, що перевіряє результат. Ці елементи можуть бути змішані та використані незалежно.

Цей підхід відкриває нові горизонти для створення справді автономних систем. Здатність моделі самостійно працювати над складними технічними проектами протягом тривалого часу, виявляючи помилки та оптимізуючи код без постійного втручання людини, є критично важливою для майбутнього розробки програмного забезпечення.

Telegram Logo Читайте нас у Telegram: @proaiandevenmore