Код Читати оригінал на Infoq 2 хв читання 8

xAI випустила Grok Skills: модель може виконувати складні робочі процеси

xAI представила нову функцію Grok Skills разом із покращеннями Responses API для Grok 4.3. Це дозволяє користувачам створювати постійні, персоналізовані навички та робочі процеси, які модель зберігає в усіх розмовах на платформі X, у застосунку iOS та Android.

xAI випустила Grok Skills: модель може виконувати складні робочі процеси — ілюстрація до новини в рубриці «Код»
xAI випустила Grok Skills: модель може виконувати складні робочі процеси — ілюстрація до новини в рубриці «Код»

Новий функціонал Grok Skills значно підвищує практичну цінність моделі xAI. Замість того, щоб надавати інструкції повторно при кожній взаємодії, користувачі можуть створити ці навички один раз за допомогою природної мови або завантаження файлів. Після цього Grok автоматично застосовує визначені робочі процеси, вподобання та процедури обробки документів.

Функціонал для кінцевих користувачів

Ці вбудовані можливості охоплюють повне створення та редагування документів Word зі збереженням заголовків, таблиць і стилів. Також Grok може генерувати презентації у стилі PowerPoint, включаючи візуальну ієрархію та нотатки доповідача. Крім того, модель підтримує роботу з електронними таблицями Excel — формули, аналіз даних, діаграми та умовне форматування. Операції з PDF також значно розширилися: тепер можна створювати, об'єднувати, розділяти файли, витягувати текст і реорганізовувати вміст.

Інтеграція для розробників

З точки зору розробників, Responses API інтегрує ці концепції через механізм tool calling, який відповідає формату OpenAI. При цьому додано нативне серверне виконання вбудованих інструментів xAI. Розробники можуть включати інструменти у запити до API, вказуючи їх типи — наприклад, web_search, x_search або code_interpreter для автоматичної обробки на інфраструктурі xAI. Коли Grok 4.3 визначає необхідність використання інструменту, він повертає структуровані об'єкти tool_call з ідентифікаторами та аргументами.

Технічні можливості та масштабування

Модель підтримує паралельне виконання кількох інструментів за замовчуванням, може обробляти до 128 інструментів за один запит і зберігає контекст у вікні розміром 1 мільйон токенів. Це дозволяє створювати вихідні дані, придатні для багатоетапних агентських завдань. Створені в інтерфейсі чату навички можуть доповнювати API-потоки, надаючи повторно використовувані інструкції, які розробники включають у системні промпти або управління станом.

Порівняння з конкурентами

Grok Skills відрізняється від подібних підходів від OpenAI Skills, Claude Skills та Vercel Agent Skills. Grok Skills виступає скоріше як повторно використовуваний рівень функціоналу та можливостей, а не як повністю розгортана автономна агентська система. На відміну від цього, Vercel Skills зосереджується на розширенні робочих процесів вебзастосунків, тоді як OpenAI та Anthropic зараз будують екосистеми навколо ширших моделей агентів і довготривалого контексту.

Перспективи розвитку

Реакція спільноти на X була змішаною: від захоплення до раннього тестування. Користувачі підкреслюють практичну цінність цих функцій для автоматизації робочих процесів. Це свідчить про тренд, коли автоматизація через кастомні навички стає стандартом у інструментах ШІ. Далі очікується активне впровадження Grok Skills у бізнес-середовищі та розширення їхньої інтеграції з зовнішніми сервісами.

Telegram Logo Читайте нас у Telegram: @procodeandevenmore