Google використовувала свою конференцію I/O для демонстрації нового покоління AI-продуктів. Серед найважливіших анонсів — випуск Gemini 3.5 Flash, яка позиціонується як швидша та більш економічно ефективна альтернатива. Окрім того, компанія представила Gemini Omni, що є новою мультимодальною системою для роботи з відео, зображеннями та текстом.
Ефективність і масштабування: переваги Gemini 3.5 Flash
Gemini 3.5 Flash значно перевершує попередню модель Gemini 3.1 Pro за більшістю бенчмарків, як зазначив CEO Google Sundar Pichai. Особливо виражений стрибок помітний у GDP Val — бенчмарку для завдань економічного значення. Аналіз від Artificial Analysis показав, що Flash є єдиною моделлю у верхньому правому квадранті за показниками інтелекту та швидкості, будучи у чотири рази швидшою за інші передові моделі.
Оптимізована версія, яка працює на внутрішній платформі Google Antigravity, є ще більш продуктивною — компанія стверджує, що вона може бути у дванадцять разів швидшою. З точки зору витрат, Gemini 3.5 Flash коштує приблизно третину або половину порівнянних моделей. Sundar Pichai розрахував: якщо компанії перенесуть до 80 відсотків своїх робочих навантажень на комбінацію 3.5 Flash та Pro, вони можуть заощадити понад мільярд доларів щорічно.
Gemini Omni: шлях до справжньої мультимодальності
Gemini Omni — це нова модель Google, розроблена для створення будь-якого виводу на основі будь-якого входу. На відміну від Veo, яка є чисто текстовою моделлю для генерації відео, Omni побудована на архітектурі Gemini та навчена як мультимодальна з самого початку, за словами Chief AI Architect Koray Kavukcuoglu. Це означає, що модель може брати власний згенерований вивід і подавати його назад як вхідні дані, дозволяючи багаторазове редагування.
Користувачі зможуть завантажувати власні відео, змінювати персонажів або стилі. Koray Kavukcuoglu зазначив, що Omni є узагальненням Veo, і шлях тепер послідовно веде до справжньої мультимодальності. Перша, швидша версія — Omni Flash — буде доступна в Gemini app, Flow та YouTube Shorts для підписників Google AI+, Pro та Ultra вже у середу.
Gemini Spark: агент, який ніколи не спить
Gemini Spark є особистим агентом від Google для кінцевих користувачів. За словами Josh Woodward, керівника команд Gemini app та AI Studio, він працює на виділених віртуальних машинах у Google Cloud, залишаючись доступним 24/7 і продовжуючи роботу у фоновому режимі навіть тоді, коли пристрій користувача вимкнено. Spark використовує Gemini 3.5 з повним пайплайном Antigravity для виконання завдань кодування.
Інтеграція з Gmail, Docs та іншими продуктами Workspace є частиною запуску. У найближчі тижні очікуються підключення MCP до сторонніх сервісів, а пізніше — інтеграція з Chrome. На Android для відображення того, що робить агент, буде впроваджено новий інтерфейс Android Halo у верхній частині екрана.
Перспективи розвитку AI-екосистеми Google
Анонси підкреслюють стратегічний зсув Google до створення повноцінних агентських систем. Фокус на Gemini 3.5 Flash та Omni свідчить про прагнення компанії забезпечити високу швидкість, економічну вигоду та глибоку мультимодальність у своїх продуктах. Постійне вдосконалення платформи Antigravity дозволяє моделям виконувати складні кодингові пайплайни автономно протягом кількох годин, що відкриває нові можливості для автоматизації бізнес-процесів.