За даними Blog Google, представлені моделі демонструють революційний підхід до взаємодії людини та ШІ. Gemini Omni виходить за межі традиційних генеративних систем, пропонуючи користувачам інструмент для створення високоякісних відеороликів, які ґрунтуються на реальних знаннях Gemini про світ. Це дозволяє не просто генерувати контент, а й активно керувати ним у режимі діалогу.
Редагування відео через розмову з Omni
Ключова перевага Gemini Omni полягає в тому, що вона спрощує процес редагування відео за допомогою природної мови. Кожна наступна інструкція будується на попередній, забезпечуючи стабільність персонажів і збереження фізичних законів у сцені. Це дозволяє користувачеві трансформувати навколишнє середовище або змінювати конкретні деталі без втрати контексту початкового відеоряду.
Наприклад, якщо ви знімаєте відео, Omni може виконати запит: «Зроби скульптуру з бульбашок» або «Погаси світло в кімнаті». Це перетворює ваше відео на стартову точку для творчих ідей, які раніше були неможливі у звичайному продакшені.
Gemini 3.5 Flash: Агентські завдання та інтерактивні інтерфейси
Модель Gemini 3.5 Flash розроблена для виконання агентських завдань у великих масштабах, демонструючи інтелект, що зрівнює її із флагманськими моделями, але при цьому зберігаючи швидкість серії Flash. Завдяки використанню системи Antigravity, 3.5 Flash стає потужним рушієм для розгортання колаборативних субд-агентів, які вирішують складні проблеми.
Можливості Gemini 3.5 Flash охоплюють широкий спектр застосувань:
- Виконання багатоетапних робочих процесів та завдань кодування під наглядом користувача.
- Створення більш багатих та інтерактивних веб-інтерфейсів і графіки, демонструючи різні UX-підходи до процесу оформлення за 60 секунд у AI Studio.
- Виконання ролі моделі за замовчуванням для програми Gemini та режиму ШІ в пошуку глобально.
Покращені можливості агентського кодування 3.5 Flash забезпечують ще більш інтелектуальний досвід щодня, перетворюючи його на інструмент високої продуктивності.