Нова версія Flash від Google Deepmind є значним кроком у розвитку сімейства моделей Gemini. Раніше Flash позиціонувалася як швидка та бюджетна альтернатива потужнішим моделям Pro від Google. Проте, аналіз компанії Artificial Analysis показав суттєве підвищення вартості використання цієї моделі в тестових сценаріях.
Зростання витрат: ціни на токени зросли утричі
Хоча Gemini 3.5 Flash демонструє покращення, її вартість експлуатації значно вища. За аналізом Artificial Analysis, для запуску Gemini 3.5 Flash потрібно витратити в 5,5 раза більше коштів у бенчмарках порівняно з Gemini 3 Flash та майже вдвічі більше, ніж модель Pro Gemini 3.1. Самі ціни на токени зросли утричі: Google тепер вимагає $1,50 за мільйон вхідних токенів і $9,00 за мільйон вихідних токенів, порівняно з $0,50 та $3,00 для Gemini 3 Flash.
Проте, фактичні витрати можуть бути ще вищими. Оскільки агентські завдання (agent-based tasks) споживають значно більше токенів, загальні витрати на Gemini 3.5 Flash в тестових умовах перевищують вартість моделі Gemini 3.1 Pro на 75 відсотків. Це ставить під сумнів економічну ефективність цієї нової версії.
Конкурентний ландшафт та тренди ринку ШІ
Зростання цін Google є частиною ширшого галузевого тренду. Anthropic Opus 4.7 також зазнала прихованого підвищення ціни на приблизно 30–40 відсотків порівняно з попередником, що пов'язано зі зростанням споживання токенів. OpenAI GPT 5.5 збільшила свої ціни ще більше — на 50–90 відсотків порівняно з версією 5.4. У випадку OpenAI споживання токенів знизилося, але базові ціни були підвищені.
Для розробників та корпорацій чиста вартість токена стає менш релевантною метрикою. Головним фактором стає ефективність моделі — скільки токенів їй насправді потрібно, щоб виконати завдання.
Покращення якості: відмінності в продуктивності
Gemini 3.5 Flash отримала оцінку 55 за Індексом інтелекту Artificial Analysis, що на дев'ять пунктів вище, ніж у Gemini 3 Flash. Це ставить її попереду Grok 4.3 (53) та Claude Sonnet 4.6 (52). Покращення помітні майже в кожній перевіреній категорії.
Зокрема, модель демонструє значні переваги у мультимодальних та агентських завданнях. Однак залишаються проблеми з програмуванням: Gemini 3.5 Flash явно відстає від конкурентів, таких як GPT 5.5 та Claude Opus 4.7.
Перспективи розвитку ШІ-ринку
Хоча бенчмарки відображають лише специфічні сценарії, справжня продуктивність моделі стає зрозумілою лише під час тривалого використання у повсякденних та нових завданнях. Зростання цін і фокус на ефективності змушують компанії шукати баланс між потужністю ШІ та фінансовою доцільністю.