ШІ 2026-05-20 2 хв читання Джерело: The-decoder 9

Gemini 3.5 Flash від Google стає дорожчим за конкурентів OpenAI та Anthropic

Google Deepmind представив Gemini 3.5 Flash — нову модель штучного інтелекту, яка є найшвидшою у своєму класі та забезпечує понад 280 токенів виводу за секунду. Однак ця швидкість має високу ціну: операційні витрати моделі зросли до 5,5 раза порівняно з її попередником.

Gemini 3.5 Flash від Google стає дорожчим за конкурентів OpenAI та Anthropic

Нова версія Flash від Google Deepmind є значним кроком у розвитку сімейства моделей Gemini. Раніше Flash позиціонувалася як швидка та бюджетна альтернатива потужнішим моделям Pro від Google. Проте, аналіз компанії Artificial Analysis показав суттєве підвищення вартості використання цієї моделі в тестових сценаріях.

Зростання витрат: ціни на токени зросли утричі

Хоча Gemini 3.5 Flash демонструє покращення, її вартість експлуатації значно вища. За аналізом Artificial Analysis, для запуску Gemini 3.5 Flash потрібно витратити в 5,5 раза більше коштів у бенчмарках порівняно з Gemini 3 Flash та майже вдвічі більше, ніж модель Pro Gemini 3.1. Самі ціни на токени зросли утричі: Google тепер вимагає $1,50 за мільйон вхідних токенів і $9,00 за мільйон вихідних токенів, порівняно з $0,50 та $3,00 для Gemini 3 Flash.

Проте, фактичні витрати можуть бути ще вищими. Оскільки агентські завдання (agent-based tasks) споживають значно більше токенів, загальні витрати на Gemini 3.5 Flash в тестових умовах перевищують вартість моделі Gemini 3.1 Pro на 75 відсотків. Це ставить під сумнів економічну ефективність цієї нової версії.

Конкурентний ландшафт та тренди ринку ШІ

Зростання цін Google є частиною ширшого галузевого тренду. Anthropic Opus 4.7 також зазнала прихованого підвищення ціни на приблизно 30–40 відсотків порівняно з попередником, що пов'язано зі зростанням споживання токенів. OpenAI GPT 5.5 збільшила свої ціни ще більше — на 50–90 відсотків порівняно з версією 5.4. У випадку OpenAI споживання токенів знизилося, але базові ціни були підвищені.

Для розробників та корпорацій чиста вартість токена стає менш релевантною метрикою. Головним фактором стає ефективність моделі — скільки токенів їй насправді потрібно, щоб виконати завдання.

Покращення якості: відмінності в продуктивності

Gemini 3.5 Flash отримала оцінку 55 за Індексом інтелекту Artificial Analysis, що на дев'ять пунктів вище, ніж у Gemini 3 Flash. Це ставить її попереду Grok 4.3 (53) та Claude Sonnet 4.6 (52). Покращення помітні майже в кожній перевіреній категорії.

Зокрема, модель демонструє значні переваги у мультимодальних та агентських завданнях. Однак залишаються проблеми з програмуванням: Gemini 3.5 Flash явно відстає від конкурентів, таких як GPT 5.5 та Claude Opus 4.7.

Перспективи розвитку ШІ-ринку

Хоча бенчмарки відображають лише специфічні сценарії, справжня продуктивність моделі стає зрозумілою лише під час тривалого використання у повсякденних та нових завданнях. Зростання цін і фокус на ефективності змушують компанії шукати баланс між потужністю ШІ та фінансовою доцільністю.

Telegram Logo Читайте нас у Telegram: @proaiandevenmore