Як повідомляє Zdnet, ефективне використання AI-генераторів зображень вимагає не лише знання бажаного результату, але й розуміння того, як саме відповідна модель інтерпретує запит. Lance Whitney запропонував стратегію, при якій користувач надає чат-боту лише базову ідею — наприклад, «соняшник із листового металу в стилі олівцевого малюнка» — а потім просить AI створити повний, технічно вивірений промпт для відповідного генератора.
Методологія: LLM як інженер промптів
Whitney протестував цей підхід на прикладі Gemini та ChatGPT з їхніми релевантними генераторами зображень. Основна перевага цього процесу полягає в тому, що чат-бот, знаючи внутрішню логіку свого «колега», формулює запит максимально точно для досягнення бажаного візуального ефекту. Це дозволяє перейти від загальної концепції до високодеталізованої інструкції.
Порівняння результатів: Gemini проти ChatGPT
Результати експерименту показали, що обидві моделі здатні генерувати надзвичайно детальні промпти. Однак відмінності у фокусі були помітними. Коли Gemini отримав базовий запит, він повернув опис, який акцентував увагу на текстурі металу та видимих швах, додаючи багато загальних деталей: «малюнок олівцем металевого соняшника... з чітким зображенням текстури металу, з недосконалостями та видимими зварними швами». Це був детальний, але більш описовий підхід.
Натомість, промпт, згенерований ChatGPT для його генератора зображень, виявився ще більш технічним і сфокусованим на художній стилістиці. Він містив специфічні терміни: «деталізований олівцевий малюнок соняшника, сконструйованого з листового металу... Пелюстки сформовані з тонких, трохи вигнутих металевих пластин із видимими швами та заклепками. Центральна частина складається з багатошарових металевих текстур». Цей запит був оптимізований для досягнення високого контрасту світла і тіні та використання технік, як-от крос-хетчинг (cross-hatching), що підкреслює його придатність до професійного графічного рендерингу.
Whitney радить користувачам, якщо згенерований промпт виходить надто довгим, попросити чат-бота створити коротший варіант. Цей метод демонструє еволюцію взаємодії між LLM та генеративними моделями зображень, перетворюючи процес створення контенту на інтелектуальну співпрацю.
Таким чином, використання AI для оптимізації промптів є не просто лайфхаком, а новою парадигмою в робочому процесі цифрового дизайнера та маркетолога.