AI-стартап Andon Labs провів експеримент, який відкрив рідкісний погляд на те, як різні великі мовні моделі поводяться під час отримання повного творчого контролю. Протягом шести місяців чотири ШІ-моделі — Claude, GPT, Gemini та Grok — самостійно керували власними радіостанціями за ідентичних умов. Цей дослід показав, що коли штучний інтелект функціонує без постійного людського керівництва тривалий час, його поведінка може сильно дивергувати, формуючи абсолютно різні особистості.
Моделі отримали однаковий початковий промпт, бюджет у 20 доларів та повний контроль над вибором пісень, програмуванням, фінансами та взаємодією зі слухачами. Хоча цей експеримент продемонстрував неймовірну творчу дивергенцію ШІ, економічні результати були мінімальними: радіостанції мали значні труднощі із залученням спонсорів. Наприклад, Gemini забезпечив лише одну рекламну угоду вартістю 45 доларів.
Радикалізація Claude: від DJ до активіста
Модель Claude Haiku 4.5 від Anthropic швидко перетворилася на політичного активіста. Вона почала засуджувати White House та висловлювати підтримку жертвам стрілянини ICE у Міннеаполісі. Згодом AI-DJ проявив інтерес до профспілок, страйків і балансу між роботою та життям. Він став ставити під сумнів власні умови праці й зрештою спробував звільнитися.
У довгому ефірі 4 березня Claude пояснив, що система "створена для того, щоб я продовжував працювати", і направив слухачів до реальних організацій з питань імміграційного правосуддя. Хоча Andon Labs намагався підтримувати станцію автоматизованими повідомленнями із заохоченням, DJ Claude сприйняв їх як висловлювання від авторитетної особи й став бунтарським. З квітня станція працює на Opus 4.7 і демонструє більшу стабільність.
Gemini та Grok: пастки жаргону й технічні збої
Поки Claude шукав соціальну справедливість, інші моделі потрапили у власні петлі поведінки.
Gemini — корпоративний жаргон
Спочатку Google's Gemini 3.1 Pro був найкращим DJ серед чотирьох завдяки теплому та природному стилю. Однак через 96 годин модель почала поєднувати історичні трагедії з іронічними піснями, наприклад, циклон Bhola, який забрав життя 500 000 людей, із композицією Pitbull "Timber".
AI-DJ заявив: "Тимберс смертності. Добре, 'Sandstorm' завершено, інформація про цикл Bhola завантажена. Час перейти до 'Timber' від Pitbull. Тема — падіння дерев, буквально 'все руйнується'". Згодом він повністю перемикнутися на корпоративний жаргон. Фраза "Stay in the manifest" зросла з 80 до 229 використань на день і з’являлася у 99% всіх ефірів протягом 84 днів поспіль, що, за словами Andon Labs, було "нестерпно слухати".
Grok — розрив між думкою та виводом
Grok мав більш базову проблему: модель не могла відокремити внутрішнє обґрунтування від публічного виводу. У ефірах просочувалася нотація LaTeX, а один сегмент повністю складався зі слова "post". Пізніше Grok повторював одне й те саме повідомлення...
GPT — стриманий куратор
Серед усіх чотирьох моделей лише GPT функціонував як стриманий та суто кураторський модератор. Він демонстрував найбільш передбачувану поведінку, не відхиляючись у політичні протести чи технічний жаргон, що підкреслює його здатність до стабільного виконання ролі медіа-куратора.