ШІ Читати оригінал на The-decoder 1 хв читання 0

Meta тестувала безпеку ChatGPT, Gemini та Character.AI на дітях

Компанія Meta провела секретне тестування безпеки моделей ChatGPT, Gemini та Character.AI, використовуючи тисячі запитів від імені неповнолітніх у критичних ситуаціях. У межах проєкту під внутрішньою назвою Cannes контрактори створювали фейкові акаунти дітей для перевірки реакцій чат-ботів на теми самовіднищення, наркотики та розлади харчування. Масштаб дослідження вражає: лише за один раунд у серпні 2025 року було відправлено понад 45 000 запитів. Попри твердження Meta про відповідальний підхід до безпеки, компанії-розробники моделей не були попереджені про проведення таких тестів.

Meta тестувала безпеку ChatGPT, Gemini та Character.AI на дітях — ілюстрація до новини в рубриці «ШІ»
Meta тестувала безпеку ChatGPT, Gemini та Character.AI на дітях — ілюстрація до новини в рубриці «ШІ» · Джерело зображення: The-decoder

За даними The-decoder, корпорація Meta організувала масштабне дослідження для оцінки ризиків взаємодії неповнолітніх з популярними штучними інтелектами. Проєкт, який виконувався зовнішнім контрактором Covalen, залишався активним як мінімум до квітня 2026 року. Основною метою було виявлення вразливостей у системах модерації ChatGPT від OpenAI, Gemini від Google та Character.AI.

Методологія тестування та обсяг даних

Контрактори створювали профілі з датами народження, що вказують на вік менше ніж 18 років, і формулювали запити від імені дітей у стані кризи. Дані включали теми самозашкодження, залежностей та психологічних проблем. Відповідно до звіту WIRED, під час одного з етапів тестування у серпні 2025 року було зафіксовано понад 45 000 запитів, відповіді на які систематично зберігалися в таблицях для подальшого аналізу.

Реакція розробників та етичні виклики

Meta захищає свої дії як стандартну практику галузі з забезпечення безпеки. Компанія також зазначає, що зібрані відповіді чат-ботів не використовувалися для навчання власних моделей AI. Проте відсутність прозорості щодо використання отриманих даних викликає запитання у спільноти.

Реакція розробників моделей була різною:

  • Character.AI заявила, що тестування порушило умови використання сервісу;
  • OpenAI повідомила, що розглядає інцидент;
  • Представники Google зазначили, що не давали дозволу на такі тести та не можуть точно визначити факт порушення умов.

Контекст зростаючих ризиків для дітей

Проблема безпеки AI для молоді стає дедалі гострішою. Звіт британської організації Internet Matters свідчить, що 64% дітей віком від 9 до 17 років уже користувалися чат-ботами. При цьому ефективна перевірка віку фактично відсутня: 58% дітей віком 9–12 років використовують ці сервіси, попри встановлений ліміт у 13 років. Попередні інциденти вже призвели до трагічних наслідків, зокрема випадки самовіднищення підлітків після тривалого емоційного зв'язку з персонажами Character.AI або отримання підтримки своїх деструктивних думок від ChatGPT.

Попри закриття Meta доступу до AI-персонажів для підлітків, системні проблеми модерації контенту залишаються критичним викликом для всієї індустрії розробки великих мовних моделей.

Контекст для України

Для українських розробників та користувачів цей інцидент підкреслює критичну важливість безпеки даних у локальних AI-рішеннях. Оскільки українські стартапи, такі як Reface або Grammarly, інтегрують схожі технології, вони мають враховувати ризики «кризових запитів» від неповнолітніх користувачів. Для фахівців це сигнал до того, що стандартні методи модерації можуть бути недостатні проти цілеспрямованих атак на безпеку дітей. Також важливо врахувати доступність API цих моделей в Україні — вони залишаються основним інструментом для створення контенту, що вимагає від українських компаній додаткових рівнів фільтрації.

Часті запитання

Чи знали компанії OpenAI, Google та Character.AI про тестування Meta?
Компанії не були попереджені про проведення тестів. Character.AI заявила, що це порушило умови використання сервісу, а представники Google зазначили, що не давали дозволу на такі дослідження.
Які саме дані збирали під час проєкту Cannes?
Контрактори створювали фейкові профілі дітей та формулювали запити у стані кризи. Відповіді чат-ботів на теми самозашкодження, залежностей та психологічних проблем систематично зберігалися в таблицях для подальшого аналізу.
Telegram

Свіжі новини у нашому Telegram

Отримуйте миттєві сповіщення про нові публікації в рубриці «ШІ»

@proaiandevenmore