Перехід Karpathy є значним професійним кроком і важливим подійним сигналом у гонитві між провідними компаніями у сфері штучного інтелекту. Він приєднується до команди pre-training Anthropic, яку очолює Nick Joseph. Головна мета його нової групи — реалізувати надзвичайно рекурсивне завдання: використовувати Claude для прискорення досліджень претренінгу.
Що таке претренінг і чому він такий важливий
Претренінг — це масовий, ресурсомісткий етап, який надає передовій моделі її основних знань та можливостей. Це найдорожча частина створення таких систем, як Claude. Знаходження способів зробити цей процес швидшим і ефективнішим може кардинально змінити економіку всієї AI-індустрії.
Кар'єра Karpathy: від Stanford до Tesla
Karpathy має глибокий досвід у сфері глибокого навчання. Він здобув докторський ступінь у Stanford під керівництвом Fei-Fei Li, науковиці, яка розробила ImageNet, зосередившись на комп'ютерному зорі та глибокому навчанні. У 2015 році він був серед 11 осіб, які співзаснували OpenAI. Після роботи над дослідженнями у компанії він покинув її у 2017 році, щоб приєднатися до Tesla як директор з AI. Там Karpathy керував командами комп'ютерного зору для програм Full Self-Driving та Autopilot, що є основою амбіцій автомобільного виробника щодо автономних транспортних засобів.
Контекст ринку: гонитва талантів
Таймінг цього переходу є надзвичайно значущим. Anthropic виступає як магніт для висококласного технічного таланту саме в той момент, коли його головний конкурент, OpenAI, переживає низку публічних відходів серед старших керівників і дослідників. За останні два роки OpenAI втратила понад десяток ключових виконавців, включаючи CTO Mira Murati та піонера у сфері reinforcement learning John Schulman. Для Anthropic залучення Karpathy підтверджує здатність компанії приваблювати найкращі таланти у міру масштабування як досліджень, так і комерційних операцій.
Перспективи рекурсивного самовдосконалення
Нова роль Karpathy також підкреслює ширший тренд у передовій AI: використання вже існуючих моделей для покращення наступних поколінь. Якщо Claude зможе значно пришвидшити власний пайплайн претренінгу, це стане практичною демонстрацією рекурсивного самовдосконалення — однієї з можливостей, яку давно уважно спостерігає спільнота AI-безпеки. Це повернення до лабораторії Karpathy підкреслює його відданість створенню моделей на передовій.