Судебный процесс между Илоном Маском и Сэмом Альтманом продолжает выдавать неожиданные подробности из ранней истории OpenAI. Среди новых откровений – участие главы Valve Гейба Ньюэлла в финансировании организации и роль Microsoft в обеспечении вычислительными ресурсами для одного из самых амбициозных ИИ-экспериментов того времени.
Широкую публику OpenAI всерьёз заинтересовала в 2017 году, когда один из её ботов в матче 1v1 победил профессионального игрока в Dota 2 – Данила "Dendi" Ишутина на турнире The International. Это был упрощённый прототип, но он дал старт куда более масштабному эксперименту. Из него вырос OpenAI Five – бот, обучавшийся в режиме, эквивалентном 180 годам игрового времени ежедневно. Цель была амбициозной: победить команду людей в полноценном матче 5v5. И она была достигнута.
В 2018 году Гейб Ньюэлл обсуждал с Илоном Маском ИИ и нейроимпланты и просил устроить экскурсию по SpaceX для Хидео Кодзимы
В 2018 году OpenAI Five провёл три показательных матча против команды профессиональных игроков. Результат оказался убедительным: ИИ победил в двух встречах, хотя третью проиграл – Twitch-чат намеренно навязал боту откровенно слабый состав героев. Один из участников матча, MoonMeander, описал момент из второй игры так:
Был момент, когда я уже почти убивал Лиона через земляной разлом, но курьер в буквально идеальный фрейм доставил ему зелье лечения, и оно мгновенно применилось. Ни один человек не смог бы так.
Для тренировки системы потребовалось 256 видеокарт и 128 000 процессорных ядер. Теперь, благодаря материалам судебного разбирательства, стало известно, откуда брались эти ресурсы. Согласно документу, подготовленному юристами Маска, Илон лично звонил главе Microsoft Сатье Наделле с просьбой предоставить ему дополнительные вычислительные ресурсы с существенной скидкой. Наделла согласился – и это произошло задолго до масштабных инвестиций Microsoft в OpenAI.
Наделла явно следил за ходом эксперимента с Dota 2. Согласно тем же документам, в день победы бота – 11 августа 2017 года – он лично поздравил Маска, Альтмана и других ключевых сотрудников по электронной почте. Маск ответил: "Действительно, очень ценно. Позабочусь о том, чтобы люди узнали о помощи Microsoft."
Отдельного внимания заслуживает электронное письмо от 23 апреля 2018 года, которое Шивон Зилис отправила Маску. Зилис – венчурный инвестор в сфере технологий, входившая в совет директоров OpenAI вплоть до 2023 года, а также мать четверых детей Маска. В тот момент она одновременно работала в OpenAI и держала Маска в курсе происходящего. В письме под рубрикой "Технологии" она ссылается на слова Сэма Альтмана и предполагает прямую связь между прогрессом в Dota 2 и приближением к AGI – общему искусственному интеллекту. Сейчас на дворе 2026 год, AGI по-прежнему нет, так что гипотеза не подтвердилась.
Некоторые присяжные по делу Маска против Альтмана ненавидят Илона и считают его "жадным расистским гомофобным куском дерьма", но судья не видит в этом никаких проблем
Куда занятнее другая деталь из того же письма – упоминание Montezuma's Revenge, игры для Atari 2600 1981 года выпуска, которая превратилась в своеобразного белого кита для ИИ-исследователей. В знаковой работе 2015 года, где описывалось, как ИИ-агент самостоятельно осваивает аркады Atari, Montezuma's Revenge оказалась единственной игрой, в которой бот набрал 0% от среднего человеческого результата. Структура игры с её нелинейным исследованием, ловушками и редкими наградами попросту ломала стандартные подходы к обучению.
OpenAI вложила значительные усилия в разработку агента, способного пройти эту игру. В 2018 году компания опубликовала подробный разбор проблемы и представила модель с элементами "любопытства" – механизмом, побуждающим агента исследовать среду ради самого процесса, а не только ради награды.
Чтобы достичь желаемой цели, агент сначала должен изучить, что вообще возможно в его среде. Простые стратегии исследования крайне редко позволяют получить хоть какое-то вознаграждение или увидеть более нескольких из 24 комнат уровня.
Прорыв с Montezuma's Revenge в итоге всё же состоялся, но лишь в 2021 году – и уже другая команда исследователей добилась этого с помощью собственной системы на основе нескольких алгоритмов под общим названием Go-Explore.











