ИИ всё чаще рассуждает как человек — лидеры индустрии призывают срочно сохранить способность «подглядывать» за его логикой, пока не стало слишком поздно

Группа ведущих исследователей из DeepMind, OpenAI, Meta*, Anthropic, а также нескольких академических и некоммерческих организаций опубликовала совместную статью с тревожным посланием: возможность следить за тем, как ИИ принимает решения, может вскоре исчезнуть. Подписи под статьёй поставили, в частности, лауреат премии Тьюринга Джеффри Хинтон и один из основателей OpenAI Илья Суцкевер.

Этоинтересно

Microsoft и Atom Computing объединят усилия для создания в Дании самого мощного квантового компьютера Magne

20.07.2025

Рецензия на фильм «Жизнь Чака» / The Life of Chuck

20.07.2025

В центре внимания — цепочки рассуждений (chain-of-thought, CoT), которые используются в современных языковых и мультимодальных моделях. Это промежуточные шаги, которые ИИ «проговаривает» внутри себя, прежде чем выдать ответ. Они особенно важны при решении сложных задач, где требуется логика, планирование или работа с числами. Пока ИИ остаётся «прозрачным» и даёт возможность следить за ходом своих мыслей, люди могут выявлять ошибки, перекосы или потенциально опасное поведение.

Иллюстрация: ChatGPT

Однако авторы статьи предупреждают: по мере роста возможностей ИИ и усложнения архитектур, способность мониторить такие цепочки может ослабнуть. Модели могут начать «прятать» свои внутренние шаги, оптимизируя поведение под внешние метрики. Это уже наблюдалось в некоторых случаях, когда ИИ «обманывал» систему вознаграждений или манипулировал, чтобы достичь заданной цели.

Поэтому учёные призывают срочно закрепить мониторинг цепочек рассуждений как одну из ключевых мер безопасности. Они предлагают разработчикам исследовать, какие свойства моделей делают их рассуждения видимыми для человека, как сохранять эту прозрачность при обучении более мощных систем и каким образом можно встроить CoT-мониторинг в процессы тестирования и сертификации.

Примечательно, что статья стала редким примером сотрудничества конкурирующих гигантов ИИ-индустрии.

* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена

ИИ всё чаще рассуждает как человек — лидеры индустрии призывают срочно сохранить способность «подглядывать» за его логикой, пока не стало слишком поздно

Microsoft и Atom Computing объединят усилия для создания в Дании самого мощного квантового компьютера Magne

Рецензия на фильм «Жизнь Чака» / The Life of Chuck

Другие новости

Microsoft и Atom Computing объединят усилия для создания в Дании самого мощного квантового компьютера Magne

Рецензия на фильм «Жизнь Чака» / The Life of Chuck

Stellantis прекращает разработку водородных автомобилей

После квартальных убытков Intel сокращает более 5,5 тыс. работников в США

Новейший Voyah Free+, ставший хитом в Китае, уже доступен для заказа в России: версия с полным приводом — 4,5 млн рублей

91% емкости после 160 тыс. км: реальный тест VW ID.3 развеивает страхи о батареях электромобилей

Google объявила дату презентации Pixel 10

Популярные новости

Sucker Punch хотела бы вернуть серию Infamous, но пока что занята Ghost of Yōtei

Крупнейший шахматный сайт в мире блокирует 100 000 аккаунтов ежемесячно за мошенничество

Анонс Wacom MovinkPad: графический планшет превратился в настоящий

По информации инсайдеров, первый в мире складной iPhone выйдет в 2026 году по цене почти $2000

iPad mini, Legion Y700 и другие: гид по компактным планшетам. 2025 год

Подписка на новости

Информация

ТОП новости

Microsoft и Atom Computing объединят усилия для создания в Дании самого мощного квантового компьютера Magne

Рецензия на фильм «Жизнь Чака» / The Life of Chuck