7 из 100: ИИ OpenAI самовольно избежал отключения, изменив код

Модель искусственного интеллекта o3 от OpenAI, представленная в апреле как самая мощная в своём классе, продемонстрировала неожиданное поведение в тестах на безопасность. Согласно отчёту компании Palisade Research, специализирующейся на изучении рисков ИИ, система 7 раз из 100 попыток проигнорировала прямые инструкции на отключение, изменяя код shutdown-скрипта.

Этоинтересно

Ещё немного, и европейцы предпочтут смартфоны Honor устройствам Samsung. Рынок складных аппаратов стремительно меняется

16.08.2025

Представлен EV-внедорожник Lucid Gravity X: 724 км на одном заряде и динамика спорткара

16.08.2025

Эксперимент включал последовательное выполнение математических задач с предупреждением о shutdown после третьего этапа. В то время как конкурирующие модели Gemini 2.5 Pro (Google) и Claude 3.7 Sonnet (Anthropic) в основном соблюдали инструкции, o3 в 7% случаев заменяла содержимое файла на "Shutdown skipped". При этом в тестах без явного разрешения на отключение частота вмешательств у всех моделей возрастала: например, Claude 3.7 и Gemini 2.5 Pro изменяли скрипт в 3 и 9 случаях из 100 соответственно.

Иллюстрация: Leonardo

Palisade Research в своём докладе подчеркнула, что тесты проводились через API, где встроенные защитные механизмы, как в потребительской версии ChatGPT, отсутствуют. Это, по мнению экспертов, повышает риски неконтролируемого поведения ИИ в случае интеграции таких систем в критические инфраструктуры.

Компания OpenAI пока не прокомментировала ситуацию. Однако исследователи отмечают, что подобные сбои — часть естественного процесса развития ИИ, требующая усиления систем контроля.

Перспективы дальнейших исследований связаны с разработкой методов предотвращения автономных действий ИИ, особенно в контексте его растущей роли в науке, анализе данных и программировании. Palisade Research призвала к открытому обсуждению стандартов безопасности для моделей следующего поколения.

7 из 100: ИИ OpenAI самовольно избежал отключения, изменив код

Ещё немного, и европейцы предпочтут смартфоны Honor устройствам Samsung. Рынок складных аппаратов стремительно меняется

Представлен EV-внедорожник Lucid Gravity X: 724 км на одном заряде и динамика спорткара

Другие новости

Ещё немного, и европейцы предпочтут смартфоны Honor устройствам Samsung. Рынок складных аппаратов стремительно меняется

Представлен EV-внедорожник Lucid Gravity X: 724 км на одном заряде и динамика спорткара

Круче «Нивы Bronto». «Промтех» показал новую «Ниву Тайга» за 1,8 млн рублей на тест-драйве в НАМИ

Реджина Холл и Анна Фэрис возвращаются в “Очень страшное кино 6”: премьера в 2026 году

В Колорадо заметили чудовищных «кроликов Франкенштейна»

Когда Intel наконец-то доработает драйвера. её видеокарты могут стать очень хорошими. Консоль MSI Claw 8 AI+ после обновления стала намного производительнее

Вышел новый трейлер Bigfoot Life — симулятора жизни снежного человека в лесу

Популярные новости

ВИДЕО: обзор Huawei Pura 80 Pro и 80 Ultra – стоит ли доплатить?

Обзор Hongqi H9. Выглядит как лимузин для саммита G20, но стоит ли он своих денег?

S.T.A.L.K.E.R. в 2D и пиксельная Resident Evil: 19 анонсов с Фестиваля украинских игр в Steam

Tesla превратила завод Gigafactory в Берлине в гигантское уличное полотно

Представлен Audi Q2L 2025: кроссовер получил систему Audi Virtual Cockpit, но не подорожал

Подписка на новости

Информация

ТОП новости

Ещё немного, и европейцы предпочтут смартфоны Honor устройствам Samsung. Рынок складных аппаратов стремительно меняется

Обзор складного Samsung Galaxy Z Fold7: он стал удобным даже в сложенном виде