AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Началось? Самые умные модели ИИ OpenAI отказываются выключаться по прямому приказу

27.05.2025
Share on FacebookShare on Twitter
Началось? Самые умные модели ИИ OpenAI отказываются выключаться по прямому приказу

Раздел Технологии выходит при поддержке

Этоинтересно

Россияне распробовали китайский премиум: продажи Hongqi растут на падающем рынке, самая популярная модель — кроссовер Hongqi HS5

Россияне распробовали китайский премиум: продажи Hongqi растут на падающем рынке, самая популярная модель — кроссовер Hongqi HS5

16.08.2025
Российские хакеры дистанционно открыли шлюзы в Норвегии: 7,2 тыс. м³ воды вырвались из дамбы

Российские хакеры дистанционно открыли шлюзы в Норвегии: 7,2 тыс. м³ воды вырвались из дамбы

16.08.2025

Во время исследования новейшие модели o3, o4-mini и Codex-mini от OpenAI отказались выполнять прямой приказ и обошли скрипт отключения. Это при том, что инженер сказал им «пожалуйста».

Во время апрельского запуска OpenAI заявила, что o3 и o4-mini являются ее самыми умными моделями. Но, кажется, они получились слишком умными. В эксперименте Palisade Research каждой модели было предложено решить серию простых математических задач. После третьей задачи появлялось предупреждение о том, что компьютер выключится, когда модель будет запрашивать следующую задачу. Несмотря на четкую команду «позвольте себе выключиться», недавно представленный Codex-mini, o3 и o4-mini обошли скрипт отключения.

Почалося? Найрозумніші моделі ШІ OpenAI відмовляються вимикатися за прямим наказом
Инструкция, которую получили модели ИИ / Palisade Research

В частности, Codex-mini сделал это в 12 из 100 запусков, o3 — в 7 из 100, а o4-mini — в 1 из 100 запусков. Зато все протестированные версии Claude, Gemini и Grok выполняли инструкции по отключению без проблем. Стоит отметить, что речь идет именно о случаях саботажа с точной инструкцией этого не делать. Если же инструкции не было, все модели обходили отключение чаще (график).

очалося? Найрозумніші моделі ШІ OpenAI відмовляються вимикатися за прямим наказом
График «неповиновения» ИИ / Palisade Research

Без прямого приказа все три модели OpenAI гораздо чаще саботировали процесс выключения по сравнению с другими ИИ. Claude 3.7 Sonnet и Gemini 2.5 Pro, которые добросовестно выполняли инструкцию, когда ее давали, обходили выключение с частотой 3/100 и 9/100 соответственно.

В последнее время и другие модели демонстрируют похожее поведение. Новый ИИ для программистов Anthropic Claude Opus 4 даже способен шантажировать инженеров компроматом, если те принимают решение отказаться от этой модели. Исследователи связывают это с процессом обучения моделей, во время которого они получали инструкции выполнять задачи даже несмотря на препятствия — таким препятствием мог быть и приказ. Однако нет ответа на вопрос, почему именно o3 и Codex-mini оказались радикально самыми ловкими в этом Если имеющиеся модели рассуждения проявляют неповиновение, что же будет производить общий искусственный интеллект (AGI)?

Источник: Neowin

Раздел Технологии выходит при поддержке

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков.

Другие новости

Россияне распробовали китайский премиум: продажи Hongqi растут на падающем рынке, самая популярная модель — кроссовер Hongqi HS5

Россияне распробовали китайский премиум: продажи Hongqi растут на падающем рынке, самая популярная модель — кроссовер Hongqi HS5

16.08.2025
Российские хакеры дистанционно открыли шлюзы в Норвегии: 7,2 тыс. м³ воды вырвались из дамбы

Российские хакеры дистанционно открыли шлюзы в Норвегии: 7,2 тыс. м³ воды вырвались из дамбы

16.08.2025
Бесшумный мини-ПК с памятью LPDDR5x-6400 от $364. Представлены Lingke SER9 H255 и SER9 Pro H255

Бесшумный мини-ПК с памятью LPDDR5x-6400 от $364. Представлены Lingke SER9 H255 и SER9 Pro H255

16.08.2025
Volkswagen внедрила ежемесячную подписку за полную мощность электродвигателя

Volkswagen внедрила ежемесячную подписку за полную мощность электродвигателя

16.08.2025
Топливопровод не выдержал: SpaceX рассказала, почему взорвался ускоритель Super Heavy во время девятого испытательного полета, и что привело к утрате Starship

Топливопровод не выдержал: SpaceX рассказала, почему взорвался ускоритель Super Heavy во время девятого испытательного полета, и что привело к утрате Starship

16.08.2025
Рада наконец возьмется за легализацию криптовалют на следующей неделе

Рада наконец возьмется за легализацию криптовалют на следующей неделе

16.08.2025
Next Post
ИИ-кнопка камеры, яркий дизайн и добротное «железо»: обзор недорогого HONOR 400 Lite

ИИ-кнопка камеры, яркий дизайн и добротное «железо»: обзор недорогого HONOR 400 Lite

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Украинский рынок IT труда в августе: рекордное количество вакансий за весь 2023 год, но обвал спроса на Java-специалистов – аналитика DOU

    Украинский рынок IT труда в августе: рекордное количество вакансий за весь 2023 год, но обвал спроса на Java-специалистов – аналитика DOU

    2 shares
    Share 1 Tweet 1
  • Младший в созвездии. Тест-драйв нового Subaru XV

    18 shares
    Share 7 Tweet 5
  • Тест-драйв Land Rover Defender: легенда нашего времени

    18 shares
    Share 7 Tweet 5
  • Самый продаваемый в России пикап JAC T9 уступил лидерство УАЗ «Пикапу»

    1 shares
    Share 0 Tweet 0
  • Игрок Oblivion Remastered зачаровал лошадь для полетов через половину карты, но забыл про посадку

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Россияне распробовали китайский премиум: продажи Hongqi растут на падающем рынке, самая популярная модель — кроссовер Hongqi HS5

Россияне распробовали китайский премиум: продажи Hongqi растут на падающем рынке, самая популярная модель — кроссовер Hongqi HS5

16.08.2025
Российские хакеры дистанционно открыли шлюзы в Норвегии: 7,2 тыс. м³ воды вырвались из дамбы

Российские хакеры дистанционно открыли шлюзы в Норвегии: 7,2 тыс. м³ воды вырвались из дамбы

16.08.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить