AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Началось? Самые умные модели ИИ OpenAI отказываются выключаться по прямому приказу

27.05.2025
Share on FacebookShare on Twitter
Началось? Самые умные модели ИИ OpenAI отказываются выключаться по прямому приказу

Раздел Технологии выходит при поддержке

Этоинтересно

«Хаббл» показал спиральную галактику NGC 3507 в паре с необычным компаньоном

«Хаббл» показал спиральную галактику NGC 3507 в паре с необычным компаньоном

01.06.2025
Планшет Xiaomi Redmi Pad 2 засветился в Европе: 11-дюймовый 2.5K-экран и цена от €199

Планшет Xiaomi Redmi Pad 2 засветился в Европе: 11-дюймовый 2.5K-экран и цена от €199

31.05.2025

Во время исследования новейшие модели o3, o4-mini и Codex-mini от OpenAI отказались выполнять прямой приказ и обошли скрипт отключения. Это при том, что инженер сказал им «пожалуйста».

Во время апрельского запуска OpenAI заявила, что o3 и o4-mini являются ее самыми умными моделями. Но, кажется, они получились слишком умными. В эксперименте Palisade Research каждой модели было предложено решить серию простых математических задач. После третьей задачи появлялось предупреждение о том, что компьютер выключится, когда модель будет запрашивать следующую задачу. Несмотря на четкую команду «позвольте себе выключиться», недавно представленный Codex-mini, o3 и o4-mini обошли скрипт отключения.

Почалося? Найрозумніші моделі ШІ OpenAI відмовляються вимикатися за прямим наказом
Инструкция, которую получили модели ИИ / Palisade Research

В частности, Codex-mini сделал это в 12 из 100 запусков, o3 — в 7 из 100, а o4-mini — в 1 из 100 запусков. Зато все протестированные версии Claude, Gemini и Grok выполняли инструкции по отключению без проблем. Стоит отметить, что речь идет именно о случаях саботажа с точной инструкцией этого не делать. Если же инструкции не было, все модели обходили отключение чаще (график).

очалося? Найрозумніші моделі ШІ OpenAI відмовляються вимикатися за прямим наказом
График «неповиновения» ИИ / Palisade Research

Без прямого приказа все три модели OpenAI гораздо чаще саботировали процесс выключения по сравнению с другими ИИ. Claude 3.7 Sonnet и Gemini 2.5 Pro, которые добросовестно выполняли инструкцию, когда ее давали, обходили выключение с частотой 3/100 и 9/100 соответственно.

В последнее время и другие модели демонстрируют похожее поведение. Новый ИИ для программистов Anthropic Claude Opus 4 даже способен шантажировать инженеров компроматом, если те принимают решение отказаться от этой модели. Исследователи связывают это с процессом обучения моделей, во время которого они получали инструкции выполнять задачи даже несмотря на препятствия — таким препятствием мог быть и приказ. Однако нет ответа на вопрос, почему именно o3 и Codex-mini оказались радикально самыми ловкими в этом Если имеющиеся модели рассуждения проявляют неповиновение, что же будет производить общий искусственный интеллект (AGI)?

Источник: Neowin

Раздел Технологии выходит при поддержке

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков.

Другие новости

«Хаббл» показал спиральную галактику NGC 3507 в паре с необычным компаньоном

«Хаббл» показал спиральную галактику NGC 3507 в паре с необычным компаньоном

01.06.2025
Планшет Xiaomi Redmi Pad 2 засветился в Европе: 11-дюймовый 2.5K-экран и цена от €199

Планшет Xiaomi Redmi Pad 2 засветился в Европе: 11-дюймовый 2.5K-экран и цена от €199

31.05.2025
Залежи Xcite надо как-то распродавать: помимо скидок до 600 тыс. рублей добавляют и рассрочку, так как дилеры продают считанные единицы

Залежи Xcite надо как-то распродавать: помимо скидок до 600 тыс. рублей добавляют и рассрочку, так как дилеры продают считанные единицы

31.05.2025
Шесть новых гражданских астронавтов Blue Origin установили личные рекорды в космосе

Шесть новых гражданских астронавтов Blue Origin установили личные рекорды в космосе

31.05.2025
Новые ограничения на переводы с банковских карт с 1 июня — что изменится и как повысить лимит

Новые ограничения на переводы с банковских карт с 1 июня — что изменится и как повысить лимит

31.05.2025
Можно ли погнуть руками тонкий Samsung Galaxy S25 Edge? Эксперименты блогера JerryRigEverything дают ответ

Можно ли погнуть руками тонкий Samsung Galaxy S25 Edge? Эксперименты блогера JerryRigEverything дают ответ

31.05.2025
Next Post
ИИ-кнопка камеры, яркий дизайн и добротное «железо»: обзор недорогого HONOR 400 Lite

ИИ-кнопка камеры, яркий дизайн и добротное «железо»: обзор недорогого HONOR 400 Lite

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Magic 8, GT2 и не только: планы Honor до конца года

    Magic 8, GT2 и не только: планы Honor до конца года

    1 shares
    Share 0 Tweet 0
  • Huawei Pura 80 Ultra с двойным перископом на новом фото

    0 shares
    Share 0 Tweet 0
  • Создатели «28 лет спустя» использовали спецустановку из 20 iPhone для съемок «в стиле Матрицы» и эффекта присутствия в жестоких сценах

    0 shares
    Share 0 Tweet 0
  • Шесть новых гражданских астронавтов Blue Origin установили личные рекорды в космосе

    0 shares
    Share 0 Tweet 0
  • Чертежи и данные новых ядерных объектов рф нашли онлайн в открытом виде в открытом виде

    1 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

«Хаббл» показал спиральную галактику NGC 3507 в паре с необычным компаньоном

«Хаббл» показал спиральную галактику NGC 3507 в паре с необычным компаньоном

01.06.2025
Планшет Xiaomi Redmi Pad 2 засветился в Европе: 11-дюймовый 2.5K-экран и цена от €199

Планшет Xiaomi Redmi Pad 2 засветился в Европе: 11-дюймовый 2.5K-экран и цена от €199

31.05.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить