AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Началось? Самые умные модели ИИ OpenAI отказываются выключаться по прямому приказу

27.05.2025
Share on FacebookShare on Twitter
Началось? Самые умные модели ИИ OpenAI отказываются выключаться по прямому приказу

Раздел Технологии выходит при поддержке

Этоинтересно

Новый рекорд скорости интернета: 1 Пбит/с по оптоволокну толщиной с волос на 1800 км

Новый рекорд скорости интернета: 1 Пбит/с по оптоволокну толщиной с волос на 1800 км

02.06.2025
Небо в огнях над Москвой, Санкт-Петербургом и другими городами: полярное сияние снова озарит Россию

Небо в огнях над Москвой, Санкт-Петербургом и другими городами: полярное сияние снова озарит Россию

02.06.2025

Во время исследования новейшие модели o3, o4-mini и Codex-mini от OpenAI отказались выполнять прямой приказ и обошли скрипт отключения. Это при том, что инженер сказал им «пожалуйста».

Во время апрельского запуска OpenAI заявила, что o3 и o4-mini являются ее самыми умными моделями. Но, кажется, они получились слишком умными. В эксперименте Palisade Research каждой модели было предложено решить серию простых математических задач. После третьей задачи появлялось предупреждение о том, что компьютер выключится, когда модель будет запрашивать следующую задачу. Несмотря на четкую команду «позвольте себе выключиться», недавно представленный Codex-mini, o3 и o4-mini обошли скрипт отключения.

Почалося? Найрозумніші моделі ШІ OpenAI відмовляються вимикатися за прямим наказом
Инструкция, которую получили модели ИИ / Palisade Research

В частности, Codex-mini сделал это в 12 из 100 запусков, o3 — в 7 из 100, а o4-mini — в 1 из 100 запусков. Зато все протестированные версии Claude, Gemini и Grok выполняли инструкции по отключению без проблем. Стоит отметить, что речь идет именно о случаях саботажа с точной инструкцией этого не делать. Если же инструкции не было, все модели обходили отключение чаще (график).

очалося? Найрозумніші моделі ШІ OpenAI відмовляються вимикатися за прямим наказом
График «неповиновения» ИИ / Palisade Research

Без прямого приказа все три модели OpenAI гораздо чаще саботировали процесс выключения по сравнению с другими ИИ. Claude 3.7 Sonnet и Gemini 2.5 Pro, которые добросовестно выполняли инструкцию, когда ее давали, обходили выключение с частотой 3/100 и 9/100 соответственно.

В последнее время и другие модели демонстрируют похожее поведение. Новый ИИ для программистов Anthropic Claude Opus 4 даже способен шантажировать инженеров компроматом, если те принимают решение отказаться от этой модели. Исследователи связывают это с процессом обучения моделей, во время которого они получали инструкции выполнять задачи даже несмотря на препятствия — таким препятствием мог быть и приказ. Однако нет ответа на вопрос, почему именно o3 и Codex-mini оказались радикально самыми ловкими в этом Если имеющиеся модели рассуждения проявляют неповиновение, что же будет производить общий искусственный интеллект (AGI)?

Источник: Neowin

Раздел Технологии выходит при поддержке

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков.

Другие новости

Новый рекорд скорости интернета: 1 Пбит/с по оптоволокну толщиной с волос на 1800 км

Новый рекорд скорости интернета: 1 Пбит/с по оптоволокну толщиной с волос на 1800 км

02.06.2025
Небо в огнях над Москвой, Санкт-Петербургом и другими городами: полярное сияние снова озарит Россию

Небо в огнях над Москвой, Санкт-Петербургом и другими городами: полярное сияние снова озарит Россию

02.06.2025
Илон Маск о «российском Перл-Харборе»: «Дроны — будущее войны. Пилотируемые самолеты — нет»

Илон Маск о «российском Перл-Харборе»: «Дроны — будущее войны. Пилотируемые самолеты — нет»

02.06.2025
Город-космодром Starbase впервые показали с такого ракурса: теперь понятно, сколько Starship приходится ехать до стартовой площадки по обычной дороге

Город-космодром Starbase впервые показали с такого ракурса: теперь понятно, сколько Starship приходится ехать до стартовой площадки по обычной дороге

02.06.2025
Самые интересные новые фильмы июня 2025 года

Самые интересные новые фильмы июня 2025 года

02.06.2025
На этот раз точно получится? Юбилейный полёт Starship ожидается уже в июне 2025

На этот раз точно получится? Юбилейный полёт Starship ожидается уже в июне 2025

02.06.2025
Next Post
ИИ-кнопка камеры, яркий дизайн и добротное «железо»: обзор недорогого HONOR 400 Lite

ИИ-кнопка камеры, яркий дизайн и добротное «железо»: обзор недорогого HONOR 400 Lite

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Как подорожали популярные в России кроссоверы за 10 лет? Volkswagen Touareg — почти в 4 раза, Hyundai Santa Fe — в 3,7 раза, Toyota RAV4 — в 3,5 раза

    Как подорожали популярные в России кроссоверы за 10 лет? Volkswagen Touareg — почти в 4 раза, Hyundai Santa Fe — в 3,7 раза, Toyota RAV4 — в 3,5 раза

    1 shares
    Share 0 Tweet 0
  • В даркнете продается 94 миллиарда потенциально опасных куки-файлов

    1 shares
    Share 0 Tweet 0
  • США создают суперкомпьютер Doudna на чипах Nvidia, который объединит искусственный интеллект с научными открытиями будущего

    1 shares
    Share 0 Tweet 0
  • Hyundai и Kia российской сборки, известные под брендом Solaris, сильно подешевели: Solaris HC (бывший Hyundai Creta) теперь дешевле 2 млн рублей

    1 shares
    Share 0 Tweet 0
  • Изящный, неубиваемый, с флагманскими камерами Leica и большим аккумулятором. Представлен Sharp Aquos R10

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Прогноз цены XRP: курс держится у отметки $2,16 – наберет ли монета силы для прорыва к $3?

Прогноз цены XRP: курс держится у отметки $2,16 – наберет ли монета силы для прорыва к $3?

02.06.2025
Новый рекорд скорости интернета: 1 Пбит/с по оптоволокну толщиной с волос на 1800 км

Новый рекорд скорости интернета: 1 Пбит/с по оптоволокну толщиной с волос на 1800 км

02.06.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить