AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Игры

OpenAI научила ChatGPT признавать собственное нездоровое поведение посредством исповеди

04.12.2025
Share on FacebookShare on Twitter

OpenAI научила ChatGPT признавать собственное нездоровое поведение посредством исповеди

Этоинтересно

Человечество возвращается к Луне – миссия Artemis 2 успешно стартовала с мыса Канаверал

Человечество возвращается к Луне – миссия Artemis 2 успешно стартовала с мыса Канаверал

02.04.2026
Ведущий дизайнер отменённой ММО Project Blackbird основал собственную студию и уже трудится над первой игрой

Ведущий дизайнер отменённой ММО Project Blackbird основал собственную студию и уже трудится над первой игрой

02.04.2026

OpenAI представила новую систему обучения искусственного интеллекта, которая учит модели честно рассказывать о собственных ошибках и нежелательных действиях пользователя и самой системы. Подход получил название "исповедь" (confession).

Модель создает второй вывод, отдельный от основного ответа, где честно сообщает о допущенных отклонениях в своем поведении, чтобы угодить пользователю. Главный ответ оценивается по множеству параметров, тогда как исповедь тренируется только на честности. Исследователи обучили версию GPT-5 Thinking создавать такие отчеты и тестировали на датасетах, провоцирующих нежелательное поведение вроде обмана или нарушения правил.

Проблема заключается в том, что большие языковые модели часто обучаются выдавать ответы, которые кажутся желательными для пользователя. Это приводит к угодничеству или уверенному изложению галлюцинаций – выдуманной информации, которую ИИ представляет как факт. Особенно сильно это стало проявляться в версии 4о и последовавшией за ней GPT5.

OpenAI объявила "код красный" из-за усиления конкуренции ChatGPT с моделями Google

OpenAI объявила "код красный" из-за усиления конкуренции ChatGPT с моделями Google

OpenAI нужно привлечь 207 миллиардов долларов к 2030 году, чтобы и дальше работать в убыток

OpenAI нужно привлечь 207 миллиардов долларов к 2030 году, чтобы и дальше работать в убыток

Новая система обучения побуждает модель давать дополнительный ответ о том, как она пришла к основному результату. При этом "исповеди" оцениваются исключительно по честности, тогда как основные ответы проверяются по множеству параметров – полезности, точности и соответствию инструкциям.

OpenAI отмечает, что большинство ошибок происходит из-за искренней путаницы модели в неоднозначных инструкциях, а не из-за намеренного обмана. Компания планирует масштабировать исследование для проверки стабильности метода.

Другие новости

Человечество возвращается к Луне – миссия Artemis 2 успешно стартовала с мыса Канаверал

Человечество возвращается к Луне – миссия Artemis 2 успешно стартовала с мыса Канаверал

02.04.2026
Ведущий дизайнер отменённой ММО Project Blackbird основал собственную студию и уже трудится над первой игрой

Ведущий дизайнер отменённой ММО Project Blackbird основал собственную студию и уже трудится над первой игрой

02.04.2026

Менее 600 игроков в Escape from Tarkov достигли максимального уровня престижа

01.04.2026
Гейб Ньюэлл перестал участвовать в разработке игр Valve, потому что все с ним соглашались

Гейб Ньюэлл перестал участвовать в разработке игр Valve, потому что все с ним соглашались

01.04.2026
Адрес почты Gmail можно поменять без потери данных, но пока только в США

Адрес почты Gmail можно поменять без потери данных, но пока только в США

01.04.2026
Утечка по GTA 6 указывает на поведение NPC нового поколения – даже лучше RDR 2

Утечка по GTA 6 указывает на поведение NPC нового поколения – даже лучше RDR 2

01.04.2026
Next Post
Сорокалетнее исследование показало: фторирование питьевой воды не приводит к слабоумию

Сорокалетнее исследование показало: фторирование питьевой воды не приводит к слабоумию

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Наигрались? Samsung Galaxy S22 FE, скорее всего, отменён

    Наигрались? Samsung Galaxy S22 FE, скорее всего, отменён

    2 shares
    Share 1 Tweet 1
  • Украинцы за год купили биткоинов почти на $1 млрд — шестое место в мире

    1 shares
    Share 0 Tweet 0
  • Типы головных болей, с которыми вы сталкиваетесь чаще всего — вот их причины

    1 shares
    Share 0 Tweet 0
  • Apple проектирует MacBook со встроенной беспроводной станцией AirPower

    1 shares
    Share 0 Tweet 0
  • Honor вручает кольцо: не свадебное, но пригласительное

    2 shares
    Share 1 Tweet 1

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Google Photos теперь запускается на телевизорах Samsung: вот что он умеет

Google Photos теперь запускается на телевизорах Samsung: вот что он умеет

02.04.2026
Самое длительное отключение Интернета в истории Ирана продолжается более месяца

Самое длительное отключение Интернета в истории Ирана продолжается более месяца

02.04.2026
  • Разместить новости

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить