AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Игры

OpenAI научила ChatGPT признавать собственное нездоровое поведение посредством исповеди

04.12.2025
Share on FacebookShare on Twitter

OpenAI научила ChatGPT признавать собственное нездоровое поведение посредством исповеди

Этоинтересно

Чтобы жить как героиня “Эмили в Париже”, нужно зарабатывать больше €100 тысяч в год – Netflix снова приукрасил реальность

Чтобы жить как героиня “Эмили в Париже”, нужно зарабатывать больше €100 тысяч в год – Netflix снова приукрасил реальность

29.12.2025
ARC Raiders сохранила 86% игроков в Steam с момента пикового онлайна

ARC Raiders сохранила 86% игроков в Steam с момента пикового онлайна

29.12.2025

OpenAI представила новую систему обучения искусственного интеллекта, которая учит модели честно рассказывать о собственных ошибках и нежелательных действиях пользователя и самой системы. Подход получил название "исповедь" (confession).

Модель создает второй вывод, отдельный от основного ответа, где честно сообщает о допущенных отклонениях в своем поведении, чтобы угодить пользователю. Главный ответ оценивается по множеству параметров, тогда как исповедь тренируется только на честности. Исследователи обучили версию GPT-5 Thinking создавать такие отчеты и тестировали на датасетах, провоцирующих нежелательное поведение вроде обмана или нарушения правил.

Проблема заключается в том, что большие языковые модели часто обучаются выдавать ответы, которые кажутся желательными для пользователя. Это приводит к угодничеству или уверенному изложению галлюцинаций – выдуманной информации, которую ИИ представляет как факт. Особенно сильно это стало проявляться в версии 4о и последовавшией за ней GPT5.

OpenAI объявила "код красный" из-за усиления конкуренции ChatGPT с моделями Google

OpenAI объявила "код красный" из-за усиления конкуренции ChatGPT с моделями Google

OpenAI нужно привлечь 207 миллиардов долларов к 2030 году, чтобы и дальше работать в убыток

OpenAI нужно привлечь 207 миллиардов долларов к 2030 году, чтобы и дальше работать в убыток

Новая система обучения побуждает модель давать дополнительный ответ о том, как она пришла к основному результату. При этом "исповеди" оцениваются исключительно по честности, тогда как основные ответы проверяются по множеству параметров – полезности, точности и соответствию инструкциям.

OpenAI отмечает, что большинство ошибок происходит из-за искренней путаницы модели в неоднозначных инструкциях, а не из-за намеренного обмана. Компания планирует масштабировать исследование для проверки стабильности метода.

Другие новости

Чтобы жить как героиня “Эмили в Париже”, нужно зарабатывать больше €100 тысяч в год – Netflix снова приукрасил реальность

Чтобы жить как героиня “Эмили в Париже”, нужно зарабатывать больше €100 тысяч в год – Netflix снова приукрасил реальность

29.12.2025
ARC Raiders сохранила 86% игроков в Steam с момента пикового онлайна

ARC Raiders сохранила 86% игроков в Steam с момента пикового онлайна

29.12.2025
Ubisoft отключила серверы Rainbow Six Siege на выходные из-за масштабной атаки хакеров

Ubisoft отключила серверы Rainbow Six Siege на выходные из-за масштабной атаки хакеров

29.12.2025
Мучительное ожидание Half-Life 3 вернуло игроков к оригинальным частям

Мучительное ожидание Half-Life 3 вернуло игроков к оригинальным частям

29.12.2025
Сотрудница ИИ-стартапа едва не совершила суицид после одержимости генерацией собственных изображений

Сотрудница ИИ-стартапа едва не совершила суицид после одержимости генерацией собственных изображений

29.12.2025
Три мода добавили 32 новых интерьера в Fallout 4

Три мода добавили 32 новых интерьера в Fallout 4

29.12.2025
Next Post
Сорокалетнее исследование показало: фторирование питьевой воды не приводит к слабоумию

Сорокалетнее исследование показало: фторирование питьевой воды не приводит к слабоумию

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Два абсолютно разных смартфона из одной серии: обзор Vivo V27 и V27e

    Два абсолютно разных смартфона из одной серии: обзор Vivo V27 и V27e

    5 shares
    Share 2 Tweet 1
  • Samsung Galaxy S21+ и S21 Ultra в ранее неизвестных расцветках на фото

    6 shares
    Share 2 Tweet 2
  • 2K представила бесплатный шутер Project Ethos с героями и элементами рогалика — стартовал тест

    1 shares
    Share 0 Tweet 0
  • Следующий максимум через 10 лет: Солнце прошло пик активности в 25 цикле

    1 shares
    Share 0 Tweet 0
  • Never Settle! OnePlus не отказалась от комплектной зарядки в OnePlus 9

    2 shares
    Share 1 Tweet 1

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Генеральный директор Fibrebond выплатил 540 сотрудникам $240 млн после продажи компании

Генеральный директор Fibrebond выплатил 540 сотрудникам $240 млн после продажи компании

29.12.2025
Самый «злой» RAV4: Jaos превратила новый Toyota RAV4 в покорителя бездорожья

Самый «злой» RAV4: Jaos превратила новый Toyota RAV4 в покорителя бездорожья

29.12.2025
  • Разместить новости

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить