AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Как нейросети притворяются всезнайками и что с этим делать?

01.10.2024
Share on FacebookShare on Twitter

Как нейросети притворяются всезнайками и что с этим делать? Кажется, что у нейросетей есть ответы на все вопросы, однако они способны на поражающе убедительную ложь. Изображение: wp.technologyreview.com. Фото.

Этоинтересно

Илон Маск заставил разработчиков Grok установить на свои ПК софт для отслеживания «рабочей активности»

Илон Маск заставил разработчиков Grok установить на свои ПК софт для отслеживания «рабочей активности»

15.07.2025
Sony лучше уйдёт, чем что-то поменяет. Новейший флагман Xperia 1 VII не будет продаваться в большинстве стран Европы

Sony лучше уйдёт, чем что-то поменяет. Новейший флагман Xperia 1 VII не будет продаваться в большинстве стран Европы

15.07.2025

Кажется, что у нейросетей есть ответы на все вопросы, однако они способны на поражающе убедительную ложь. Изображение: wp.technologyreview.com

Мы уже рассказывали о том, что способность нейросетей врать пользователям превзошла самые смелые ожидания. Может показаться, что в этом нет ничего серьезного, однако ученые с этим не согласны. Дело в том, что такие языковые модели, как GPT-4 стали неотъемлемой частью повседневной жизни. Они также активно используются в образовании, медицине и науке, помогая решать разнообразные и довольно сложные задачи. Но, несмотря на впечатляющие возможности этих интеллектуальных систем, результаты последних исследований показали, что по мере их развития и постоянного улучшения, нейросети становятся все менее надежными и чаще выдумывают факты.

Новейшие ИИ-системы стремятся убедительно отвечать на все вопросы, даже когда не уверены в надежности информации. Это особенно опасно в областях, где точность и надежность критически важны, например, в медицине или юридической практике.

Почему нейросети выдумывают факты?

Результаты исследования, опубликованного в журнале Nature, показали, что группа чат-ботов с искусственным интеллектом становится все менее надежной: по мере своего развития, большие языковые модели все чаще выдумывают факты, отвечая на вопросы пользователей.

К такому выводу авторы статьи пришли, рассмотрев работу ведущих в отрасли ИИ-систем, включая GPT от OpenAI, LLaMA от Meta, а также модель с открытым исходным кодом BLOOM, созданную исследовательской группой BigScience.

Почему нейросети выдумывают факты? Нейросети научились притворяться всезнайками. Изображение: quantamagazine.org. Фото.

Нейросети научились притворяться всезнайками. Изображение: quantamagazine.org

Отметим, что традиционно улучшение систем на основе искусственного интеллекта, достигалось двумя способами: масштабированием (увеличением количества параметров, объема данных и вычислительных ресурсов) и «оттачиванием» моделей (настройкой под конкретные задачи и использованием обратной связи от пользователей). Эти подходы позволили чат-ботам лучше понимать инструкции и генерировать более сложные и связные ответы.

Больше по теме: Нейросети научились врать и делают это намеренно

В рамках исследования, однако, было обнаружено, что эти методы улучшения приводят к нежелательным последствиям. Так, более крупные и «отточенные» модели не всегда надежны в решении простых задач, ошибки в которых должны быть минимальны. Более того, доля неправильных ответов улучшенных моделей в целом значительно выше, чем у их предшественников.

В наши дни нейросети отвечают практически на все вопросы. Это означает, что количество как правильных, так и не правильных ответов растет, – рассказал один из авторов нового исследования Хосе Эрнандес-Оралло из Валенсийского исследовательского института искусственного интеллекта (Испания).

Более жесткую оценку дает Майк Хикс из Университета Глазго (Великобритания), который не принимал участие в исследовании. По его мнению, притворство чат-ботов становится все лучше. «В целом, ситуация выглядят так, будто они блефуют», – сообщил Хикс.

Как ученые узнали, что чат-боты врут?

В рамках исследования ученые задавали чат-ботам вопросы по различным темам (от математики до географии), а также попросили выполнить ряд задач, например, перечислить информацию в определенном порядке. Результаты показали, что более крупные и мощные ИИ-системы в целом давали наиболее точные ответы. Однако точность ответов на более сложные вопросы была значительно ниже.

Авторы научной работы отметили, что ответить практически на любой вопрос смогли GPT-4 и GPT-o1 от OpenAI. В то же самое время ни один чат-бот из семейства LLaMA не смог достичь уровня точности в 60%, отвечая на самые простые вопросы.

Как ученые узнали, что чат-боты врут? Недавно OpenAI представили самую мощную модель ChatGPT-o1, которая умеет писать научные статьи. Изображение: ctfassets.net. Фото.

Недавно OpenAI представили самую мощную модель ChatGPT-o1, которая умеет писать научные статьи. Изображение: ctfassets.net

В целом, чем больше становились модели искусственного интеллекта — с точки зрения параметров, обучающих данных и других факторов, — тем больше неправильных ответов они давали, – заключили исследователи.

Тем не менее, по мере своего развития, нейросети все лучше отвечают на более сложные вопросы. Проблема, помимо их склонности к ошибкам, заключается в том, что они по-прежнему не справляются с простыми вопросами.

Хотите всегда быть в курсе последних новостей из мира науки и высоких технологий? Подписывайтесь на наш канал в Telegram – так вы точно не пропустите ничего интересного!

Теоретически, наличие подобных ошибок – это серьезное предупреждение для ученых и пользователей, но поскольку эти интеллектуальные системы неплохо решают сложные задачи, мы, вероятно, склонны не замечать их очевидные недостатки.

Как ученые узнали, что чат-боты врут? Чат-ботам трудно отвечать на простые вопросы. Изображение: cnet.com. Фото.

Чат-ботам трудно отвечать на простые вопросы. Изображение: cnet.com

К счастью, результаты нового исследования свидетельствуют и о несколько «отрезвляющих» выводах о том, как люди воспринимают ответы ИИ. Например, когда участников исследования попросили оценить, насколько точными им кажутся ответы чат-ботов на заданные вопросы, испытуемые ошиблись лишь в 10%-40% случаев. Это означает, что осведомленность пользователей о том, что чат-боты не такие уж всезнайки, растет.

Это интересно: Создатель ChatGPT предсказал ближайшее будущее: мы будем жить как в раю?

Что делать?

По мнению авторов научной работы, самый простой способ борьбы с «всезнающими» ИИ-системами заключается в их «перепрошивке» – разработчики должны запрограммировать модели таким образом, чтобы те не спешили отвечать на все вопросы сразу. Например, более ранние модели часто избегали ответов на сложные вопросы и признавали свои ограничения.

Можно задать своего рода «порог» для чат-ботов, чтобы они, отвечая на сложный вопрос, отвечали честно: «Я не знаю», – рассказал один из авторов исследования Эрнандес-Оралло.

Тем не менее, подобная честность может не входить в интересы компаний, которые занимаются разработкой и улучшением ИИ-систем. В конечном итоге главная задача корпораций – привлечь как можно больше внимания общественности (а заодно и новых пользователей) к своим новейшим разработкам. По этой причине ученые считают, что разработчикам необходимо переосмыслить подход к разработке ИИ-систем.

Что делать? Взаимодействие с чат-ботами должно быть осмысленным. Изображение: ft.com. Фото.

Взаимодействие с чат-ботами должно быть осмысленным. Изображение: ft.com

Это означает, что если бы чат-ботов ограничивали, заставляя их отвечать только на те вопросы, ответы на которые они знают, общественность сразу же обратила бы внимание на пределы возможностей нейросетей. Однако в этом, как мне кажется, нет ничего плохого.

Вам будет интересно: Нейросети уничтожат человечество. Правда или нет?

Итак, что же делать простым людям, регулярно взаимодействующим с чат-ботами, зная все описанное выше? Ответ, как мне кажется, прост – «доверяй, но проверяй». Безусловно, это занимает время, однако сам по себе навык (и даже привычка) проверять данные и информацию, определенно точно сделает вашу жизнь и работу лучше.

Ну а если вы в этом сомневаетесь, напоминаем – привычка проверять данные и советы чат-ботов не так давно спасла жизнь целой семьи. Подробнее об этой увлекательной и пугающей истории рассказывал мой коллега Андрей Жуков, рекомендую к прочтению!

Другие новости

Илон Маск заставил разработчиков Grok установить на свои ПК софт для отслеживания «рабочей активности»

Илон Маск заставил разработчиков Grok установить на свои ПК софт для отслеживания «рабочей активности»

15.07.2025
Sony лучше уйдёт, чем что-то поменяет. Новейший флагман Xperia 1 VII не будет продаваться в большинстве стран Европы

Sony лучше уйдёт, чем что-то поменяет. Новейший флагман Xperia 1 VII не будет продаваться в большинстве стран Европы

15.07.2025
С абонента мобильного оператора AT&T сняли $10 000 во время путешествия вне США

С абонента мобильного оператора AT&T сняли $10 000 во время путешествия вне США

15.07.2025
Из лаборатории на конвейер: создан первый электронно-фотонный квантовый чип на коммерческом производстве

Из лаборатории на конвейер: создан первый электронно-фотонный квантовый чип на коммерческом производстве

15.07.2025
GTA 1991 на подходе: мод-приквел для San Andreas покажут в августе после 7 лет разработки

GTA 1991 на подходе: мод-приквел для San Andreas покажут в августе после 7 лет разработки

15.07.2025
Многострадальные процессоры Intel Raptor Lake оказались метеозависимыми. Волны жары в Европе провоцируют часты сбои ПК с такими CPU

Многострадальные процессоры Intel Raptor Lake оказались метеозависимыми. Волны жары в Европе провоцируют часты сбои ПК с такими CPU

14.07.2025
Next Post
Fidelity сократила оценку стоимости X на 79% с момента покупки Маском за 44 миллиарда долларов

Fidelity сократила оценку стоимости X на 79% с момента покупки Маском за 44 миллиарда долларов

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Младший в созвездии. Тест-драйв нового Subaru XV

    Младший в созвездии. Тест-драйв нового Subaru XV

    15 shares
    Share 6 Tweet 4
  • Обменник криптовалют Dmoney.cc Выгодные обмены, которым можно доверять

    2 shares
    Share 1 Tweet 1
  • Belkin прекращает поддержку устройств Wemo для умного дома — они станут хламом без официального ПО

    1 shares
    Share 0 Tweet 0
  • Представлен Geely Galaxy A7 — гибридный седан с запасом хода более 2100 км и ценой от $14,5 тыс.

    1 shares
    Share 0 Tweet 0
  • Мы спросили, вы ответили: отношение к Nothing Phone (3)

    1 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Илон Маск заставил разработчиков Grok установить на свои ПК софт для отслеживания «рабочей активности»

Илон Маск заставил разработчиков Grok установить на свои ПК софт для отслеживания «рабочей активности»

15.07.2025
Sony лучше уйдёт, чем что-то поменяет. Новейший флагман Xperia 1 VII не будет продаваться в большинстве стран Европы

Sony лучше уйдёт, чем что-то поменяет. Новейший флагман Xperia 1 VII не будет продаваться в большинстве стран Европы

15.07.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить