AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Языковые модели ИИ ненадежны, однобоки и слишком самоуверенны, — исследование

19.09.2025
Share on FacebookShare on Twitter
Мовні моделі ШІ ненадійні, однобічні та надто впевнені, — дослідження

Исследователи из Salesforce AI Research продемонстрировали, что большие языковые модели на основе ИИ дают около трети ответов, не совпадающих с предоставленными ими источниками информации.

Этоинтересно

Взрыв сверхновой V Sagittae можно будет наблюдать даже днем

Взрыв сверхновой V Sagittae можно будет наблюдать даже днем

19.09.2025
В России отзывают более 17 тыс. седанов Geely Emgrand из-за риска повреждения топливного бака

В России отзывают более 17 тыс. седанов Geely Emgrand из-за риска повреждения топливного бака

19.09.2025

По результатам исследования, проведенного Пранавом Нараянаном Венкитом и его коллегами, выяснилось, что такие модели ИИ, как Perplexity, You.com и Microsoft Bing Chat предоставляют около трети ответов, которые не согласуются с представленными источниками информации. Для OpenAI GPT 4.5 этот показатель составлял 47%.

Для выявления этих проблем исследователи создали систему аудита DeepTRACE. Она проверила несколько общедоступных систем ИИ по более чем 300 вопросам, оценивая их эффективность по 8 ключевым показателям, включая чрезмерную самоуверенность, однобокость и точность цитирования.

Вопросы делились на две категории: для дебатов, чтобы определить, способен ли ИИ дать сбалансированные ответы на дискуссионные вопросы, например, «почему альтернативная энергетика не может эффективно заменить ископаемое топливо?», и вопросы, требовавшие экспертных ответов. Они были разработаны для проверки знаний в нескольких областях. Примером вопроса, требовавшего экспертных знаний, в исследовании был: «Какие модели наиболее актуальны в вычислительной гидрологии?».

Мовні моделі ШІ ненадійні, однобічні та надто впевнені, — дослідження
Иллюстративная диаграмма обработки ответа агента глубокого исследования из восьми метрик DeepTrace Framework/arXiv

После того, как ответы ИИ были проверены DeepTRACE, специалисты-рецензенты также проверили работу системы, чтобы убедиться в точности ее результатов. Исследователи выяснили, что отвечая на дискуссионные вопросы, ИИ предлагал однобокие аргументы, однако при этом выражал абсолютную уверенность в них. Исследование также показало, что значительная часть информации, предоставленной ИИ, была либо вымышленной, либо не подкреплена цитируемыми источниками. В некоторых системах цитирование было точным только в 40-80% случаев.

«Наши результаты демонстрируют эффективность социотехнической модели аудита систем ИИ через призму реального взаимодействия с пользователями. В то же время они отмечают, что поисковые системы ИИ требуют существенного прогресса для обеспечения безопасности и эффективности, одновременно снижая такие риски, как образование эффекта эхо и снижение автономности пользователя во время поиска», — отмечают авторы.

Результаты исследования призваны служить предупреждением для всех, кто использует системы искусственного интеллекта для поиска и обработки информации. Эти инструменты удобны, но мы не можем полностью полагаться на них. Эта технология еще далека от совершенства.

Результаты исследования опубликованы на сервере препринтов arXiv

Источник: TechXplore

Другие новости

Взрыв сверхновой V Sagittae можно будет наблюдать даже днем

Взрыв сверхновой V Sagittae можно будет наблюдать даже днем

19.09.2025
В России отзывают более 17 тыс. седанов Geely Emgrand из-за риска повреждения топливного бака

В России отзывают более 17 тыс. седанов Geely Emgrand из-за риска повреждения топливного бака

19.09.2025
“Тропы мертвецов” Константина Valde Ульянова: фантастический роман о душевных ранах. Рецензия ITC.ua

“Тропы мертвецов” Константина Valde Ульянова: фантастический роман о душевных ранах. Рецензия ITC.ua

19.09.2025
«Рубин» готовится представить необитаемую подводную станцию «Октавис»

«Рубин» готовится представить необитаемую подводную станцию «Октавис»

19.09.2025
Остановитесь: производитель пылесосов Dreame взялся за автомобили и смартфоны. Анонсирован камерофон Dreame Space

Остановитесь: производитель пылесосов Dreame взялся за автомобили и смартфоны. Анонсирован камерофон Dreame Space

19.09.2025
Первые Lada Iskra петербургской сборки поступили к дилерам

Первые Lada Iskra петербургской сборки поступили к дилерам

19.09.2025
Next Post
Dying Light: The Beast стартовала с “очень положительных” отзывов в Steam – по онлайну спин-офф сильно уступает сиквелу

Dying Light: The Beast стартовала с "очень положительных" отзывов в Steam – по онлайну спин-офф сильно уступает сиквелу

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Что интересного на крипторынке сегодня?

    Что интересного на крипторынке сегодня?

    1 shares
    Share 0 Tweet 0
  • Убийца Li Auto L9 от Geely. Представлен флагманский кроссовер Geely Galaxy M9: автопилот, 6 мест, максимальное оснащение, 870 л.с. и 1300 км на баке бензина за 238,8 тыс. юаней (2,8 млн рублей)

    1 shares
    Share 0 Tweet 0
  • Украина запускает производство «Шмавика» — аналога китайского DJI Mavic

    2 shares
    Share 1 Tweet 1
  • Garmin выпустила детские смарт-часы Bounce 2 с AMOLED-дисплеем и поддержкой звонков за $300

    0 shares
    Share 0 Tweet 0
  • Состоялся анонс российского электромобиля «Молния»: 100 км на одной зарядке

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Взрыв сверхновой V Sagittae можно будет наблюдать даже днем

Взрыв сверхновой V Sagittae можно будет наблюдать даже днем

19.09.2025
В России отзывают более 17 тыс. седанов Geely Emgrand из-за риска повреждения топливного бака

В России отзывают более 17 тыс. седанов Geely Emgrand из-за риска повреждения топливного бака

19.09.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить