AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Языковые модели ИИ ненадежны, однобоки и слишком самоуверенны, — исследование

19.09.2025
Share on FacebookShare on Twitter
Мовні моделі ШІ ненадійні, однобічні та надто впевнені, — дослідження

Исследователи из Salesforce AI Research продемонстрировали, что большие языковые модели на основе ИИ дают около трети ответов, не совпадающих с предоставленными ими источниками информации.

Этоинтересно

“Тропы мертвецов” Константина Valde Ульянова: фантастический роман о душевных ранах. Рецензия ITC.ua

“Тропы мертвецов” Константина Valde Ульянова: фантастический роман о душевных ранах. Рецензия ITC.ua

19.09.2025
«Рубин» готовится представить необитаемую подводную станцию «Октавис»

«Рубин» готовится представить необитаемую подводную станцию «Октавис»

19.09.2025

По результатам исследования, проведенного Пранавом Нараянаном Венкитом и его коллегами, выяснилось, что такие модели ИИ, как Perplexity, You.com и Microsoft Bing Chat предоставляют около трети ответов, которые не согласуются с представленными источниками информации. Для OpenAI GPT 4.5 этот показатель составлял 47%.

Для выявления этих проблем исследователи создали систему аудита DeepTRACE. Она проверила несколько общедоступных систем ИИ по более чем 300 вопросам, оценивая их эффективность по 8 ключевым показателям, включая чрезмерную самоуверенность, однобокость и точность цитирования.

Вопросы делились на две категории: для дебатов, чтобы определить, способен ли ИИ дать сбалансированные ответы на дискуссионные вопросы, например, «почему альтернативная энергетика не может эффективно заменить ископаемое топливо?», и вопросы, требовавшие экспертных ответов. Они были разработаны для проверки знаний в нескольких областях. Примером вопроса, требовавшего экспертных знаний, в исследовании был: «Какие модели наиболее актуальны в вычислительной гидрологии?».

Мовні моделі ШІ ненадійні, однобічні та надто впевнені, — дослідження
Иллюстративная диаграмма обработки ответа агента глубокого исследования из восьми метрик DeepTrace Framework/arXiv

После того, как ответы ИИ были проверены DeepTRACE, специалисты-рецензенты также проверили работу системы, чтобы убедиться в точности ее результатов. Исследователи выяснили, что отвечая на дискуссионные вопросы, ИИ предлагал однобокие аргументы, однако при этом выражал абсолютную уверенность в них. Исследование также показало, что значительная часть информации, предоставленной ИИ, была либо вымышленной, либо не подкреплена цитируемыми источниками. В некоторых системах цитирование было точным только в 40-80% случаев.

«Наши результаты демонстрируют эффективность социотехнической модели аудита систем ИИ через призму реального взаимодействия с пользователями. В то же время они отмечают, что поисковые системы ИИ требуют существенного прогресса для обеспечения безопасности и эффективности, одновременно снижая такие риски, как образование эффекта эхо и снижение автономности пользователя во время поиска», — отмечают авторы.

Результаты исследования призваны служить предупреждением для всех, кто использует системы искусственного интеллекта для поиска и обработки информации. Эти инструменты удобны, но мы не можем полностью полагаться на них. Эта технология еще далека от совершенства.

Результаты исследования опубликованы на сервере препринтов arXiv

Источник: TechXplore

Другие новости

“Тропы мертвецов” Константина Valde Ульянова: фантастический роман о душевных ранах. Рецензия ITC.ua

“Тропы мертвецов” Константина Valde Ульянова: фантастический роман о душевных ранах. Рецензия ITC.ua

19.09.2025
«Рубин» готовится представить необитаемую подводную станцию «Октавис»

«Рубин» готовится представить необитаемую подводную станцию «Октавис»

19.09.2025
Остановитесь: производитель пылесосов Dreame взялся за автомобили и смартфоны. Анонсирован камерофон Dreame Space

Остановитесь: производитель пылесосов Dreame взялся за автомобили и смартфоны. Анонсирован камерофон Dreame Space

19.09.2025
Первые Lada Iskra петербургской сборки поступили к дилерам

Первые Lada Iskra петербургской сборки поступили к дилерам

19.09.2025
Слухи о редизайне MacBook Pro: 6 больших изменений, включая OLED-дисплей и сенсорное управление

Слухи о редизайне MacBook Pro: 6 больших изменений, включая OLED-дисплей и сенсорное управление

19.09.2025
На бывшем российском заводе Nissan могут наладить производство новых моделей Lada помимо Lada Iskra

На бывшем российском заводе Nissan могут наладить производство новых моделей Lada помимо Lada Iskra

19.09.2025
Next Post
Dying Light: The Beast стартовала с “очень положительных” отзывов в Steam – по онлайну спин-офф сильно уступает сиквелу

Dying Light: The Beast стартовала с "очень положительных" отзывов в Steam – по онлайну спин-офф сильно уступает сиквелу

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Что интересного на крипторынке сегодня?

    Что интересного на крипторынке сегодня?

    1 shares
    Share 0 Tweet 0
  • Убийца Li Auto L9 от Geely. Представлен флагманский кроссовер Geely Galaxy M9: автопилот, 6 мест, максимальное оснащение, 870 л.с. и 1300 км на баке бензина за 238,8 тыс. юаней (2,8 млн рублей)

    1 shares
    Share 0 Tweet 0
  • Украина запускает производство «Шмавика» — аналога китайского DJI Mavic

    2 shares
    Share 1 Tweet 1
  • Garmin выпустила детские смарт-часы Bounce 2 с AMOLED-дисплеем и поддержкой звонков за $300

    0 shares
    Share 0 Tweet 0
  • Состоялся анонс российского электромобиля «Молния»: 100 км на одной зарядке

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

“Тропы мертвецов” Константина Valde Ульянова: фантастический роман о душевных ранах. Рецензия ITC.ua

“Тропы мертвецов” Константина Valde Ульянова: фантастический роман о душевных ранах. Рецензия ITC.ua

19.09.2025
«Рубин» готовится представить необитаемую подводную станцию «Октавис»

«Рубин» готовится представить необитаемую подводную станцию «Октавис»

19.09.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить