AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Google DeepMind и Стэнфорд разработали систему проверки данных ИИ — исправляет 76% ложных ответов

31.03.2024
Share on FacebookShare on Twitter

Google DeepMind и Стэнфорд разработали систему проверки данных ИИ — исправляет 76% ложных ответов

Этоинтересно

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

07.07.2025
MSI Vector 16 HX AI — ноутбук для тех, кто хочет всё и сразу

MSI Vector 16 HX AI — ноутбук для тех, кто хочет всё и сразу

07.07.2025

Одним из самых больших недостатков чатботов на основе искусственного интеллекта являются так называемые «галлюцинации», когда ИИ выдумывает недействительную информацию, то есть фактически лжет. Некоторые эксперты говорят, что это одна из интересных особенностей ИИ, и это может быть полезным для генеративныхх моделей, которые создают изображения и видео. Но не для речевых моделей, которые дают ответы на вопросы пользователей, рассчитывающих на точные данные.

Лаборатория Google DeepMind и Стэнфордский университет, похоже нашли обходной путь для решения проблемы. Исследователи разработали систему проверки для больших языковых моделей искусственного интеллекта: Search-Augmented Factuality Evaluator, или SAFE проверяет длинные ответы, созданные чатботами ИИ. Их исследования доступны как препринт на arXiv вместе со всем экспериментальным кодом и наборами данных.

Система анализирует, обрабатывает и оценивает ответы в четыре шага, чтобы проверить их точность и соответствие. Сначала SAFE разбивает ответ на отдельные факты, просматривает их и сравнивает с результатами поиска Google. Система также проверяет релевантность отдельных фактов предоставленному запросу.

Чтобы оценить производительность SAFE, исследователи создали LongFact, набор данных из примерно 16 000 фактов. Затем они испытали систему на 13 крупных языковых моделях из четырех различных семейств (Claude, Gemini, GPT, PaLM-2). В 72% случаев SAFE давала те же результаты, что и проверка людьми. В случаях несогласия с результатами ИИ SAFE была права в 76% случаев.

Исследователи утверждают, что использование SAFE в 20 раз дешевле, чем проверка людьми. Таким образом, решение оказалось экономически жизнеспособным и пригодным к масштабированию. Существующие подходы к оценке соответствия контента, созданного моделью, обычно полагаются на непосредственную человеческую оценку. Несмотря на ценность, этот процесс ограничен субъективностью и изменчивостью человеческого суждения и проблемами масштабируемости применения человеческого труда к большим наборам данных.

Чат-бот ИИ властей Нью-Йорка дает ложные ответы относительно городских правил и деятельности бизнеса

Курс "Web design" від Web-academy. Швидкий початок кар'єри у сфері IT! Опануйте професію веб-дизайнера — почніть самостійно керувати своїм часом й отримувати високий дохід вже за 9 тижнів. Дізнатися більше

Источник: Marktechpost

Продолжается конкурс авторов ИТС. Напиши статью о развитии игр, гейминг и игровые девайсы и выигрывай профессиональный игровой руль Logitech G923 Racing Wheel, или одну из низкопрофильных игровых клавиатур Logitech G815 LIGHTSYNC RGB Mechanical Gaming Keyboard!

Другие новости

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

07.07.2025
MSI Vector 16 HX AI — ноутбук для тех, кто хочет всё и сразу

MSI Vector 16 HX AI — ноутбук для тех, кто хочет всё и сразу

07.07.2025
Смартфон за 1500 евро, который даже не способен загрузиться. Sony снимает с продажи флагманский Xperia 1 VII из-за технических проблем и критики пользователей

Смартфон за 1500 евро, который даже не способен загрузиться. Sony снимает с продажи флагманский Xperia 1 VII из-за технических проблем и критики пользователей

07.07.2025
ИИ-помощник Copilot теперь ищет файлы на Windows 10 и 11 — лучше и быстрее Windows Search

ИИ-помощник Copilot теперь ищет файлы на Windows 10 и 11 — лучше и быстрее Windows Search

07.07.2025
Илон Маск объявил о создании политической партии

Илон Маск объявил о создании политической партии

07.07.2025
Рецензия на сериал «Железное сердце» / Ironheart

Рецензия на сериал «Железное сердце» / Ironheart

06.07.2025
Next Post
Титан 2.0: iPhone 16 Pro получит новую металлическую рамку

Титан 2.0: iPhone 16 Pro получит новую металлическую рамку

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Почему нам кажется, что сердце находится слева

    Почему нам кажется, что сердце находится слева

    51 shares
    Share 20 Tweet 13
  • Когда ИИ доводит до самоубийства: OpenAI изучает влияние ChatGPT на психическое состояние людей

    1 shares
    Share 0 Tweet 0
  • Google незаконно собирала данные со смартфонов в периоды отсутствия активности, за что была оштрафована на 314 млн долларов

    1 shares
    Share 0 Tweet 0
  • Обзор гарнитуры Jabra Evolve2 85

    8 shares
    Share 3 Tweet 2
  • Геймер превратил авто Honda CR-V в контроллер для Need for Speed Underground

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

07.07.2025
Vivo X200 Ultra получает апдейт с улучшениями камер

Vivo X200 Ultra получает апдейт с улучшениями камер

07.07.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить