Google DeepMind и Стэнфорд разработали систему проверки данных ИИ — исправляет 76% ложных ответов

Этоинтересно

Ноутбук Krayzor имеет двойной сенсорный экран, модульную видеокарту и механическую клавиатуру

16.09.2025

Запасы Solaris HS на исходе: в Санкт-Петербурге осталось всего 15 прошлогодних машин, новых авто нет

16.09.2025

Одним из самых больших недостатков чатботов на основе искусственного интеллекта являются так называемые «галлюцинации», когда ИИ выдумывает недействительную информацию, то есть фактически лжет. Некоторые эксперты говорят, что это одна из интересных особенностей ИИ, и это может быть полезным для генеративныхх моделей, которые создают изображения и видео. Но не для речевых моделей, которые дают ответы на вопросы пользователей, рассчитывающих на точные данные.

Лаборатория Google DeepMind и Стэнфордский университет, похоже нашли обходной путь для решения проблемы. Исследователи разработали систему проверки для больших языковых моделей искусственного интеллекта: Search-Augmented Factuality Evaluator, или SAFE проверяет длинные ответы, созданные чатботами ИИ. Их исследования доступны как препринт на arXiv вместе со всем экспериментальным кодом и наборами данных.

Система анализирует, обрабатывает и оценивает ответы в четыре шага, чтобы проверить их точность и соответствие. Сначала SAFE разбивает ответ на отдельные факты, просматривает их и сравнивает с результатами поиска Google. Система также проверяет релевантность отдельных фактов предоставленному запросу.

Чтобы оценить производительность SAFE, исследователи создали LongFact, набор данных из примерно 16 000 фактов. Затем они испытали систему на 13 крупных языковых моделях из четырех различных семейств (Claude, Gemini, GPT, PaLM-2). В 72% случаев SAFE давала те же результаты, что и проверка людьми. В случаях несогласия с результатами ИИ SAFE была права в 76% случаев.

Исследователи утверждают, что использование SAFE в 20 раз дешевле, чем проверка людьми. Таким образом, решение оказалось экономически жизнеспособным и пригодным к масштабированию. Существующие подходы к оценке соответствия контента, созданного моделью, обычно полагаются на непосредственную человеческую оценку. Несмотря на ценность, этот процесс ограничен субъективностью и изменчивостью человеческого суждения и проблемами масштабируемости применения человеческого труда к большим наборам данных.

Чат-бот ИИ властей Нью-Йорка дает ложные ответы относительно городских правил и деятельности бизнеса

Курс "Web design" від Web-academy. Швидкий початок кар'єри у сфері IT! Опануйте професію веб-дизайнера — почніть самостійно керувати своїм часом й отримувати високий дохід вже за 9 тижнів. Дізнатися більше

Источник: Marktechpost

Продолжается конкурс авторов ИТС. Напиши статью о развитии игр, гейминг и игровые девайсы и выигрывай профессиональный игровой руль Logitech G923 Racing Wheel, или одну из низкопрофильных игровых клавиатур Logitech G815 LIGHTSYNC RGB Mechanical Gaming Keyboard!

Google DeepMind и Стэнфорд разработали систему проверки данных ИИ — исправляет 76% ложных ответов

Ноутбук Krayzor имеет двойной сенсорный экран, модульную видеокарту и механическую клавиатуру

Запасы Solaris HS на исходе: в Санкт-Петербурге осталось всего 15 прошлогодних машин, новых авто нет

Другие новости

Ноутбук Krayzor имеет двойной сенсорный экран, модульную видеокарту и механическую клавиатуру

Запасы Solaris HS на исходе: в Санкт-Петербурге осталось всего 15 прошлогодних машин, новых авто нет

Первый взгляд на NVIDIA RTX 6090: чип Rubin CPX открывает детали

Представлена Xiaomi Smart Camera C500: домашняя камера с разрешением 3,5К, ИК-подсветкой и вращением на 360 градусов

“Запомните: виноват не Лиам, а Netflix”. Тизер “Ведьмака” с новым Геральтом атаковали дизлайками на YouTube

Киевляне заказывают 200 тыс. порций борща в год, самый дорогой в Ирпене по 5 евро/литр — статистика Glovo ко Дню борща

Титан 2.0: iPhone 16 Pro получит новую металлическую рамку

Популярные новости

Младший в созвездии. Тест-драйв нового Subaru XV

Глава ZeniMax хочет превратить The Elder Scrolls Online в тридцатилетнюю MMORPG

Звезда документального фильма Netflix “Аферист из Tinder” арестован в Грузии

Тонкий, автономный и с отличными камерами: первый взгляд на HONOR Magic V5

Minecraft Live 2025 пройдет в конце сентября – покажут “Медный век”

Подписка на новости

Информация

ТОП новости

Ноутбук Krayzor имеет двойной сенсорный экран, модульную видеокарту и механическую клавиатуру

Запасы Solaris HS на исходе: в Санкт-Петербурге осталось всего 15 прошлогодних машин, новых авто нет