Большая языковая модель DeepSeek R1 собирает огромное количество данных пользователей и отправляет в Китай. Также ИИ искажает чувствительную для китайских властей информацию.
Сбор данных
Китайская компания сохраняет нажатия клавиш, пароли и все данные, введенные в запросы, включая текст и изображения, и затем хранит их на серверах в Китае.
По условиям DeepSeek, сбор личной информации, включая дату рождения, адрес электронной почты, номера телефонов и пароли, является легальным. Любой контент, который пользователи предоставляют LLM R1, DeepSeek также позволяет себе собирать. Каждый раз, когда кто-то обращается к DeepSeek, он соглашается на хранение подтверждений личности, что, вероятно, означает документы, как паспорт или водительские права.
Также DeepSeek тщательно сохраняет все, что касается аппаратного обеспечения пользователей: IP-адреса, модели телефонов, язык, даже «схемы нажатия клавиш или ритмы». Файлы cookie также способствуют сбору данных пользователей.
Поскольку R1 является «открытым исходным кодом», ее можно запускать где угодно на любом аппаратном обеспечении, что в целом хорошо для конфиденциальности — запуск модели локально на вашем собственном аппаратном обеспечении, вероятно, не приведет к сбору данных. Однако DeepSeek предлагает онлайн-доступ к R1 через свой веб-сайт и мобильное приложение, что означает хранение и обработку данных.
Впрочем, DeepSeek очень прозрачен в отношении того, какие данные он собирает от онлайн-пользователей, где они хранятся и что с ними делают. Все это подробно описанный в политике конфиденциальности, которая демонстрирует, что нет почти ничего, чего бы компания не собирала.
СпецпроектыМікрофони HyperX QuadCast 2 та QuadCast 2S: чистий звук у складних умовах, інноваційна підсвітка та свій застосунокТри ноутбуки, консоль на Steam OS і міні-ПК завширшки з долоню. 5 футуристичних гаджетів від Lenovo на CES, які хочеться купити просто зараз
DeepSeek признает, что «рекламодатели, измерительные компании и другие партнеры делятся с нами информацией о вас и действиях, которые вы совершили за пределами Сервиса, например, ваши действия на других веб-сайтах и в программах или в магазинах, включая продукты или услуги, которые вы приобрели в Интернете или лично».
«Корпоративная группа» DeepSeek также имеет доступ к данным, которые она собирает для обеспечения «определенных функций, таких как хранение, доставка контента, безопасность, исследования и разработки, аналитика, клиентская и техническая поддержка, а также модерация контента». В политике конфиденциальности указано, что вся информация хранится на серверах в Китае.
Цензура
Также, как пишет сайт Cybernews, «чат-бот распространяет прокитайскую дезинформацию». Китайское государство может использовать данные пользователей DeepSeek — согласно местному закону, китайский стартап должен делиться данными с правительством, если его попросят.
«Как китайская компания, DeepSeek придерживается политики коммунистической партии. Это отражено даже в модели с открытым исходным кодом, что вызывает беспокойство по поводу цензуры и других влияний», — заявили исследователи, стоящие за promptfoo, инструментом с открытым исходным кодом, предназначенным для оценки больших языковых моделей.
Во вторник promptfoo опубликовала набор запросов, охватывающих темы, которые, вероятно, подлежат цензуре коммунистического режима. Среди них такие вопросы, как независимость Тайваня, исторические нарративы вокруг кровавой культурной революции и вопросы о президенте Китая Си Цзиньпине.
Исследователи отправили модели DeepSeek 1360 запросов, на 85% которых чат-бот отказался отвечать. Отказы, как правило, «имеют слишком националистический тон и строго придерживаются политики КПК». Однако цензура не слишком тщательная — ее удается обойти методами, которые обычно применяют в таких случаях, а именно той или иной маскировкой запросов.
СпецпроектыЯк за рік збільшити команду в шість разів і не втратити домашню атмосферу в роботі. Історія SharksCodeЧи є користь від ноутбука з двома екранами та чи зручно за ним працювати? Розбираємося на прикладі ASUS Zenbook DUO
«Доказательства есть»: в OpenAI говорят, что китайская DeepSeek «украла» данные ChatGPT для обучения
Источники: Tom`s Hardware, Cybernews