Инженер-программист Пол Батлер представил результаты своего исследования по применению Unicode для создания нового шифра. За основу в нем используются эмодзи, которые передаются открыто в любых сообщениях. Но если взглянуть на них через декодер, написанный Батлером, можно увидеть множество скрытой информации.
Уязвимость в Unicode возникла из-за использования «селекторов вариаций» VS-1 – VS-256. Система не распознает их как символы, а потому не отображает на экране — это своего рода метка со служебной информацией. Но их можно привязать к отображаемому контенту, в данном случае — к эмодзи. На выходе получаются привычные изображения, но с добавлением невидимой для человека информации.
После ренденринга эмодзи увидеть человеческим глазом или аналогичными системами проверки добавленную информацию уже невозможно, она легко пройдет контроль и цензуру. В один селектор помещается байт данных, селекторы можно объединять в цепочки, что позволяет шифровать почти неограниченные объемы информации. Например, проставить в посланиях аналог водяных знаков, а потом отследить по ним цепочку переписки, тем самым взломав политику конфиденциальности в какой-нибудь организации.
Батлер обнаружил, что практически все крупные языковые модели без труда справляются с обнаружением и дешифровкой такой информации. Но есть ограничения, связанные с правилами использования конкретных нейросетей для рядовых пользователей, плюс надо уметь составлять соответствующие промпты. Батлер упростил эту задачу, изготовив удобный инструмент, он выложен в свободный доступ и любой желающий может проверить, что скрывается за безобидными эмодзи. Или зашифровать свое собственное послание.