Искусственный интеллект обнаружил множество белков, подобных CRISPR, за считанные минуты, а не недели или месяцы
Учёные Массачусетского технологического института (MIT) разработали систему искусственного интеллекта DefensePredictor, которая способна за минуты находить новые белки бактериальной иммунной защиты — тогда как традиционные методы занимают недели или месяцы. В первом же тесте алгоритм выявил более 600 ранее не связанных с иммунитетом белков в различных штаммах кишечной палочки Escherichia coli.
Часть этих белков при лабораторной проверке действительно защищала бактерии от атак бактериофагов — вирусов, способных за сутки уничтожать до четверти бактериальной популяции. Это подтверждает, что ИИ не просто классифицирует известные системы, а находит функционально активные, но ранее неизвестные механизмы защиты.
Работа опирается на фундаментальную особенность бактерий: их постоянную эволюционную гонку с вирусами. В ответ на атаки фагов микроорганизмы выработали множество иммунных стратегий — от разрушения вирусной ДНК до сложных систем «запоминания» инфекций. Самый известный пример — CRISPR, который был обнаружен именно как часть бактериальной защиты и позже переосмыслен как инструмент генного редактирования.
Однако CRISPR — лишь одна из множества подобных систем. Учёные уже нашли сотни других механизмов бактериальной защиты, но предполагается, что большая часть остаётся неоткрытой из-за ограничений традиционных методов поиска: многие гены распределены по геному и не образуют очевидных кластеров.

Именно эту проблему пытается решить модель DefensePredictor. В основе системы лежит языковая модель белков ESM-2, которая обучена «понимать» последовательности аминокислот так же, как большие языковые модели понимают текст. Белки рассматриваются как «последовательности из 20 букв», формирующих сложные структуры и функции.
Для обучения модели исследователи MIT использовали базу данных, собранную с помощью предыдущего алгоритма DefenseFinder. В неё вошли около 15 000 белков, связанных с иммунной защитой, и более 186 000 белков без такой функции из примерно 17 000 микробных геномов.
После обучения DefensePredictor проанализировал 69 штаммов E. coli и выявил более 600 потенциальных защитных белков, включая более 100 ранее совершенно неизвестных вариантов. Примечательно, что почти половина из них не располагалась рядом в геноме, что ранее считалось характерным признаком совместно работающих систем.
Для проверки результатов исследователи искусственно внедрили часть найденных белков в уязвимый штамм бактерий и подвергли их атаке различных бактериофагов. Около 45% белков обеспечили защиту хотя бы от одного вируса, подтверждая их функциональную роль.
Дальнейший анализ, расширенный на более чем 1000 микробных видов, выявил тысячи дополнительных потенциальных защитных белков, ранее не описанных в научной литературе.
Параллельно другая группа из Института Пастера использовала собственные ИИ-модели и предсказала около 2,4 млн потенциальных антивирусных белков в более чем 32 000 бактериальных геномов, что подчёркивает масштаб скрытого биологического разнообразия.
Учёные отмечают, что бактериальные системы защиты представляют собой огромный, практически неисследованный резерв биологических механизмов. Помимо CRISPR, уже известны системы с функциями «молекулярных ножниц», «токсин-антитоксинные комплексы» и другие механизмы, которые находят применение в биотехнологии — от генной инженерии до создания биологических «выключателей» для контроля модифицированных организмов.
Однако ключевая проблема остаётся прежней: большинство таких систем крайне трудно обнаружить стандартными методами. Именно поэтому ИИ-подходы становятся важными — они позволяют анализировать миллионы последовательностей и выявлять функциональные закономерности, которые человек не может увидеть напрямую.
По словам исследователей, итоговая цель подобных систем — не только ускорить поиск новых биологических инструментов, но и понять, как в принципе эволюционировала иммунная система микроорганизмов. В перспективе такие открытия могут привести к появлению нового поколения технологий: от более точных методов генного редактирования до принципиально новых молекулярных инструментов для медицины и синтетической биологии.




