Для исследования функций кишечного микробиома появилась новая парадигма
Международная исследовательская группа создала базу данных белковых структур кишечного микробиома и метод структурного поиска, что значительно повысило способность прогнозирования функциональных "темных материй", таких как белки бактериофагов
Короткое резюме
Исследовательская группа под руководством Дай Лэя из Шэньчжэньского института передовых технологий Китайской академии наук совместно с коллегами из Пекинского университета и Китайского университета Гонконга разработала базу данных белковых структур и метод структурного поиска для кишечного микробиома человека. Эта новая методология значительно улучшила возможности прогнозирования функций так называемой «тёмной материи», включая белки бактериофагов и бактериальные изоферменты-хозяева.
Команда создала базу данных, охватывающую около 2,7 миллионов белковых структур, закодированных в геномах 968 кишечных бактерий и 1255 кишечных бактериофагов. Используя методы структурного сравнения и кластеризации, они обнаружили, что многие белки бактериофагов имеют структурное сходство с белками известных функций, что позволяет делать более точные функциональные выводы. Метод также позволил выявить и экспериментально подтвердить активность бактериофаговых лизинов, нацеленных на кишечные патогены, и раскрыть ранее неизвестные пути синтеза мелатонина кишечными бактериями.
На основе этого подхода была разработана модель искусственного интеллекта, которая быстро и эффективно идентифицирует изоферменты, значительно превосходя существующие методы, основанные на сравнении последовательностей или структур. Эта модель, использующая языковую модель белков, обогащённую структурной информацией, и методы контрастного обучения, открывает путь для точного прогнозирования функций ферментов и быстрого поиска без традиционного выравнивания последовательностей. Данная исследовательская парадигма не только применима для поиска дивергентных ферментов, но и может быть расширена для изучения белков с другими функциями, предлагая новые инструменты для точного редактирования микробиома.
Создание масштабной базы данных белковых структур
Разработана база данных, содержащая ~2,7 млн структур белков, кодируемых геномами 968 кишечных бактерий и 1255 кишечных бактериофагов
Повышение прогнозирования функций «тёмной материи»
Структурный поиск и сравнение значительно улучшили способность предсказывать функции белков бактериофагов и бактериальных изоферментов-хозяев
Открытие и валидация новых биологических функций
Метод позволил выявить и экспериментально подтвердить активность бактериофаговых лизинов против патогенов, а также раскрыть пути синтеза мелатонина кишечными бактериями (например, Bifidobacterium adolescentis, Bacteroides thetaiotaomicron)
Разработка превосходящей модели ИИ
Создана модель ИИ, объединяющая языковую модель белков со структурной информацией и контрастным обучением, которая быстрее и точнее идентифицирует изоферменты по сравнению с методами, основанными на последовательностях или выравнивании структур
Текст сгенерирован с использованием ИИ

