Революционная поисковая система по ДНК ускоряет генетические открытия
Учёные из ETH Zurich создали MetaGraph — инструмент, который сжимает геномные данные в 300 раз и позволяет искать триллионы последовательностей ДНК за секунды, подобно Google для генетики
Короткое резюме
Исследователи из Цюрихской высшей технической школы (ETH Zurich) разработали революционную поисковую систему MetaGraph, которая функционирует как «Google для ДНК». Система решает ключевую проблему современной биомедицины — невозможность эффективного поиска в огромных генетических базах данных, которые сейчас содержат около 100 петабайт информации (примерно эквивалентно всему текстовому контенту интернета). Вместо необходимости загружать целые наборы данных, исследователи могут вводить интересующую генетическую последовательность в поисковую строку и получать результаты за секунды или минуты.
Ключевым достижением является беспрецедентная степень сжатия — в 300 раз. MetaGraph организует данные с помощью продвинутых математических графов, эффективно структурируя информацию и удаляя избыточность, подобно сжатому пересказу книги, сохраняющему все ключевые сведения. Система масштабируема: чем больше объем запрашиваемых данных, тем меньше дополнительных вычислительных ресурсов требуется. Поиск также чрезвычайно экономичен — около 0.74 доллара за мегабазу для крупных запросов.
Инструмент уже общедоступен и индексирует миллионы последовательностей ДНК, РНК и белков из вирусов, бактерий, грибов, растений, животных и человека, охватывая почти половину всех публичных данных. Ожидается, что полный охват будет достигнут к концу года. MetaGraph может трансформировать биомедицинские исследования, ускорив идентификацию возникающих патогенов, анализ устойчивости к антибиотикам и поиск полезных бактериофагов. В будущем система может даже использоваться частными лицами для точного определения видов растений.
Скорость поиска
Поиск по триллионам последовательностей ДНК/РНК за секунды вместо загрузки массивных файлов
Степень сжатия
Достигнуто сжатие геномных данных в 300 раз без потери информации
Экономическая эффективность
Стоимость крупных запросов составляет около 0.74 доллара за мегабазу
Масштабируемость
Чем больше данных, тем меньше требуется дополнительных вычислительных мощностей
Текущий охват
Система уже индексирует ~50% всех публичных генетических данных
Открытый исходный код
MetaGraph является открытым исходным кодом, что способствует его широкому распространению
Текст сгенерирован с использованием ИИ


