News

00:00
Новости науки
Новости науки
...
News
13:15, 29 Oct

Революционная поисковая система по ДНК ускоряет генетические открытия

Учёные из ETH Zurich создали MetaGraph — инструмент, который сжимает геномные данные в 300 раз и позволяет искать триллионы последовательностей ДНК за секунды, подобно Google для генетики

A revolutionary DNA search engine is speeding up genetic discovery | ScienceDaily
sciencedaily.com
sciencedaily.com

Короткое резюме

Исследователи из Цюрихской высшей технической школы (ETH Zurich) разработали революционную поисковую систему MetaGraph, которая функционирует как «Google для ДНК». Система решает ключевую проблему современной биомедицины — невозможность эффективного поиска в огромных генетических базах данных, которые сейчас содержат около 100 петабайт информации (примерно эквивалентно всему текстовому контенту интернета). Вместо необходимости загружать целые наборы данных, исследователи могут вводить интересующую генетическую последовательность в поисковую строку и получать результаты за секунды или минуты.

Ключевым достижением является беспрецедентная степень сжатия — в 300 раз. MetaGraph организует данные с помощью продвинутых математических графов, эффективно структурируя информацию и удаляя избыточность, подобно сжатому пересказу книги, сохраняющему все ключевые сведения. Система масштабируема: чем больше объем запрашиваемых данных, тем меньше дополнительных вычислительных ресурсов требуется. Поиск также чрезвычайно экономичен — около 0.74 доллара за мегабазу для крупных запросов.

Инструмент уже общедоступен и индексирует миллионы последовательностей ДНК, РНК и белков из вирусов, бактерий, грибов, растений, животных и человека, охватывая почти половину всех публичных данных. Ожидается, что полный охват будет достигнут к концу года. MetaGraph может трансформировать биомедицинские исследования, ускорив идентификацию возникающих патогенов, анализ устойчивости к антибиотикам и поиск полезных бактериофагов. В будущем система может даже использоваться частными лицами для точного определения видов растений.

Ключевые выводы
Скорость поиска

Поиск по триллионам последовательностей ДНК/РНК за секунды вместо загрузки массивных файлов

Степень сжатия

Достигнуто сжатие геномных данных в 300 раз без потери информации

Экономическая эффективность

Стоимость крупных запросов составляет около 0.74 доллара за мегабазу

Масштабируемость

Чем больше данных, тем меньше требуется дополнительных вычислительных мощностей

Текущий охват

Система уже индексирует ~50% всех публичных генетических данных

Открытый исходный код

MetaGraph является открытым исходным кодом, что способствует его широкому распространению

Текст сгенерирован с использованием ИИ

биоинформатика, поисковая система ДНК, MetaGraph, сжатие геномных данных, большие данные в биологии, ETH Zurich, генетический поиск
1

Recommendations on the topic

Comments

Golos Nauki Logo
Home page
Support Project
Sections
Быстрый доступ
  • Author's interview
  • Video Abstracts
Sponsor
* is not an advertisement
Presentation
Information

    Phone: 8 (800) 350 17-24email: office@golos-nauki.ru
    Sign Up
    Новости наукиNews Feed
    Other News