Как биоинформатика помогает ученым раскрывать тайны генома?
25 апреля во всем мире отмечается День ДНК. В честь этой даты руководитель Центра системной биоинформатики Томского НИМЦ Павел Ямщиков рассказал, как биоинформатика помогает раскрывать тайны генома и о каких объемах данных идет речь.
- Биоинформатика сегодня — это стратегический инструмент, без которого невозможны ни фундаментальные открытия в области геномики, ни их трансляция в клиническую практику. Центр системной биоинформатики Томского НИМЦ создан именно для того, чтобы обеспечить системное решение биоинформатических задач в биомедицинских исследованиях. Мы предоставляем исследовательским группам доступ к масштабным вычислительным ресурсам и экспертной поддержке для анализа геномных, транскриптомных, эпигеномных и протеомных данных — включая технологии в пространственном и одноклеточном разрешениях.
Как биоинформатика помогает ученым раскрывать тайны нашего генома?
- Биоинформатика — это не просто помощь, это необходимое условие развития современной геномики. Сырые данные секвенирования — это сотни гигабайт последовательностей, бессмысленных без соответствующих алгоритмов. Именно биоинформатические методы позволяют анализировать геном, выявлять мутации, понимать, как эти изменения связаны с болезнями. От анализа вариаций до предсказания эффективности терапии — всё это работа вычислительных методов, без которых мы бы остались на уровне догадок.
О каких цифрах идет речь? Сколько данных у Центра?
- Центр системной биоинформатики работает с данными тысяч экзомов и полных геномов, а также сотен транскриптомов, в том числе в одноклеточном и пространственном разрешениях. Эти данные — не просто статистика: это активный материал для анализа и научных выводов, ежедневно загружающий наши вычислительные мощности.
Как биоинформатика экономит время ученых?
- Раньше анализ геномных данных был ограничен вычислительными мощностями и недостаточной автоматизацией. Выравнивание, фильтрация и аннотирование мутаций занимали недели даже при участии целых лабораторий. Сегодня благодаря высокоавтоматизированным биоинформатическим пайплайнам и современным серверам тот же объём данных — десятки экзомов или геномов — может быть проанализирован за сутки.
- Для сравнения: проект "Геном человека", закончившийся в 2003 году, потребовал 13 лет и $3 млрд. Сейчас сопоставимый по объему проект выполняется за дни и на порядки меньшими затратами.
Какие проекты сейчас находятся в работе?
- Сейчас в фокусе Центра несколько направлений:
- молекулярные механизмы молодого рака — выявление специфических транскрипционных сигнатур;
- разработка мРНК-вакцин против онкологических заболеваний;
- исследование механизмов, связанных с эффективностью химиотерапии, с целью разработки персонализированных подходов к лечению.
Известно, что биоинформатика работает с большими объемами данных. Насколько большими?
- В биоинформатике "большие" — это не оборот речи. Один полногеномный анализ в среднем требует около 100–150 ГБ данных. Типичная задача, например, исследование когорты из десятков и сотен пациентов, — это уже десятки терабайт. Центр решает задачи анализа, где объёмы данных исчисляются в сотнях гигабайт на проект, что требует серьёзных вычислительных мощностей и чётко выстроенных аналитических процессов.
Источник:
Новости Томского НИМЦ