Медиатека
«Последние штрихи»: на пути к секвенированию полного генома человека
«Постгеномная эра» в науке, наступившая после публикации первых версий человеческого генома в рамках нашумевшего проекта «Геном человека», ознаменовалась новым достижением – ученые впервые представили полный, высокоточный геном человека (Рис. 1) 1. Это важная веха на пути к пониманию структуры нашего генома, но далеко не точка – впереди предстоит большая работа по его аннотации (картированию генов и других функциональных элементов), раскрытию подробностей и особенностей его функционирования.
Рис. 1. Специальный выпуск журнала Science «Заполняя пробелы: приближение к полному геному человека». Схематическая визуализация 22 аутосом и Х хромосомы; красным выделены области, секвенирование которых недавно завершилось.
Источник >>
«Геном человека» – один из самых масштабных, амбициозных и дорогостоящих проектов в истории биологии, объединивший ученых из многих лабораторий мира и впервые подаривший человечеству расшифровку «кода жизни» – секвенирование человеческого генома. Проект имеет богатую историю, насыщенную моментами сомнений и гордости, технологическими прорывами, конкуренцией, а его реализация стала крупнейшим достижением мировой науки и внесла неоценимый вклад в развитие современной геномики, генетики, молекулярной биологии и медицины.
План проекта, стартовавшего в 1990 году, был рассчитан на 15 лет, но благодаря усилиям ученых и развитию технологий секвенирования ДНК его удалось завершить на несколько лет раньше. Несмотря на то, что проект был завершён в 2004 году после первого прочтения генома 2 («черновые» варианты были представлены еще ранее – в 2001 году 3, 4), работа по секвенированию отдельных участков и аннотации генома продолжается до сих пор.
Формально первый «референсный» геном не был полным – по оценкам было секвенировано порядка 92%, куда вошли преимущественно области менее плотно упакованной и содержащей активно транскрибируемые гены фракции ДНК – эухроматина. С тех пор данные постоянно обновляются и редактируются, а самым последним достижением в расшифровке человеческого генома стала недавняя публикация версии генома почти со 100% покрытием 1. Ученым, в том числе из России, удалось прочитать последовательности оставшихся 8% ДНК (Рис. 1, красные области), составляющих плотно упакованные участки центральных областей хромосом – центромеры, а также короткие концевые участки (плечи) акроцентрических хромосом (хромосом, у которых центромера смещена к концу плеча). Помимо конденсированного состояния, сложность работы с этими участками состоит в расположении в них массивов сателлитной ДНК – тандемно организованных повторяющихся последовательностей, несателлитных дуплицированных повторов, а также рибосомной ДНК, содержащей множественные копии генов рибосомной РНК.
Новый эталонный геном, названный T2T-CHM13 по названиям консорциума исполнителей проекта (T2T, Telomere-to-Telomere) и выбранной клеточной линии-донора генетического материала (CHM13), включает почти 200 млн новых пар оснований ДНК, отсутствующих в предыдущей версии генома GRCh38.p13 5, обновленного в 2019 году. На основании полученных данных удалось исправить ошибки и заполнить пробелы в предыдущей версии, а также предсказать порядка 1900 новых генов, включая около сотни белок-кодирующих. Таким образом, версия T2T-CHM13 является на сегодняшний день самым полным и точным вариантом человеческого генома – включает непрерывные последовательности 22 человеческих аутосом и Х-хромосомы (всего 3,054,815,472 пар оснований ядерной ДНК), а также 16 569 пар оснований митохондриального генома.
Кроме того, уникальность представленной версии генома состоит в том, что генетический материал был взял из одной, практически гомозиготной, клеточной линии (CHM13), а не от многих доноров человеческих клеток, что делало предыдущие варианты сборки «мозаичными». Культура клеток CHM13 представляет собой оплодотворенные яйцеклетки, в которых материнский набор аутосом был утерян, а отцовский дуплицирован, давая кариотип 46,XX. С другой стороны, отсутствие последовательности Y-хромосомы делает представленный геном не на 100% полным, предваряя дальнейшую работу по секвенированию последней оставшейся хромосомы в отдельном порядке.
Неполнота генома в проекте «Геном человека» была связана с техническими и методологическими ограничениями имевшихся на тот момент техник секвенирования, нежели отсутствием интереса к оставшимся 8% генома (по длине это почти целая хромосома), хотя они и считались некодирующими или даже «мусорными». В основе метода лежал способ фрагментации ДНК на перекрывающиеся последовательности длиной примерно 150 000 пар оснований с их встраиванием в искусственные бактериальные хромосомы (BACs), последующим секвенированием более коротких участков по методу Сэнгера и сборкой генома. Это довольно трудоемкий и времязатратный процесс. Кроме того, ограничения, связанные с клонированием в BACs, привели к тому, что в конечном варианте генома были не представлены или неправильно собраны многие повторяющиеся последовательности. Конкурирующая с государственным проектом «Геном человека» коммерческая организация в лице Крейга Вентера и Celera Genomics использовала более быстрый подход, избегая стадию клонирования в бактериальные хромосомы и секвенируя фрагменты ДНК напрямую, фланкируя их известными последовательностями. Появление автоматических капиллярных секвенаторов, а также флуоресцентно-меченых нуклеотидов, сделало процесс секвенирования ДНК гораздо более быстрым и дешевым, что в итоге позволило проекту «Celera» получить свою версию генома всего за 3 года и за гораздо меньший бюджет 4.
Для секвенирования и сборки генома T2T-CHM13 использовали самые современные методические разработки и программное обеспечение, позволившие преодолеть технические трудности предыдущих проектов. Технологии секвенирования «сложных» участков генома T2T-CHM13 основаны на прочтении длинных фрагментов ДНК: модифицированный метод циклического консенсусного секвенирования позволил с высокой точностью (до 99.9%) секвенировать фрагменты до 20.000 пар оснований; нанопоровое секвенирование обеспечило прочтение ультра-длинных ридов (более 100.000 пар оснований). Секвенирование основной части T2T-CHM13 проводили комбинацией методов секвенирования нового поколения (NGS).
Технологии секвенирования ДНК постоянно совершенствуются, делая этот метод быстрым, недорогим и доступным для многих лабораторий и медицинских учреждений. На сегодняшний день линейка секвенаторов очень обширна и покрывает самые разнообразные нужды – от рутинного секвенирования небольших фрагментов ДНК до секвенирования целых геномов.
Одним из ведущих мировых поставщиков услуг геномного секвенирования является компания BGI Group (Китай, США). Основанная в 1999 году для участия в проекте «Геном человека», компания уже в июне 2000 года объявила о секвенировании 1% генома, таким образом вписав свое имя в историю легендарного проекта. Позднее компания секвенировала геномы дрожжей, бактерий, растений (риса), животных (цыпленка, шелкопряда, большой панды и др.), коронавирусов SARS-CoV и SARS-CoV2 и др. На сегодняшний день BGI Group участвует в многочисленных международных геномных проектах и продолжает заниматься серьезной научной работой на базе платформ собственного производства 6.
Полное знание генома человека позволит выяснить роль ранее неизвестных его элементов, понять природу наследования многих признаков и, соответственно, генетических заболеваний, генезис которых ранее не удавалось проследить. Использование новой (полной) последовательности генома человека в качестве референса при биоинформатическом анализе данных секвенирования значительно улучшит качество генетических исследований всех типов: предиктивной генетики, прогнозирования и идентификации онкологических заболеваний, генезиса наследственных заболеваний, в том числе орфанных, и т.д.
Дмитрий Хачин
Ведущий специалист по продукции, Компания Хеликон.
Литература
1. Nurk S. et al. The complete sequence of a human genome. Science, 2022.
2. Eichler E., Clark R., She X. An assessment of the sequence gaps: Unfinished business in a finished human genome. Nature Reviews Genetics, 2004.
3. International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome. Nature, 2001.
4. Venter J.C. et al. The Sequence of the Human Genome. Science, 2001.
5. Schneider V.A. et al. Evaluation of GRCh38 and de novo haploid genome assemblies demonstrates the enduring quality of the reference assembly. Genome Research, 2017.
6. History of BGI.