ENCODE: онлайн-энциклопедия человеческого генома

Страница для печати

Продолжается веб-публикация обширной базы данных, в которой каталогизированы функциональные элементы генома человека — гены, РНК-транскрипты и др. Проект ENCODE (Encyclopedia Of DNA Elements, «Энциклопедия ДНК-элементов») — первая попытка всеобъемлющей интерпретации человеческого генома, а также руководство по использованию огромного количества данных. Один из главных участников проекта Росс Хардисон из Университета штата Пенсильвания (США) отмечает, что ENCODE идёт по пятам 13-летней программы «Геном человека», направленной на выявление всех генов в ДНК человека (всего их 20–25 тыс.). Она тоже была основана на междисциплинарном и открытом обмене данными.  В геноме человека — около 3 млрд пар оснований; каталогизация и интерпретация этой информации — поистине монументальная задача. «Мы не просто ищем гены, которые дают информацию для клеток и белков, — говорит г-н Хардисон. — Мы также хотим знать, что определяет производство белков в определённых клетках в надлежащее время. Поиск ДНК-элементов, которые управляют регулируемой экспрессией генов, — одна из основных задач ENCODE. Расшифровка генома человека без интерпретации — это всего лишь описание шифра без ключа, всего лишь огромное нагромождение букв».

В частности, ENCODE предоставляет информацию о том, где белки связываются с ДНК и где участки ДНК увеличиваются за счёт дополнительных маркеров. Эти белки и химические добавки являются ключом к пониманию того, как различные клетки человеческого организма интерпретируют язык ДНК.

Например, учёные знают, что варианты ДНК, расположенные перед геном MYC, связаны с несколькими видами рака, но до недавнего времени механизм этой связи оставался тайной. Именно проект ENCODE показал, что данные варианты способны изменить связывание определённых белков, и это приводит к повышению экспрессии гена MYC и развитию рака. Аналогичным образом изучены тысячи прочих вариантов ДНК.

Сотрудники проекта применяют около двадцати различных тестов. В их распоряжении 108 клеточных линий. Джон Стаматояннопулос из Университета штата Вашингтон (США) отмечает, что многие молекулярно-биологические процедуры для измерения активности биохимических агентов, имеющие ныне основополагающее значение для биологии, были созданы именно в рамках ENCODE. Та же ситуация с вычислительными средствами для обработки и интерпретации крупномасштабных функциональных геномных данных.

Росс Хардисон напоминает, что та часть генома человека, которая кодирует белки, составляет только 1,1% — но это бездна информации. Ситуация осложняется тем, что большинство механизмов экспрессии генов и регулирования лежат за пределами кодирующей области ДНК. А набор инструментов для изучения генома весьма ограничен. Самый распространённый — межвидовое сравнение. Например, можно сравнить человека и шимпанзе. Между белками и другими ДНК-продуктами этих видов очень мало различий, но экспрессия генов на базовом уровне, определяющем цвет глаз, рост, склонность к определённой болезни, различается довольно сильно. Здесь-то и требуется помощь ENCODE.

В геноме человека — около 3 млрд пар оснований.


 @Mail.ru Rambler's Top100