База данных для инвентаризации профилей белковых форм / протеоформ – «2DE-паттерн»

Четверг, 16 июля 2020

Сотрудники Лаборатории протеомики Отделения молекулярной и радиационной биофизики НИЦ «Курчатовский институт» - ПИЯФ совместно с коллегами из НИИ биомедицинской химии им. Ореховича создали базу данных для инвентаризации профилей белковых форм.

Термин «proteome» был предложен в 1995 году Марком Уилкинсом (MarcWilkins) с соавторами для описания полного набора белков, кодируемых геномом. Сегодня протеомику можно определить как совокупность технологий, направленных на крупномасштабное изучение структур, пост-трансляционных модификаций и взаимодействий белков в живых организмах.  Основной задачей протеомики является количественная оценка изменений уровня экспрессии белков в клетках, тканях или целом организме как в норме, так и при воздействии на них различных внешних факторов. В основе протеомных исследований лежат разнообразные геномные и протеомные базы данных. Ключевая роль здесь принадлежит масс-спектрометрии — основному инструментальному методу анализа белков и пептидов и биоинформатике, коррелирующей результаты масс-спектрометрического анализа с информацией о белках, заложенной в эти базы данных.

Сложность изучения протеома человека состоит в том, что составляющие его белки существуют в виде разнообразных и гетерогенных продуктов (белковых форм / протеоформ). Один и тот же белок может быть представлен в виде десятков и сотен разных протеоформ, каждая из которых имеет свое функциональное значение. Так как объем информации о протеоформах, генерируемой разными методами, неуклонно растет, необходим удобный подход для инвентаризации получаемых данных. Созданная база данных называется «2DE-паттерн», так как она содержит множество паттернов (наборов) протеоформ, соответствующих отдельным белкам и разделенных в соответствии с принципами 2DE.

«Мы построили базу данных протеоформ, которая основана на информации, полученной нами путем разделения протеоформ с использованием двумерного электрофореза (2DE) с последующей идентификацией белков с помощью широкоформатной масс-спектрометрии (ESI–ЖХ-МС/МС), - комментирует заведующий Лабораторией протеомики, профессор С.Н. Нарыжный. - Основная практическая ценность базы состоит в возможности поиска на ее основе онкологических биомаркеров. В настоящее время имеется сеть белковых баз данных (World-Wide Gel-based Proteomics Databases), построенных на основе двумерного электрофореза (2DE). Ключевое слово здесь – белковых. Уникальность нашей базы состоит в том, что она основана на разработанном нами уникальном подходе и не только очень сильно дополняет имеющиеся базы, но и позволяет получить информацию не просто о белках, но их вариантах, то есть о протеоформенных паттернах».

База адресована ученым, работающим как в области протеома человека, так и в области белковой биохимии и онкологии. В данный момент она содержит информацию о белках трех видов клеток человека, но постепенно в нее будет вводиться как уже имеющаяся в нашем распоряжении, так и непрерывно получаемая новая информация.  Как минимум, будут включены данные еще о нескольких видах клеток, а также и о плазме крови человека.

«Сложность работы состоит в огромном объеме информации, которую необходимо критически и качественно переработать, а затем представить в удобном для восприятия виде, - говорит С.Н. Нарыжный. - К тому же сложности добавляет то, что классификация белков и их вариантов находится в процессе непрерывного роста и может изменяться. Этим, кстати, занимается целый институт в Швейцарии (Swiss Institute of Bioinformatics). То есть приходится непрерывно за этим следить и проводить, условно говоря, апгрейд данных».

База данных находится в свободном доступе по адресу http://2de-pattern.pnpi.nrcki.ru.

Теги
фгбу пияф им. Б. П. Константинова Национальный исследовательский центр Курчатовский институт