Идентификации белков активное применение. Методы выделения, очистки, идентификации и изучения мембранных структур

2 ОБЗОР ЛИТЕРАТУРЫ.

2.1 Масс-спектрометрия в протеомике.

2.1.1 Общие принципы.

2.1.2 Протеомный анализ с использованием масс-спектрометрии.

2.1.3 Идентификация белков методом отпечатков пептидных масс.

2.1.4 Идентификация белков методом отпечатков фрагментации пептидов.

2.2 Интерпретация результатов масс-спектрометрической идентификации белков.

2.2.1 Определение списка идентифицированных белков.

2.2.2 Идентификация высокогомологичных белков.

2.2.3 Базы данных аминокислотных последовательностей белков.

2.3 Масс-спектрометрический анализ продуктов одного гена.

2.3.1 Протеотипирование и популяционная протеомика.

2.3.2 Идентификация микрогетерогенности белков методом «сверху-вниз».

2.3.3 Идентификация генетически-детерминированного полиморфизма белков методом «снизу-вверх».

2.3.4 Базы данных полиморфизмов белков и генов.

2.3.5 Репозитории масс-спектрометрических данных.

3 МАТЕРИАЛЫ И МЕТОДЫ.

3.1 Материалы.

3.1.1 Масс-спектрометрические данные для белков микросомальной фракции печени человека.

3.1.2 Контрольный набор масс-спектров «Aurum Dataset».

3.1.3 Масс-спектрометрические данные протеомного репозитория PRIDE.

3.1.4 Базы данных аминокислотных последовательностей белков человека.

3.1.5 Данные о возможных полиморфизмах белков человека.

3.2 Методы.

3.2.1 Веб-сервер идентификации белков по масс-спектрам.

3.2.2 Пакетная обработка масс-спектров методом отпечатков пептидных масс.

3.2.3 Пакетная обработка тандемных масс-спектров.

3.2.4 Одномерное протеомное картирование.

3.2.5 Программная реализация итеративного алгоритма идентификации ОАП.

3.2.6 Валидация алгоритма идентификации ОАП.

4 РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ.

4.1 Увеличение степени покрытия аминокислотных последовательностей идентифицированными пептидами.

4.1.1 Идентификация белков в срезах геля.

4.1.2 Одномерные протеомные карты и их свойства.

4.1.3 Выявление высокогомологичных белков надсемейства цитохромов Р450 за счет увеличения степени покрытия аминокислотных последовательностей идентифицированными пептидами.

4.2 Идентификация ОАП в белках надсемейства цитохромов Р450.

4.3 Алгоритм идентификации ОАП.

4.3.1 Итеративная схема обработки тандемных масс-спектров.

4.3.2 Чувствительность и специфичность алгоритма идентификации ОАП.

4.4 Применение итеративного алгоритма для выявления ОАП в масс-спектрометрических данных протеомного репозитория PRIDE.

4.4.1 Исходные данные, используемые для выявления ОАП.

4.4.2 Идентификация пептидов и белков с использованием масс-спектрометрических данных, загруженных из репозитория PRIDE.

4.4.3 Идентификация одноаминокислотных полиморфизмов.

4.5 Анализ идентифицированных ОАП.

4.5.1 Анализ ОАП-содержащих пептидов.

4.5.2 Связь выявленных ОАП с заболеваниями человека.

Рекомендованный список диссертаций

  • Посттрансляционная регуляция цитохромов Р450 подсемейства 2В 2013 год, доктор биологических наук Згода, Виктор Гаврилович

  • Масс-спектрометрическое определение активности и содержания цитохромов P450 2013 год, кандидат биологических наук Москалева, Наталья Евгеньевна

  • Структурно-функциональное картирование белков цитохром Р450-содержащих монооксигеназных систем 2002 год, доктор биологических наук Колесанова, Екатерина Федоровна

  • Метод распознавания аминокислотных последовательностей в масс-спектрах пептидов для задач протеомики 2007 год, кандидат технических наук Лютвинский, Ярослав Игоревич

  • Универсальная шкала хроматографических времен удерживания биомакромолекул в задачах "скорострельной" протеомики 2011 год, кандидат физико-математических наук Придатченко, Марина Леонидовна

Введение диссертации (часть автореферата) на тему «Анализ масс-спектров пептидных фрагментов для идентификации генетически детерминированного полиморфизма белков»

В базе данных Ensembl содержатся сведения о 20 469 кодирующих генов, полученные на основе результатов сборки генома человека, выполненной в Национальном центре биотехнологической информации США (февраль 2009). Небольшое число генов позволяет заключить, что сложность живых систем достигается на уровне регуляции транскрипции, трансляции, и пост-трансляционных модификаций. Альтернативный сплайсинг и такие модификации, как фосфорилирование, гликозилирование, наряду с протеолитическим процессингом, приводят к формированию многообразия белков, количество которых на несколько порядков превышает количество генов. Проведенные различными методами оценки показывают, что протеом человека может насчитывать несколько миллионов различающихся по своему химическому строению белков .

Традиционный подход к исследованию протеома основан на использовании иммуногистохимического окрашивания тканевых срезов. Первый вариант протеомного атласа человека пыл построен с применением антител . Использование биологических микрочипов, содержащих нанесенные на них антитела, позволяет идентифицировать и количественно измерить до нескольких сотен белков в одном образце . Однако данный подход имеет ограничения, которые связаны с необходимостью наработки и верификации антител, недостаточной специфичностью за счет перекрестных взаимодействий и относительно низкой аффинностью комплексов антиген-антитело. В связи с этим особую важность для исследования протеома приобрел более универсальный и не требующий иммуноспецифичных реагентов метод идентификации белков - биологическая масс-спектрометрия .

При масс-спектрометрическом анализе биоматериала идентификация белковых молекул осуществляется путем сопоставления измеренных масс-зарядных характеристик белков и/или их протеолитических фрагментов с теоретическими значениями, вычисленными на основании закодированных в геноме аминокислотных последовательностей. Необходимо учитывать, что в последовательности генома в явном виде не содержится информации о сайтах альтернативного сплайсинга и о возможных пост-трансляционных модификациях. Выявление случаев альтернативного сплайсинга возможно на основании экспериментальных данных: источником сведения о сплайс-изоформах являются базы данных кодирующих ДНК . Выявление посттрансляционных модификаций осуществляется с использованием высокоточной масс-спектрометрии белков или с применением тандемной масс-спектрометрии пептидных фрагментов

Наряду с альтернативным сплайсингом и пост-трансляционной модификацией, разнообразие белковых молекул увеличивается за счет трансляции несинонимичных однонуклеотидных полиморфизмов (non-synonymous Single Nucleotide Polymorphism, nsSNP). Установление наличия nsSNP производится с использованием генотипирования, тогда как подтверждение наличия соответствующей замены остатка в первичной структуре белка, то есть выявление одноаминокислотных полиморфизмов (ОАП, Single Amino Acid Polymorphism, SAP), относится к задачам протеотипирования .

Важность идентификации и исследования на белковом уровне альтернативного сплайсинга, ОАП и пост-трансляционных модификаций обусловлена влиянием данных процессов на уровень экспрессии и функциональные свойства белков. Известно, что изменение активности или уровня экспрессии белков может приводить к возникновению и развитию социально-значимых заболеваний, включая онкологические , сердечно-сосудистые и нейродегенеративные заболевания.

В геноме установлено наличие около 65 тысяч несинонимичных полиморфизмов, предположительно транслируемых в ОАП, причем более 30% предположительно приводят к изменению функциональных свойств белков . Поскольку изменение активности белков связано с развитием заболеваний, то исследования ОАП необходимы для определения структурных причин, лежащих в основе наблюдаемых функциональных нарушений . В задачи протеотипирования входит качественное и количественное определение экспрессии аллельных вариантов генов на протеомном уровне , а также мониторинг частоты встречаемости экспрессируемых аллельных вариантов белков на популяционном уровне .

Идентификация ОАП в высокопроизводительном режиме с использованием масс-спектрометрии сопряжена с техническими ограничениями. Для задачи протеотипирования наиболее адекватным является подход «сверху-вниз», то есть масс-спектрометрия интактных белков (а не их фрагментов). Однако, чувствительность такого подхода невелика, на уровне 10ч-10 5 М. Как следствие, обеспечивается идентификация десятков, реже сотен, и, только в исключительных случаях до тысячи белков. Наиболее часто в биологической масс-спектрометрии применяют другой подход - «снизу-вверх», в котором наличие в образце белка устанавливается путем идентификации его протеолитических фрагментов (пептидов) . В большинстве случаев для идентификации белка достаточно небольшого количества пептидов, которые в совокупности могут составлять не более 5% последовательности биополимера. Для оставшейся части аминокислотной последовательности белка невозможно установить наличие/отсутствие химических модификаций аминокислотных остатков или аминокислотных полиморфизмов.

Для идентификации одноаминокислотных полиморфизмов белков человека с использованием биологической масс-спектрометрии необходимо повысить степень покрытия аминокислотной последовательности белка за счет выявления дополнительных протеолитических пептидов белка. Это возможно в результате проведения эксперимента с большим числом частично или полностью повторяющихся масс-спектрометрических анализов . Кроме того, в рамках одного исследования можно объединять данные протеомных экспериментов, выполненных множеством исследовательских групп. Доступ к обширной коллекции масс-спектров предоставляется различными протеомными репозиториями , в наиболее популярном из которых - PRIDE (Protein Identification Database) -хранятся результаты более 13 тысяч протеомных экспериментов. Чем выше окажется степень покрытия аминокислотной последовательности белка идентифицированными пептидами, тем больше вероятность подтвердить наличие или отсутствие одноаминокислотных замен в структуре белка.

При наличии обширного объема масс-спектрометрических данных решение задачи протеотипирования возможно за счет использования вычислительных методов биоинформатики. Например, анализ масс-спектрометрических данных может осуществляться с использованием баз данных экспрессируемых фрагментов (EST), в которых содержится информация о транслированных вариантах несинонимичных полиморфизма генов . Второй способ, реализованный во многих программах идентификации белков, представляет собой сравнение масс-спектров с базой данных теоретических последовательностей белков, допускающий наличие неточностей в виде замен аминокислотных остатков .

Недостатки указанных выше подходов хорошо известны . В базах данных экспрессируемых фрагментов содержится избыточная информация, включая ошибки секвенирования, что усложняет анализ результатов масс-спектрометрического исследования . Анализируя образец, в котором идентифицировано несколько сотен белков, полученные масс-спектры необходимо сопоставлять с накопленными за десятки лет сотнями тысяч транскриптов, в числе которых содержится более 5% ошибок . При анализе масс-спектров с допущением возможных неточностей в базе данных, игнорируется информация о реально существующих несинонимичных заменах, которые были установлены генотипированием. Искусственные допущения, введенные в базу данных или в алгоритм идентификации белков, приводят к снижению достоверности результатов. Указанные недостатки существующих методов протеотипирования обуславливают необходимость совершенствования вычислительных подходов к идентификации ОАП.

Целью работы являлась разработка способа анализа масс-спектрометрических данных для идентификации единичных аминокислотных полиморфизмов, возникающих в результате трансляции несинонимичных нуклеотидных замен в соответствующих генах, и применение разработанного способа для выявления аминокислотных замен в белках человека. Для достижения цели решались следующие задачи:

1. Провести обработку масс-спектров пептидных фрагментов для повышения степени покрытия аминокислотных последовательностей белков идентифицированными пептидами.

2. На модельном наборе масс-спектрометрических данных, обеспечивающих высокую степень покрытия последовательностей, разработать метод выявления одноаминокислотных замен в белках человека.

3. Обобщить метод выявления одноаминокислотных замен в форме универсального алгоритма обработки тандемных масс-спектров; оценить чувствительность и специфичность созданного алгоритма.

4. Применить созданный алгоритм для обработки репозитория масс-спектрометрических данных, определить одноаминокислотные полиморфизмы и охарактеризовать белки человека, содержащие выявленные полиморфизмы.

2 ОБЗОР ЛИТЕРАТУРЫ

Термин «протеом» - полная совокупность экспрессируемых в организме белков - был впервые предложен Марком Вилкинсом в связи с обозначившейся необходимостью дополнить знания о геномах соответствующей информацией о кодируемых в них белках . Объектом исследования при анализе протеома может выступать как целый организм, так и клеточный компонент, ткань, субклеточная структура, например, ядро, микросомальная фракция и др. .

Результаты проведения широкомасштабной инвентаризации белков с использованием масс-спектрометрии были опубликованы в работе Шевченко и соавторов в 1996 году . Появление биологической масс-спектрометрии ознаменовало наступление эры высокопроизводительных постгеномных технологий, позволяющих в результате проведения одного эксперимента получить информацию о генах и белках в масштабе всего организма. К постгеномным технологиям, кроме протеомики, относятся также геномика и транскриптомика. При анализе генетического материала постгеномные технологии позволяют устанавливать наличие полиморфизма генов с применением полногеномного ре-секвенирования или высокоплотного картирования однонуклеотидных замен (SNP).

Существующие подходы к исследованию многообразия белков можно разделить на два направления. В первом случае перед постановкой эксперимента заранее задано, идентификацию каких именно белковых молекул планируется провести. При таком подходе идентификацию белков проводят с использованием антител, которые применяют для гистохимического окрашивания тканевых срезов с последующим получением микрофотографий клеток. На микрофотографии среза флуоресцирующие участки соответствуют местам локализации выявляемого белка-антигена, причем интенсивность флуоресценции позволяет получить количественную оценку содержания этого белка.

В рамках крупного международного проекта ProteinAtlas осуществляется масштабная наработка антител к белкам всех генов человека . В ходе выполнения этого проекта было получено и размещено для общественного пользования более 400 000 микрофотографий иммуногистохимических окрашенных срезов практически для всех тканей человека. Сравнительный анализ распределения специфичной окраски белков позволил, в частности, выявить характерные профили экспрессии белков для раковых тканей. Однако, окрашивание тканевых срезов с использованием флуоресцентно-меченных антител является довольно грубым методом исследования протеома. Во-первых, как указывают сами разработчики проекта ProteinAtlas, качество многих коммерчески доступных антител крайне низкое. Примерно половина закупленных антител при верификации показывает низкую специфичность к исследуемому антигену, а также препараты антител часто характеризуются низкой чистотой. Во-вторых, большое количество комплексов антиген-антитело характеризуются константой диссоциации (107-108 М) , что обуславливает ограничение по чувствительности при измерении концентрации белков .

Кроме гистохимического анализа, исследование протеома осуществляется с использованием биологических микрочипов. Белковые микрочипы являются эффективным инструментом трансляционной медицины , но ограниченным по возможностям использования для широкомасштабного исследования протеома. Применение микрочиповых технологий в протеомике редко позволяет проводить идентификацию более десяти белков единовременно: при увеличении количества анализируемых белков стандартизация условий протекания взаимодействия антиген-антитело затруднена. Так, применение микрочипов приводит к появлению ложно-отрицательных результатов в случае, когда для комплексов антиген-антитело различия констант диссоциации составляют несколько порядков. Кроме того, стабильность антител очень сильно зависит от условий их хранения, поэтому использование белковых микрочипов ограничено временем непосредственно после их изготовления, что не позволяет данному виду анализа получить широкое распространение.

Второе направление исследований протеома связано с постановкой эксперимента в нак называемом «панорамном» (survey) режиме, когда заранее неизвестно, какие белки могут быть идентифицированы. Потенциально, в результате панорамного эксперимента могут быть идентифицированы любые белки, закодированные в геноме исследуемого организма, включая даже продукты считающихся не кодирующими участков генома. Технические и методические средства для полногеномного исследования протеома обеспечиваются биологической масс-спектрометрией.

Похожие диссертационные работы по специальности «Математическая биология, биоинформатика», 03.01.09 шифр ВАК

  • Транскриптомно-протеомный подход для анализа протеоформ клеточной линии HepG2 2018 год, кандидат биологических наук Киселева, Ольга Игоревна

  • Транскриптом и протеом хромосомы 18: экстраполяция результатов анализа на геномы человека и модельных объектов 2017 год, доктор биологических наук Пономаренко, Елена Александровна

  • Оценка пластичности протеома плазмы крови здорового человека в экстремальных условиях жизнедеятельности 2011 год, кандидат биологических наук Трифонова, Оксана Петровна

  • Поиск и идентификация потенциальных биомаркеров рака яичников в сыворотке крови человека 2015 год, кандидат биологических наук Арапиди, Георгий Павлович

  • Анализ фотодинамики белковых комплексов тилакоидных мембран при помощи масс-спектрометрии высокого разрешения 2011 год, кандидат химических наук Галецкий, Дмитрий Николаевич

Заключение диссертации по теме «Математическая биология, биоинформатика», Чернобровкин, Алексей Леонидович

1. Проведено протеомное картирование масс-спектрометрических данных, включающее идентификацию белков методом отпечатка пептидных масс с последующим анализом, направленным на выявление белок-специфичных протеотипических пептидов. На примере белков надсемейства цитохромов Р450 показано, что за счет картирования зон локализации белков в геле степень покрытия последовательности идентифицированными пептидными фрагментами увеличивается на 27 %.

2. Идентифицированы протеолитические пептиды, специфичные для форм цитохромов Р450 CYP3A4 и CYP3A5, идентичность последовательностей которых составляет 82%. Выявлены аллельные варианты трансляции цитохромов CYP3A4 и CYP3A5, содержащие одноаминокислотные полиморфизмы M445N (ЗА4), К96Е (ЗА4), L82R (ЗА5) и D277E (ЗА5).

3. Разработан итеративный алгоритм, предназначенный для идентификации одноаминокислотных полиморфизмов белков по тандемным масс-спектрам протеолитических пептидов. При тестировании на контрольном наборе «Aurum Dataset» алгоритм выявления полиморфизмов показал специфичность более 95%. Чувствительность алгоритма была на уровне 30%, что соответствует средней степени покрытия последовательностей, включенных в контрольный набор.

4. В результате анализа масс-спектрометрических экспериментов, депонированных в репозитории PRIDE, выявлено в общей сложности 270 одноаминокислотных полиморфизмов в 156 белках человека, в том числе 51 ОАП (45 белков) ассоциированы с заболеваниями, включая нарушения в системе свертываемости крови и системные амилоидозы.

Список литературы диссертационного исследования кандидат биологических наук Чернобровкин, Алексей Леонидович, 2012 год

1. Арчаков А.И. и др. Способ повышения точности определения последовательности аминокислотных остатков биополимера на основе данных массспектрометрического анализа, вычислительная система //2010.

2. Арчаков А.И. и др. Цитохромы Р450, лекарственная болезнь и персонифицированная медицина. Часть 1 // Клиническая медицина. 2008. Т. 86. № 2. С. 4-8.

3. Клюев H.A., Бродский Е.С. Современные методы масс-спектрометрического анализа органических соединений // Рос. хим. ж. (Ж. Рос. хим. об-ва им. Д.И. Менделеева). 2002. Т. XLVI. № 4. С. 57-63.

4. Лисица A.B. и др. Одномерное протеомное картирование цитохромов Р450 печени человека // Биохимия. 2009. Т. 74. № 2. С. 153-161.

5. Мясоедова К.Н. Новое в изучении цитохромов Р450 // Биохимия. 2008. Т. 73. №9. С. 1199-1205.

6. Петушкова H.A. и др. Идентификация цитохромов Р450 микросом клеток печени человека с помощью масс-спектрометрии // Биомедицинская химия. 2007. Т. 53. №4. С. 400-11.

7. Пономаренко Е.А., Ильгисонис Е.В., Лисица A.B. Технологии знаний в протеомике // Биоорганическая химия. 2011. Т. 37. № 2. С. 190-198.

8. Пономаренко Е.А. и др. Выявление дифференциально-экспрессирующихся белков с испольованием автоматического мета-анализа протеомных публикаций // Биомедицинская химия. 2009. Т. 3. № 1. С. 10-16.

9. Савельева М. и др. Значение генетического полиморфизма изоферментов цитохрома Р450 для персонализированного выбора и режимов дозирования антидепрессантов и антипсихотиков // Клиническая медицина. 2008. Т. 86. № 11. С. 22-28.

10. A gene-centric human proteome project: HUPO~the Human Proteome organization. // Molecular & cellular proteomics: MCP. 2010. Т. 9. № 2. С. 4279.

11. Aebersold R., Mann M. Mass spectrometry-based proteomics. // Nature. 2003. T. 422. № 6928. C. 198-207.

12. Ahrne E., Mtiller M., Lisacek F. Unrestricted identification of modified proteins using MS/MS // Proteomics. 2010. T. 10. № 4. C. 671-686.

13. Akiyama M. h «p. Ichthyosis bullosa of Siemens: its correct diagnosis facilitated by molecular genetic testing. // The British journal of dermatology. 2005. T. 152. №6. C. 1353-6.

14. Alves G. h jxp. Calibrating E-values for MS2 database search methods. // Biology direct. 2007. T. 2. № 1. C. 26.

15. Alves G., Ogurtsov A.Y., Yu Y.-K. RAId DbS: mass-spectrometry based peptide identification web server with knowledge integration. // BMC genomics. 2008. T. 9. C. 505.

16. Archakov A. h zip. Biospecific irreversible fishing coupled with atomic force microscopy for detection of extremely low-abundant proteins. // Proteomics. 2009. T. 9. № 5. C. 1326-43.

17. Archakov A. h ap. Gene-centric view on the human proteome project: the example of the Russian roadmap for chromosome 18. // Proteomics. 2011. T. 11. № 10. C. 1853-6.

18. Archakov A.I. h zip. AFM fishing nanotechnology is the way to reverse the Avogadro number in proteomics. // Proteomics. 2007. T. 7. № 1. C. 4-9.

19. Archakov A.I., Bachmanova G.I. Cytochrome P-450 and active oxygen. London: Taylor & Francis, 1990.

20. Asara J.M. h ^p. A label-free quantification method by MS/MS TIC compared to SILAC and spectral counting in a proteomics screen. // Proteomics. 2008. T. 8. № 5. C. 994-9.

21. Bairoch A., Apweiler R. The SWISS-PROT protein sequence database and its supplement TrEMBL in 2000. // Nucleic acids research. 2000. T. 28. № 1. C. 45-8.

22. Baldwin M. a. Protein identification by mass spectrometry: issues to be considered. //Molecular & cellular proteomics: MCP. 2004. T. 3. № 1. C. 1-9.

23. Bantscheff M. h ap. Quantitative chemical proteomics reveals mechanisms of action of clinical ABL kinase inhibitors. // Nature biotechnology. 2007a. T. 25. № 9. C. 1035-44.

24. Bantscheff M. h ,qp. Quantitative mass spectrometry in proteomics: a critical review. //Analytical and bioanalytical chemistry. 2007b. T. 389. № 4. C. 1017-31.

25. Barsnes H. h ap. PRIDE Converter: making proteomics data-sharing easy. // Nature biotechnology. 2009. T. 27. № 7. C. 598-9.

26. Baumgardner L.A. h Fast parallel tandem mass spectral library searching using GPU hardware acceleration. // Journal of proteome research. 2011. T. 10. № 6. C. 2882-8.

27. Beck F. h ap. The good, the bad, the ugly: Validating the mass spectrometric analysis of modified peptides // PROTEOMICS. 2011. C. n/a-n/a.

28. Bell A.W. h /jp. The protein microscope: incorporating mass spectrometry into cell biology. //Nature methods. 2007. T. 4. № 10. C. 783-4.

29. Binz P.-A. h ,qp. A Molecular Scanner To Automate Proteomic Research and To Display Proteome Images // Analytical Chemistry. 1999. T. 71. № 21. C. 49814988.

30. Binz P.-A. h pp. The molecular scanner: concept and developments. // Current opinion in biotechnology. 2004. T. 15. № 1. C. 17-23.

31. Birney E. h ap. An overview of Ensembl. // Genome research. 2004. T. 14. № 5. C. 925-8.

32. Birney E., Clamp M., Hubbard T. Databases and tools for browsing genomes. // Annual review of genomics and human genetics. 2002. T. 3. C. 293-310.

33. Bochet P. h flp. Fragmentation-free LC-MS can identify hundreds of proteins // PROTEOMICS. 2010. T. 11. № 1. C. n/a-n/a.

34. Boguski M.S., Lowe T.M., Tolstoshev C.M. dbEST-database for "expressed sequence tags". // Nature genetics. 1993. T. 4. № 4. C. 332-3.

35. Borges C.R. h np. Full-length characterization of proteins in human populations. // Clinical chemistry. 2010. T. 56. № 2. C. 202-11.

36. Bromberg Y., Rost B. SNAP: predict effect of non-synonymous polymorphisms on function. //Nucleic acids research. 2007. T. 35. № 11. C. 3823-35.

37. Brosch M. h np. Comparison of Mascot and XITandem performance for low and high accuracy mass spectrometry and the development of an adjusted Mascot threshold. // Molecular & cellular proteomics: MCP. 2008. T. 7. № 5. C. 962-70.

38. Bunger M.K. h ^p. Detection and validation of non-synonymous coding SNPs from orthogonal analysis of shotgun proteomics data. // Journal of proteome research. 2007. T. 6. № 6. C. 2331-40.

39. Bunkenborg J. h jip. Screening for N-glycosylated proteins by liquid chromatography mass spectrometry. // Proteomics. 2004. T. 4. № 2. C. 454-65.

40. Butenas S., Mann K.G., Butenas B. Blood Coagulation. : MAIK Nauka/Interperiodica distributed exclusively by Springer Science+Business Media LLC., 2002.

41. Canas B. h jyp. Mass spectrometry technologies for proteomics. // Briefings in functional genomics & proteomics. 2006. T. 4. № 4. C. 295-320.

42. Care M.A. h Deleterious SNP prediction: be mindful of your training data! // Bioinformatics (Oxford, England). 2007. T. 23. № 6. C. 664-72.

43. Casado-Vela J. h flp. Lights and shadows of proteomic technologies for the study of protein species including isoforms, splicing variants and protein post-translational modifications. // Proteomics. 2011. T. 11. № 4. C. 590-603.

44. Chapman P.F. h ap. Genes, models and Alzheimer"s disease // Trends in Genetics. 2001. T. 17. № 5. C. 254-261.

45. Chen M. h ap. Annotation of Non-Synonymous Single Polymorphisms in Human Liver Proteome by Mass Spectrometry // Protein and Peptide Letters. 2010. T. 17. № 3. C. 277-286.

46. Chen R. h zip. Glycoproteomics analysis of human liver tissue by combination of multiple enzyme digestion and hydrazide chemistry. // Journal of proteome research. 2009. T. 8. № 2. C. 651-61.

47. Choudhary J.S. h Interrogating the human genome using uninterpreted mass spectrometry data. // Proteomics. 2001a. T. 1. № 5. C. 651-67.

48. Choudhary J.S. h «p. Matching peptide mass spectra to EST and genomic DNA databases. // Trends in biotechnology. 2001b. T. 19. № 10 Suppl. C. S17-22.

49. Choudhury V. h ap. Two novel antithrombin variants (L99V and Q118P) which alter the heparin binding // Nouvelle Revue Française. 1994. T. 36. C. 268.

50. Colinge J., Bennett K.L. Introduction to computational proteomics. // PLoS computational biology. 2007. T. 3. № 7. C. el 14.

51. Cooksey A.M. h ap. Identifying blood biomarkers and physiological processes that distinguish humans with superior performance under psychological stress. // PloS one. 2009. T. 4. № 12. C. e8371.

52. Cooper D. The human gene mutation database // Nucleic Acids Research. 1998. T. 26. № l.C. 285-287.

53. Côté R.G. h up. The Ontology Lookup Service: more data and better tools for controlled vocabulary queries. // Nucleic acids research. 2008. T. 36. № Web Server issue. C. W372-6.

54. Cottrell J.S. Protein identification by peptide mass fingerprinting. // Peptide research. 1994. T. 7. № 3. C. 115-24.

55. Craig R., Beavis R.C. TANDEM: matching proteins with tandem mass spectra. // Bioinformatics (Oxford, England). 2004. T. 20. № 9. C. 1466-7.

56. Craig R., Cortens J.P., Beavis R.C. Open source system for analyzing, validating, and storing protein identification data. // Journal of proteome research. 2004. T. 3. № 6. C. 1234-42.

57. Creasy D.M., Cottrell J.S. Error tolerant searching of uninterpreted tandem mass spectrometry data // PROTEOMICS. 2002. T. 2. № 10. C. 1426-1434.

58. Crockett D.K. h ap. Annotated proteome of a human T-cell lymphoma. // Journal of biomolecular techniques: JBT. 2005. T. 16. № 4. C. 341-6.

59. Dai D. h jvp. Identification of Variants of CYP3A4 and Characterization of Their Abilities to Metabolize Testosterone and Chlorpyrifos // J. Pharmacol. Exp. Ther. 2001. T. 299. № 3. C. 825-831.

60. Delahunty C., Yates J.R. Identification of proteins in complex mixtures using liquid chromatography and mass spectrometry. // Current protocols in cell biology / editorial board, Juan S. Bonifacino . et al.. 2003. T. Chapter 5. C. Unit 5.6.

61. Delahunty C.M., Iii J.R.Y. Tech Insight MudPIT: multidimensional protein identification technology Tech Insight // Biotechniques. 2007. T. 43. № 5.

62. Desiere F. h jjp. The PeptideAtlas project. // Nucleic acids research. 2006. T. 34. № Database issue. C. D655-8.

63. Deutsch E. mzML: a single, unifying data format for mass spectrometer output. // Proteomics. 2008. T. 8. № 14. C. 2776-7.

64. Deutsch E.W. The PeptideAtlas Project. // Methods in molecular biology (Clifton, N.J.). 2010. T. 604. C. 285-96.

65. Deutsch E.W. h ^p. A guided tour of the Trans-Proteomic Pipeline. // Proteomics. 2010. T. 10. №6. C. 1150-9.

66. Deutsch E.W. h ^p. Human Plasma PeptideAtlas. // Proteomics. 2005. T. 5. № 13. C. 3497-500.

67. Deutsch E.W., Lam H., Aebersold R. PeptideAtlas: a resource for target selection for emerging targeted proteomics workflows. // EMBO reports. 2008. T. 9. № 5. C. 429-34.

68. Eckel-Passow J.E. h jsp. An insight into high-resolution mass-spectrometry data. // Biostatistics (Oxford, England). 2009. T. 10. № 3. C. 481-500.

69. Eng J.K., McCormack A.L., Yates III J.R. An approach to correlate tandem mass spectral data of peptides with amino acid sequences in a protein database // Journal of the American Society for Mass Spectrometry. 1994. T. 5. № 11. C. 976-989.

70. Eriksson J., Fenyo D. Probity: A Protein Identification Algorithm with Accurate Assignment of the Statistical Significance of the Results // Journal of Proteome Research. 2004. T. 3. № 1. C. 32-36.

71. Falkner J. a h up. Validated MALDI-TOF/TOF mass spectra for protein standards. // Journal of the American Society for Mass Spectrometry. 2007. T. 18. № 5. C. 850-5.

72. Farrah T. h A high-confidence human plasma proteome reference set with estimated concentrations in PeptideAtlas. // Molecular & cellular proteomics: MCP. 2011.

73. Field D., Wilson G., Gast C. van der. How do we compare hundreds of bacterial genomes? // Current opinion in microbiology. 2006. T. 9. № 5. C. 499-504.

74. Frazer K. a h ap. A second generation human haplotype map of over 3.1 million SNPs. //Nature. 2007. T. 449. № 7164. C. 851-61.

75. Fredman D. h ap. HGVbase: a curated resource describing human DNA variation and phenotype relationships. // Nucleic acids research. 2004. T. 32. № Database issue. C.D516-9.

76. Freed G.L. h ^p. Differential capture of serum proteins for expression profiling and biomarker discovery in pre- and posttreatment head and neck cancer samples. // The Laryngoscope. 2008. T. 118. № 1. C. 61-8.

77. Gabellini N. NTRK2 (Neurotrophic tyrosine kinase, receptor, type 2) // Atlas Genet Cytogenet Oncol Haematol. 2008. T. 12. № 4. C. 314-317.

78. Galeva N. Direct Identification of Cytochrome P450 Isozymes by Matrix-assisted Laser Desorption/Ionization Time of Flight-Based Proteomic Approach // Drug Metabolism and Disposition. 2003. T. 31. № 4. C. 351-355.

79. Galeva N., Altermann M. Comparison of one-dimensional and two-dimensional gel electrophoresis as a separation tool for proteomic analysis of rat liver microsomes: cytochromes P450 and other membrane proteins. // Proteomics. 2002. T. 2. № 6. C. 713-22.

80. Gao M. h j\p. Large scale depletion of the high-abundance proteins and analysis of middle- and low-abundance proteins in human liver proteome bymultidimensional liquid chromatography. // Proteomics. 2008. T. 8. № 5. C. 93947.

81. Garcia-Blanco M. a, Baraniak A.P., Lasda E.L. Alternative splicing in disease and therapy. // Nature biotechnology. 2004. T. 22. № 5. C. 535-46.

82. Gatlin C.L. h ap. Automated Identification of Amino Acid Sequence Variations in Proteins by HPLC/Microspray Tandem Mass Spectrometry // Analytical Chemistry. 2000. T. 72. № 4. C. 757-763.

83. Gobom J. h £p. A Calibration Method That Simplifies and Improves Accurate Determination of Peptide Molecular Masses by MALDI-TOF MS // Analytical Chemistry. 2002. T. 74. № 15. C. 3915-3923.

84. Griss J. h ap. Published and Perished? the influence of the searched protein database on the long-term storage of proteomics data. // Molecular & cellular proteomics: MCP. 2011. T. 10. № 9. C. Ml 11.008490.

85. Grone J. h ^p. Differential expression of genes encoding tight junction proteins in colorectal cancer: frequent dysregulation of claudin-1, -8 and -12. // International journal of colorectal disease. 2007. T. 22. № 6. C. 651-9.

86. Hamosh A. h £p. Online Mendelian Inheritance in Man (OMIM), a knowledgebase of human genes and genetic disorders. // Nucleic acids research. 2005. T. 33. № Database issue. C. D514-7.

87. Hamosh A. h ap. Online Mendelian Inheritance in Man (OMIM). // Human mutation. 2000. T. 15. № 1. C. 57-61.

88. Han X., Aslanian A., Yates III J.R. Mass spectrometry for proteomics // Current Opinion in Chemical Biology. 2008. T. 12. № 5. C. 483-490.

89. Hedden P. h ap. Gibberellin Biosynthesis in Plants and Fungi: A Case of Convergent Evolution? // Journal of plant growth regulation. 2001. T. 20. № 4. C. 319-331.

90. Hopfgartner G. h Triple quadrupole linear ion trap mass spectrometer for the analysis of small molecules and macromolecules. // Journal of mass spectrometry: JMS. 2004. T. 39. № 8. C. 845-55.

91. Huang Y. n flp. Statistical characterization of the charge state and residue dependence of low-energy CID peptide dissociation patterns. // Analytical chemistry. 2005. T. 77. № 18. C. 5800-13.

92. Hubbard T. The Ensembl genome database project // Nucleic Acids Research. 2002. T. 30. № 1. C. 38-41.

93. Hustert E. h £p. The genetic determinants of the CYP3A5 polymorphism. // Pharmacogenetics. 2001. T. 11. № 9. c. 773-9.

94. Ilina E.N. h ^p. Direct bacterial profiling by matrix-assisted laser desorption-ionization time-of-flight mass spectrometry for identification of pathogenic Neisseria. // The Journal of molecular diagnostics: JMD. 2009. T. 11. № 1. C. 7586.

95. Ingelman-Sundberg M. Human drug metabolising cytochrome P450 enzymes: properties and polymorphisms. // Naunyn-Schmiedeberg"s archives of pharmacology. 2004. T. 369. № 1. C. 89-104.

96. International Human Genome Sequencing Consortium. Finishing the euchromatic sequence of the human genome. // Nature. 2004. T. 431. № 7011. C. 931 -45.

97. Ishihama Y. h pp. Exponentially modified protein abundance index (emPAI) for estimation of absolute protein amount in proteomics by the number of sequenced peptides per protein. // Molecular & cellular proteomics: MCP. 2005. T. 4. № 9. C. 1265-72.

98. Jain R., Wagner M. Kolmogorov-Smirnov scores and intrinsic mass tolerances for peptide mass fingerprinting. // Journal of proteome research. 2010. T. 9. № 2. C. 737-42.

99. Jeffrey L. Cummings. Genotype-proteotype-phenotype relationships in neurodegenerative diseases. : Springer, 2005.

100. Jenkins R.E. h ap. Relative and absolute quantitative expression profiling of cytochromes P450 using isotope-coded affinity tags. // Proteomics. 2006. T. 6. № 6. C. 1934-47.

101. Jones P. h flp. PRIDE: a public repositoiy of protein and peptide identifications for the proteomics community. // Nucleic acids research. 2006. T. 34. № Database issue. C. D659-63.

102. Jones P. h flp. PRIDE: new developments and new datasets. // Nucleic acids research. 2008. T. 36. № Database issue. C. D878-83.

103. Kalmar L. h jip. Mutation screening of the CI inhibitor gene among Hungarian patients with hereditary angioedema. // Human mutation. 2003. T. 22. № 6. C. 498.

104. Keller A. h ap. Empirical Statistical Model To Estimate the Accuracy of Peptide Identifications Made by MS/MS and Database Search // Analytical Chemistry. 2002. T. 74. № 20. C. 5383-5392.

105. Kersey P.J. n jjp. The International Protein Index: an integrated database for proteomics experiments. // Proteomics. 2004. T. 4. № 7. C. 1985-8.

106. Kim S., Gupta N., Pevzner P. a. Spectral probabilities and generating functions of tandem mass spectra: a strike against decoy databases. // Journal of proteome research. 2008. T. 7. № 8. C. 3354-63.

107. Klie S. h £p. Analyzing large-scale proteomics projects with latent semantic indexing. // Journal of proteome research. 2008. T. 7. № 1. C. 182-91.

108. Kremer H. h up. Ichthyosis Bullosa of Siemens Is Caused by Mutations in the Keratin 2e Gene. // Journal of Investigative Dermatology. 1994. T. 103. № 3. C. 286-289.

109. Kuehl P. h ap. Sequence diversity in CYP3A promoters and characterization of the genetic basis of polymorphic CYP3A5 expression. // Nature genetics. 2001. T. 27. №4. C. 383-91.

110. Kuhn R.M. h up. The UCSC Genome Browser Database: update 2009. // Nucleic acids research. 2009. T. 37. № Database issue. C. D755-61.

111. Kuster B. h flp. Mass spectrometry allows direct identification of proteins in large genomes. //Proteomics. 2001. T. 1. № 5. c. 641-50.

112. Lane C.S. h ap. Comparative cytochrome P450 proteomics in the livers of immunodeficient mice using 180 stable isotope labeling. // Molecular & cellular proteomics: MCP. 2007. T. 6. № 6. C. 953-62.

113. Lane C.S. h ,qp. Identification of cytochrome P450 enzymes in human colorectal metastases and the surrounding liver: a proteomic approach. // European journal of cancer (Oxford, England: 1990). 2004. T. 40. № 14. C. 2127-34.

114. Lane E.B., McLean W.H.I. Keratins and skin disorders. // The Journal of pathology. 2004. T. 204. № 4. C. 355-66.

115. Levine a J. P53, the Cellular Gatekeeper for Growth and Division. // Cell. 1997. T. 88. № 3. C. 323-31.

116. Levy S. h AP- The diploid genome sequence of an individual human. // PLoS biology. 2007. T. 5. № 10. C. e254.

117. Lewis D.F.V. 57 varieties: the human cytochromes P450. // Pharmacogenomics. 2004. T. 5. № 3. C. 305-18.

118. Lim A. h ap. Characterization of Transthyretin Variants in Familial Transthyretin Amyloidosis by Mass Spectrometric Peptide Mapping and DNA Sequence Analysis // Analytical Chemistry. 2002. T. 74. № 4. C. 741-751.

119. Lim H. Identification of 2D-gel proteins: A comparison of MALDI/TOF peptide mass mapping to p LC-ESI tandem mass spectrometry // Journal of the American Society for Mass Spectrometry. 2003. T. 14. № 9. C. 957-970.

120. Lisitsa A.V. h «p. Application of slicing of one-dimensional gels with subsequent slice-by-slice mass spectrometry for the proteomic profiling of human liver cytochromes P450. // Journal ofproteome research. 2010. T. 9. № 1. C. 95-103.

121. Liu T. h ap. High dynamic range characterization of the trauma patient plasma proteome. // Molecular & cellular proteomics: MCP. 2006. T. 5. № 10. C. 1899913.

122. Liu T. h /ip. Human Plasma N-Glycoproteome Analysis by Immunoaffinity Subtraction, Hydrazide Chemistry, and Mass Spectrometry // Journal of proteome research. 2005. T. 4. № 6. C. 2070-2080.

123. Mallick P. h flp. Computational prediction of proteotypic peptides for quantitative proteomics. //Nature biotechnology. 2007. T. 25. № 1. C. 125-31.

124. Mann M., Jensen O.N. Proteomic analysis of post-translational modifications. // Nature biotechnology. 2003. T. 21. № 3. C. 255-61.

125. Mann M., Wilm M. Error-Tolerant Identification of Peptides in Sequence Databases by Peptide Sequence Tags // Analytical Chemistry. 1994. T. 66. № 24. C. 4390-4399.

126. Marchetti A. h pp. Frequent mutations in the neurotrophic tyrosine receptor kinase gene family in large cell neuroendocrine carcinoma of the lung. // Human mutation. 2008. T. 29. № 5. C. 609-16.

127. Marichal P. h Contribution of mutations in the cytochrome P450 14{alpha}-demethylase (Ergllp, Cyp51p) to azole resistance in Candida albicans // Microbiology. 1999. T. 145. № 10. C. 2701-2713.

128. Martens L. h jxp. PRIDE: the proteomics identifications database. // Proteomics. 2005. T. 5. №13. C. 3537-45.

129. Matthiesen R., Amorim A. Proteomics facing the combinatorial problem. // Methods in molecular biology (Clifton, N.J.). 2010. T. 593. C. 175-86.

130. McDonald W.H., Yates J.R. Shotgun proteomics: integrating technologies to answer biological questions. // Current opinion in molecular therapeutics. 2003. T. 5. № 3. C. 302-9.

131. Menon R., Omenn G.S. Proteomic characterization of novel alternative splice variant proteins in human epidermal growth factor receptor 2/neu-induced breast cancers. // Cancer research. 2010. T. 70. № 9. C. 3440-9.

132. Menschaert G. h £p. Peptidomics coming of age: a review of contributions from a bioinformatics angle. // Journal of proteome research. 2010. T. 9. № 5. C. 205161.

133. Millar D.S. h Three novel missense mutations in the antithrombin III (AT3) gene causing recurrent venous thrombosis. // Human genetics. 1994. T. 94. № 5. C. 509-12.

134. Mironov A.A. Frequent Alternative Splicing of Human Genes // Genome Research. 1999. T. 9. № 12. C. 1288-1293.

135. Modrek B. Genome-wide detection of alternative splicing in expressed sequences of human genes //Nucleic Acids Research. 2001. T. 29. № 13. C. 2850-2859.

136. Mueller M. h ap. Analysis of the experimental detection of central nervous system-related genes in human brain and cerebrospinal fluid datasets. // Proteomics. 2008. T. 8. № 6. C. 1138-48.

137. Nagaraj S.H., Gasser R.B., Ranganathan S. A hitchhiker"s guide to expressed sequence tag (EST) analysis. // Briefings in bioinformatics. 2007. T. 8. № 1. C. 621.

138. Nedelkov D. Population proteomics: Investigation of protein diversity in human populations // Proteomics. 2008. T. 8. № 4. C. 779-86.

139. Nedelkov D. h ap. High-throughput comprehensive analysis of human plasma proteins: a step toward population proteomics. // Analytical chemistry. 2004. T. 76. № 6. C. 1733-7.

140. Nedelkov D. h ^p. Investigating diversity in human plasma proteins. // Proceedings of the National Academy of Sciences of the United States of America. 2005. T. 102. № 31. C. 10852-7.

141. Nesvizhskii A.I. Protein identification by tandem mass spectrometry and sequence database searching. // Methods in molecular biology (Clifton, N.J.). 2007. T. 367. C. 87-119.

142. Nesvizhskii A.I., Vitek O., Aebersold R. Analysis and validation of proteomic data generated by tandem mass spectrometry // Nature Methods. 2007. T. 4. № 10. C. 787-797.

143. Ng P.C. h flp. Genetic Variation in an individual human exome // PLoS Genetics. 2008. T. 4. № 8.

144. Ong S.-E., Mann M. Mass spectrometry-based proteomics turns quantitative. // Nature chemical biology. 2005. T. 1. № 5. c. 252-62.

145. Ossipova E., Fenyô D., Eriksson J. Optimizing search conditions for the mass fingerprint-based identification of proteins. // Proteomics. 2006. T. 6. № 7. C. 2079-85.

146. Overbeek R. h ,np. Annotation of bacterial and archaeal genomes: improving accuracy and consistency. // Chemical reviews. 2007. T. 107. № 8. C. 3431-47.

147. Pedrioli P.G.A. Trans-proteomic pipeline: a pipeline for proteomic analysis. // Methods in molecular biology (Clifton, N.J.). 2010. T. 604. C. 213-38.

148. Perkins D.N. h ^p. Probability-based protein identification by searching sequence databases using mass spectrometry data // Electrophoresis. 1999. T. 20. № 18. C. 3551-3567.

149. Perry D.J., Carrell R.W. Molecular genetics of human antithrombin deficiency. // Human mutation. 1996. T. 7. № 1. C. 7-22.

150. Petrak J. h ap. Déjà vu in proteomics. A hit parade of repeatedly identified differentially expressed proteins. // Proteomics. 2008. T. 8. № 9. C. 1744-9.

151. Pevzner P.A. h /ip. Efficiency of database search for identification of mutated and modified proteins via mass spectrometry. // Genome research. 2001. T. 11. № 2. C. 290-9.

152. Porter C.J., Talbot C.C., Cuticchia A.J. Central mutation databases-a review. // Human mutation. 2000. T. 15. № 1. C. 36-44.

153. Rabilloud T., Hochstrasser D., Simpson R.J. Is a gene-centric human proteome project the best way for proteomics to serve biology? // Proteomics. 2010. C. 1-6.

154. Rappsilber J. h £p. Large-scale proteomic analysis of the human spliceosome. // Genome research. 2002. T. 12. № 8. C. 1231-45.

155. Redlich G. h zip. Distinction between human cytochrome P450 (CYP) isoforms and identification of new phosphorylation sites by mass spectrometry. // Journal of proteome research. 2008. T. 7. № 11. C. 4678-88.

156. Reid G.E., McLuckey S.A. "Top down" protein characterization via tandem mass spectrometiy. // Journal of mass spectrometry: JMS. 2002. T. 37. № 7. C. 663-75.

157. Rodriguez C. h zip. Proteotyping of human haptoglobin by MALDI-TOF profiling: Phenotype distribution in a population of toxic oil syndrome patients. // Proteomics. 2006. T. 6. C. S272--81.

158. Roher A. h zip. Structural alterations in the peptide backbone of beta-amyloid core protein may account for its deposition and stability in Alzheimer"s disease // J. Biol. Chem. 1993. T. 268. № 5. c. 3072-3083.

159. Rostami-Hodjegan A., Tucker G.T. Simulation and prediction of in vivo drug metabolism in human populations from in vitro data. // Nature reviews. Drug discovery. 2007. T. 6. № 2. C. 140-8.

160. Roth M.J. h zip. "Proteotyping": population proteomics of human leukocytes using top down mass spectrometry. // Analytical chemistry. 2008. T. 80. № 8. C. 285766.

161. Rozman D., Waterman M.R. Lanosterol 14alpha -Demethylase (CYP51) and Spermatogenesis // Drug Metab. Dispos. 1998. T. 26. № 12. C. 1199-1201.

162. Rubina A.Y. h zip. Why 3-D? Gel-based microarrays in proteomics. // Proteomics. 2008. T. 8. №4. C. 817-31.

163. Sadygov R.G., Cociorva D., Iii J.R.Y. Large-scale database searching using tandem mass spectra: Looking up the answer in the back of the book // Nature Methods. 2004. T. 1. № 3. C. 195-202.

164. Sarkozy A. h zip. Germline BRAF mutations in Noonan, LEOPARD, and cardiofaciocutaneous syndromes: molecular diversity and associated phenotypic spectrum. // Human mutation. 2009. T. 30. № 4. C. 695-702.

165. Sattelle D.B., Jones A.K., Buckingham S.D. Insect genomes: challenges and opportunities for neuroscience. // Invertebrate neuroscience: IN. 2007. T. 7. № 3. C. 133-6.

166. Schandorff S. h ,np. A mass spectrometry-friendly database for cSNP identification. //Nature methods. 2007. T. 4. № 6. C. 465-6.

167. Schmuth M. h Ichthyosis update: towards a function-driven model of pathogenesis of the disorders of cornification and the role of corneocyte proteins in these disorders. //Advances in dermatology. 2007. T. 23. C. 231-56.

168. Schweigert F.J., Wirth K., Raila J. Characterization of the microheterogeneity of transthyretin in plasma and urine using SELDI-TOF-MS immunoassay. // Proteome science. 2004. T. 2. № 1. C. 5.

169. Searle B.C., Turner M., Nesvizhskii A.I. Improving sensitivity by probabilistically combining results from multiple MS/MS search methodologies. // Journal of proteome research. 2008. T. 7. № 1. C. 245-53.

170. Seo J., Lee K.-J. Post-translational modifications and their biological functions: proteomic analysis and systematic approaches. // Journal of biochemistry and molecular biology. 2004. T. 37. № 1. C. 35-44.

171. Sherry S.T. dbSNP: the NCBI database of genetic variation // Nucleic Acids Research. 2001. T. 29. № 1. C. 308-311.

172. Shevchenko A. h j\p. Mass Spectrometric Sequencing of Proteins from Silver-Stained Polyacrylamide Gels // Analytical Chemistry. 1996. T. 68. № 5. C. 850858.

173. Shi W.-feng h up. Proteotyping: A new approach studying influenza virus evolution at the protein level // Virologica Sinica. 2008. T. 22. № 5. C. 405-411.

174. Shteynberg D. h np. iProphet: Multi-level integrative analysis of shotgun proteomic data improves peptide and protein identification rates and error estimates. // Molecular & cellular proteomics: MCP. 2011. C. Ml 11.007690-.

175. Smigielski E.M. dbSNP: a database of single nucleotide polymorphisms // Nucleic Acids Research. 2000. T. 28. № 1. C. 352-355.

176. Srebrow A., Kornblihtt A.R. The connection between splicing and cancer. // Journal of cell science. 2006. T. 119. № Pt 13. C. 2635-41.

177. Stamm S. h zip. ASD: a bioinformatics resource on alternative splicing. // Nucleic acids research. 2006. T. 34. № Database issue. C. D46-55.

178. Stein P.E., Carrell R.W. What do dysfunctional serpins tell us about molecular mobility and disease? // Nature Structural Biology. 1995. T. 2. № 2. C. 96-113.

179. Supek F. n zip. Enhanced analytical power of SDS-PAGE using machine learning algorithms. //Proteomics. 2008. T. 8. № 1. C. 28-31.

180. Taylor C.F. Minimum reporting requirements for proteomics: a MIAPE primer. // Proteomics. 2006. T. 6 Suppl 2. C. 39-44.

181. Taylor C.F. h zip. The minimum information about a proteomics experiment (MIAPE). // Nature biotechnology. 2007. T. 25. № 8. C. 887-93.

182. Thiede B. h zip. Peptide mass fingerprinting. // Methods (San Diego, Calif.). 2005. T. 35. № 3. C. 237-47.

183. Tsvetkov P.O. h zip. Isomerization of the Asp7 residue results in zinc-induced oligomerization of Alzheimer"s disease amyloid beta(l-16) peptide. // Chembiochem: a European journal of chemical biology. 2008. T. 9. № 10. C. 1564-7.

184. Uhlen M. h zip. A human protein atlas for normal and cancer tissues based on antibody proteomics. // Molecular & cellular proteomics: MCP. 2005. T. 4. № 12. C. 1920-32.

185. Ullrich A. h zip. CANCER-RELATED PROTEIN KINASES // US Patent App. 12/. 2007.

186. Venter J.C. h zip. The sequence of the human genome. // Science (New York, N.Y.). 2001. T. 291. № 5507. C. 1304-51.

187. Vizcaino J.A., Foster J.M., Martens L. Proteomics data repositories: Providing a safe haven for your data and acting as a springboard for further research // Journal of Proteomics. 2010. C. 1-11.

188. W Vogel K. h zip. Developing assays for kinase drug discovery where have the advances come from? // 2007.

189. Westlind-Johnsson A. Comparative analysis of CYP3A expression in human liver suggests only a minor role for CYP3A5 in drug metabolism // Drug Metabolism and Disposition. 2003. T. 31. № >6. C. 755-761.

190. Wheeler D.L. h zip. Database resources of the National Center for Biotechnology Information. //Nucleic acids research. 2007. T. 35. № Database issue. C. D5-12.

191. Whibley C., Pharoah P.D.P., Hollstein M. p53 polymorphisms: cancer implications. //Nature reviews. Cancer. 2009. T. 9. № 2. C. 95-107.

192. Wilkins M.R. h /ip. From Proteins to Proteomes: Large Scale Protein Identification by Two-Dimensional Electrophoresis and Amino Acid Analysis // Bio/Technology. 1996. T. 14. № 1. C. 61-65.

193. Wu C.H. h ap. The Universal Protein Resource (UniProt): an expanding universe of protein information. // Nucleic acids research. 2006. T. 34. № Database issue. C. D187-91.

194. Yates J R., Eng J.K., McCormack A.L. Mining Genomes: Correlating Tandem Mass Spectra of Modified and Unmodified Peptides to Sequences in Nucleotide Databases // Analytical Chemistry. 1995. T. 67. № 18. C. 3202-3210.

195. Yip Y.L. h Annotating single amino acid polymorphisms in the UniProt/Swiss-Prot knowledgebase. // Human mutation. 2008. T. 29. № 3. C. 3616.

196. Zanger U.M. h ap. Polymorphic CYP2B6: molecular mechanisms and emerging clinical significance. //Pharmacogenomics. 2007. T. 8. № 7. C. 743-59.

197. Zgoda V.G. h £p. Proteomics of mouse liver microsomes: performance of different protein separation workflows for LC-MS/MS. // Proteomics. 2009. T. 9. № 16. C. 4102-5.

198. Zhou H. h ap. Quantitative proteome analysis by solid-phase isotope tagging and mass spectrometry. //Nature biotechnology. 2002. T. 20. № 5. C. 512-5.

199. Zubarev R.A., Zubarev A.R., Savitski M.M. Electron capture/transfer versus collisionally activated/induced dissociations: solo or duet? // Journal of the American Society for Mass Spectrometry. 2008. T. 19. № 6. C. 753-61.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Рассматриваемые вопросы:
Методы выделения органелл и мембран из тканей, клетки.
Этапы субклеточного фракционирования: экстракция,
гомогенизация и центрифугирование, их особенности.
Методы разделения и очистки субклеточных компонентов.
Выделение мембранных частиц.
Идентификация мембранных фракций, критерии их очистки.
Контроль наличия примесей с помощью световой и
электронной микроскопии, анализа липидного состава или
определении активности маркерных ферментов.
Определение белкового состава в выделяемых мембранных
фракциях. Определение активности маркерных ферментов
определенного типа выделенной мембранной фракции.

Получение отдельных клеточных компонентов дает возможность изучать
их биохимию и функциональные особенности. Например, можно создать
бесклеточную систему для рибосом, которые будут синтезировать белок
по заданной экспериментатором информационной РНК. Выделенные
митохондрии в подобранных условиях могуг осуществлять синтез АТФ, на
выделенном хроматине при участии соответствующих ферментов может
происходить синтез РНК и т.д.
В последнее время применяются бесклеточные системы для воссоздания
клеточных надмолекулярных структур. Так, используя очищенные от
гранул желтка экстракты цитоплазмы яиц земноводных или яиц морских
ежей, можно получить ядра с ядерной оболочкой из введенной в эту
бесклеточную систему чужеродной ДНК (например, ДНК бактериофага).
Такая ДНК связывается с белками-гастонами, которые есть в избытке в
таком экстракте, образуется хроматин (дезоксирибонуклеопротеид),
который покрывается двойной мембранной оболочкой, несущей даже
ядерные поры. Такие модельные системы помогают изучать тонкие,
интимные процессы, например транспорт макромолекул из цитоплазмы в
ядро, и наоборот. В цитоплазматических экстрактах яиц земноводных и
иглокожих такие ядра могут периодически делиться путем митоза. Эти
модели внесли огромный вклад в расшифровку природы регуляции
клеточного цикла.

Для того чтобы выделить клеточные органеллы,
исследуемый образец измельчают и
затем гомогенизируют в забуференной среде с
использованием гомогенизатора Поттера-Элведжема
(тефлоновый пестик, вращающийся в стеклянном
цилиндре). Это сравнительно мягкий метод, который
особенно предпочтителен для выделения лабильных
молекул и ультраструктур. Другие методики разрушения
клеток включают ферментативный лизис, разрушающий
клеточные стенки, или механическое разрушение
замороженных тканей (размолом или с помощью
вращающихся ножей; под большим давлением;
осмотическим шоком; многократным чередованием
замораживания и оттаивания).

Для выделения интактных органелл важно, чтобы среда, в которой
проводится гомогенизация, была изотонической, т.е.
осмотическое давление буфера должно соответствовать давлению
внутри клетки. Если раствор гипотоничен, органеллы будут
«впитывать» дополнительную воду и лопнут, а в
гипертонических растворах они, напротив, сморщиваются.
Вслед за гомогенизацией следует фильтрование для удаления
интактных клеток и соединительных тканей. Собственно
фракционирование клеточных органелл проводится с помощью
дифференциального центрифугирования, т.е. центрифугирования
при различных скоростях вращения ротора. При этом ступенчатое
увеличение центробежной силы (которую принято выражать
величиной, кратной нормальному ускорению свободного падения g
= 9,81 м/с2) приводит к последовательному осаждению различных
органелл, т.е. их разделению в соответствии с плотностью и
размером.

Одним из основных способов выделения клеточных структyp является
дифференциальное (разделительное) центрифугирование. Принцип его
применения в том, что время осаждения частиц в гомогенате зависит от их
размера и плотности: чем больше частица или чем она тяжелее, тем быстрее
она осядет на дно пробирки. Для убыстрения процесса оседания варьируют
ускорения, создаваемые центрифугой.
При центрифугировании раньше всего и при небольших ускорениях осядут ядра
и неразрушенные клетки, при 15-30 тыс. g осядут крупные частицы,
макросомы, состоящие из митохондрий, мелких пластид, пероксисом,
лизосом и др., при 50 тыс. g осядут микросомы, фрагменты вакуолярной
системы клетки.
При повторном дробном центрифугировании этих смешанных подфрак-ций
можно получить чистые фракции. Так, при разделении макросомной
подфракции получают отдельно митохондрии, лизосомы, пероксисомы. При
разделении микросом можно получить фракцию мембран аппарата Гольджи,
фрагментов плазматической мембраны, вакуолей, гранулярного ретикулума. В
случаях более тонкого разделения фракций используют центрифугирование в
градиенте плотности сахарозы, что позволяет хорошо разделить компоненты,
даже незначительно отличающиеся друг от друга по удельной массе.

Выделение клеточных органелл обычно проводят при низких
температурах (0-5°С) для того, чтобы уменьшить степень
деградации материала за счет реакций, катализируемых
ферментами; последние высвобождаются в процессе разрушения
ткани. Добавление тиолов и хелатирующих агентов необходимо для
защиты функциональных SH-групп от окисления.
Прежде чем выделенные фракции анализировать биохимическими
способами, необходимо проверить их на чистоту с помощью
электронного микроскопа.
Получение отдельных клеточных компонентов дает возможность
изучать их биохимию и функциональные особенности. Так можно
создать бесклеточную систему для рибосом, которые будут
синтезировать белок по заданной экспериментатором
информационной РНК. Выделенные митохондрии в подобранных
условиях могуг осуществлять синтез АТФ, на выделенном хроматине
при участии соответствующих ферментов может происходить
синтез РНК и т.д.

Основы метода центрифугирования
Частицы в растворе осаждаются (седиментация),
когда их плотность выше плотности раствора, или
всплывают (флотация), когда их плотность ниже
плотности раствора. Чем больше разница в
плотности, тем быстрее идет распределение частиц.
Когда плотности частиц и раствора одинаковые
(изопикнические условия), частицы остаются
неподвижными. При малой разнице в плотности
частицы можно разделить только в центрифуге,
которая создает центробежную силу, во много раз
превышающую силу земного притяжения.

соотношение между плотностью и коэффициентом седиментациидля
различных частиц в растворе хлорида цезия (CsCI).

Скорость седиментации частицы (ν) зависит от угловой
скорости (ω), эффективного радиуса ротора rэфф(расстояние от
оси вращения) и седиментационных свойств частиц.
Седиментационные свойства частицы
характеризуются коэффициентом седиментации S и
выражаются в единицах Сведберга (1S = 10-13с).
Величина S может колебаться в широких пределах. Для
сравнения коэффициентов седиментации в различных средах
их обычно корректируют по плотности и вязкости водыпри
20oC (S20w).
Коэффициент седиментации зависит от молекулярной массы
(М) частицы, ее формы (коэффициент трения f),
парциального удельного объема ΰ (величина, обратная
плотности частицы).

Центрифугирование в градиенте плотности
Макромолекулы или органеллы, незначительно различающиеся по размеру или по плотности,
можно разделитьцентрифугированием в градиенте плотности. Для этих целей используются два
метода.
При зональном центрифугировании анализируемая проба (например, белки или клетки)
наслаивается тонким слоем поверх буферного раствора. В процессе центрифугирования частицы
проходят через раствор, так как их плотность выше плотности раствора. Скорость движения
зависит от массы и формы частиц (см. формулы на схемеА). Центрифугирование прекращают
прежде, чем частицы достигнут дна центрифужной пробирки. Затем дно прокалывают и
собирают ряд фракций, содержащих различные частицы. Стабильность градиента плотности в
процессе центрифугирования достигается применением растворов углеводов или коллоидного
силикагеля,концентрация которых возрастает от поверхности к дну пробирки. Градиент плотности
препятствует образованию конвекционных потоков, снижающих качество разделения.
При изопикническом центрифугировании пробу (например ДНК, РНК или вирусы) равномерно
распределяют во всем объеме раствора (обычно CsCI). В этом случае разделение продолжается
значительно дольше, чем при зональном центрифугировании. Градиент плотности создается в
процессе центрифугирования за счет седиментациии диффузии. Со временем каждая частица
попадает в область, соответствующую ее собственной плавучей плотности. Центрифугирование
прекращают, когда устанавливается равновесие. Полученные фракции анализируют, используя
подходящую измерительную технику.

Молекулы-маркеры
В процессе фракционирования важно
контролировать чистоту фракций. Присутствие
в определенной фракции той или иной
органеллы и наличие других компонентов
определяют с помощью молекул-маркеров.
Обычно это органеллоспецифичные
ферменты (ферменты-маркеры).
Распределение ферментов-маркеров в клетке
отражает локализацию в ней
соответствующих каталитических реакций.

Функции и состав биомембран
Наиболее важными мембранами в животных клетках
являются плазматическая мембрана, внутренняя и
внешняя ядерные мембраны, мембраны
эндоплазматического ретикулума и аппарата Гольджи
, внутренние и внешние митохондриальные
мембраны. Лизосомы, пероксисомы, различные
везикулы также отделены от цитоплазмымембранами
. Клетки растений содержат дополнительно мембраны
хлоропластов, лейкопластов и вакуолей. Все
мембраны полярны, т.е. существует различие в
составах внутреннего и внешнего по отношению к
цитоплазме слоев.

Биомембраны и их составляющие выполняют следующие функции:
1. Ограничение и обособление клеток и органелл. Обособление клеток от межклеточной
среды обеспечиваетсяплазматической мембраной, защищающей клетки от
механического и химического воздействий. Плазматическая мембрана обеспечивает
также сохранение разности концентраций метаболитов и неорганических ионов между
внутриклеточной и внешней средой.
2. Контролируемый транспорт метаболитов и ионов определяет внутреннюю среду, что
существенно для гомеостаза, т.е. поддержания постоянной концентрации метаболитов и
неорганических ионов, и других физиологических параметров. Регулируемый и
избирательный транспорт метаболитов и неорганических ионов через поры и
посредством переносчиков становится возможным благодаря обособлению клеток и
органелл с помощью мембранных систем.
3. Восприятие внеклеточных сигналов и их передача внутрь клетки, а также инициация
сигналов.
4. Ферментативный катализ. В мембранах на границе между липидной и водной фазами
локализованы ферменты. Именно здесь происходят реакции с неполярными
субстратами. Примерами служат биосинтез липидов и метаболизмнеполярных
ксенобиотиков. В мембранах локализованы наиболее важные реакции энергетического
обмена, такие, как окислительное фосфорилирование (дыхательная цепь) и фотосинтез.
5. Контактное взаимодействие с межклеточным матриксом и взаимодействие с другими
клетками при слиянии клетоки образовании тканей.
6. Заякоривание цитоскелета, обеспечивающее поддержание формы клеток и органелл
и клеточной подвижности.

После гомогенизации образца, центрифугирования гомогената с
разной скоростью получают отдельные фракции, содержащие
клеточные ядра, митохондрии и другие органеллы, а также
надосадочную жидкость, в которой находятся растворимые
белки цитозоля клетки.
Экстракция белков, связанных с мембранами, и разрушение
олигомерных белков на протомеры
Если искомый белок прочно связан с какими-либо структурами
клетки, его необходимо перевести в раствор.
Для разрушения гидрофобных взаимодействий между белками
и липидами мембран в раствор добавляют детергенты: Чаще
всего используют тритон Х-100 или додецилсульфат натрия.
При действии детергентов обычно разрушаются и гидрофобные
взаимодействия между протомерами в олигомерных белках

Удаление из pacтвopa небелковых веществ
Нуклеиновые кислоты, липиды и Другие
небелковые вещества можно удалить из раствора, используя их особенные физикохимические
свойства. Так, липиды легко
удаляются
из
раствора
добавлением
органических
растворителей,
например
ацетона. Однако воздействие должНо бытЬ
кратковременным. так как ацетон вызывает
денатурацию некоторых белков. Нуклеиновые
кислоты осаждают добавлением в раствор
стрептомицина.

Выделение липидов мембран осуществляют сразу после получения мембранной
фракции, которую необходимо защищать от действия протео- и липолитических
ферментов, автоокисления.
Обычно все процедуры проводят при низкой температуре, поддерживая определенные
значения pH и ионной силы. Для экстракции липидов используют смесь хлороформ-
метанол. Для одновременной экстракции белков и липидов из теней эритроцитов их
экстрагируют смесью бутанол-вода. При этом большая часть белков переходит в
водный, а липида в бутанольный слой.
Количественный анализ сложных смесей фосфолипидов проводят
хроматографическими методами. Для препаративных целей в основном используют
хроматографию на колонках. Для микроаналитических исследований успешно
применяют тонкослойную хроматографию, с помощью которой можно разделить
практически все классы липидов, локализовать и идентифицировать их при
использовании специальных реактивов.
По элюирующей способности растворители располагаются в следующем
возрастающем порядке петролейный эфир, цикло-гексан, четыреххлористый углерод,
толуол, бензол, хлороформ, диэтиловый эфир, этилацетат, ацетон, н-пропанол,
этанол, метанол, вода. После пропускания растворителей пластинку высушивают на
воздухе и идентифицируют липиды с помощью окрашивания специфическими
реагентами. Для количественного определения фосфолипидов, разделенных
тонкослойной хроматографией, используют спектрофотометрические методы.

Исследования мембран в значительной
мере базируются на двух основных
методических приемах: это разборка
нативной (то есть природной) мембраны на
составляющие ее элементы и последующая
полная или частичная сборка искусственной
мембраны с использованием всех или
части компонентов исходной мембраны.
Применительно к мембранам эти приемы
получили название "солюбилизация" и
"реконструкция».

Для солюбилизации лучше использовать детергенты с
низкой ККМ, так как такие детергенты легче
встраиваются в мембрану и быстрее вызывают ее
распад до смешанных мицелл. В этом качестве
наиболее эффективны ионные детергенты.
В качестве параметров, характеризующих способность
детергентов к мицеллообразованию, обычно
используют критическую концентрацию
мицеллообразования (ККМ) и число агрегации. ККМ –
это та концентрация, при которой детергент начинает
образовывать мицеллы. До этого он находится в воде
в мономерной форме в состоянии истинного
раствора. Число агрегации показывает, сколько
молекул детергента приходится на одну мицеллу.

Чаще всего используются четыре основных способа удаления
детергента: диализ, гель-фильтрация, сильное разбавление
солюбилизата и адсорбция детергента на гидрофобных полимерах.
Более быстрый способ основан на удалении детергента с помощью
гель-фильтрации, когда солюбилизат пропускают через инертный
гель, размер пор которого достаточно велик, чтобы удержать
молекулы детергента, но мал по сравнению с образующимися
мембранными частицами, которые свободно проходят между
гранулами геля.
С максимальной полнотой детергент может быть удален из мембраны
путем его адсорбции на гидрофобных полимерах. Этот способ
особенно хорош для удаления остаточных количеств детергента из
уже сформировавшихся мембранных частиц. Однако для удаления
детергента из исходного солюбилизата он малопригоден, так как на
начальных стадиях реконструкции удаление детергента может
сопровождаться адсорбцией значительных количеств белка и липида
на полимере. Поэтому обычно этот метод используют в комбинации с
другими способами на конечной стадии удаления детергента.

Для идентификации белков используются различные системы поиска в базах данных EMBL, Sequest, разработанные внутри исследовательских коллективов. Однако стандартом для идентификации белков стала поисковая машина Mascot. Как практически во всех поисковых системах в ней используется вэб-интнерфейс и сама поисковая система доступна в Интернете, но ее также можно приобрести и установить на компьютере пользователя.

Mascot может работать с различными подключаемыми белковыми и геномными базами данных. Это могут быть обширные общедоступные базы, такие как NCBI или SwissProt, коммерческие, а также созданные самим пользователем.

Во всех системах идентификация осуществляется по полученным исследователем масс-спектрометрическим данным, путем их сопоставления с известными структурами белков.

Учитывая, что в последние десятилетия сиквенирование белков свелось, по сути, с сиквенированию кодирующих их генов, на практике разумнее идентифицировать белки сопоставляя экспериментальные масс-спектрометрические данные с известными геномами.

Существуют различные алгоритмы идентификации белков, однако их возможности ограничены известными на сегодняшний день геномами. Хотя, учитывая что организмы разных видов все-таки имют гомологичные белки, зачастую удается идентифицировать белки из организмов с неизвестным геномом.

Различные методические подходы протеомных исследований, дают принципиально различные типы данных, и требуют своих вычислительных подходов при обработке.

Наиболее доступным и высокопроизводительном является метод идентификации по масс-спетрометрическим пептидным картам специфического протеолитического гидролиза. В англоязычной литературе он известен как Peptide Mass Fingerprint (PMF) В качестве специфической протеазы чаще всего используется трипсин. На первом этапе выделенный (например, элетрофорезом) белок подвергается протеолитическому гидролизу. В результате такого гидролиза получается смесь пептидов. Учитывая, что используется высокоспецифичная протеаза, это будет смесь вполне определенных пептидов. Так, при использовании трипсина белок будет "порезан" по аргинину и лизину.

Следующий этап - регистрация масс-спектра полученной смеси. В результате чего получается набор или список молекулярных масс. Он не дает никакой информации о структуре или других свойствах продуктов, в основе метода только предположение что это молекулярные массы пептидов, и эти пептиды образовались в результате специфического гидролиза. Здесь и спрятана главная идея подхода - если каждый белок имеет свой набор пептидов и соответствующий ему перечень молекулярных масс, то вполне возможно и решение обратной задачи - найти для полученного перечня молекулярных масс соответствующий ему белок. И такую задачу действительно часто удается решить.

В частности это позволяет сделать маскот.

Книга представляет собой первое учебное пособие на русском языке по основам масс-спектрометрии белков и пептидов. Цель настоящего издания - заинтересовать молодых исследователей информативной, красивой и востребованной во всем мире дисциплиной, дать возможность более эффективно применять масс-спектрометрию для решения фундаментальных и прикладных научных задач. Книга написана в формате лекций для начинающих, хорошо иллюстрирована и сопровождается представительным списком цитированной литературы.

Издание рассчитано на студентов и аспирантов химических, физико-химических, биологических и медицинских специальностей; будет полезно научным сотрудникам, уже работающим в области исследований белков и пептидов или интересующимся этим научным направлением.

7
Использованные сокращения 9
Введение 11
Глава 1. Методы ионизации молекул пептидов и белков 14
1.1. Бомбардировка быстрыми атомами, БВА (Fast Atom Bombardment, FAB) 14
1.2. Матрично-активированная лазерная десорбция/ионизация, МАЛДИ (Martix Assisted Laser Desorption/Ionization, MALDI) 16
1.3. Ионизация электрораспылением, ИЭР (Electrospray Ionization, ESI) 19
Глава 2. Измерение молекулярной массы пептидов и белков 25
Глава 3. Установление первичной структуры пептидов 34
3.1. Деградация по Эдману 34
3.2. Идентификация пептидов по сиквенсу кДНК 36
3.3. Леддерное секвенирование 37
Глава 4. Масс-спектрометрическое секвенирование 39
4.1. Номенклатура фрагментных ионов пептидов 39
4.2. Масс-спектры отрицательных ионов 45
4.3. Методы инициирования фрагментации молекулярных ионов 46
4.3.1. Диссоциация, активированная соударениями, ДАС (Collisionally Activated Dissociation, CAD) 47
4.3.2. Диссоциация индуцированная столкновениямис поверхностью, ДИП (Surface Induced Dissociation (SID) 56
4.3.3. Диссоциация при захвате электрона, ДЗЭ(Electron Capture Dissociation, ECD) 59
4.3.4. Диссоциация при переносе электрона, ДПЭ(Electron Transfer Dissociation, ETD) 64
4.3.5. Фотоактивация диссоциации 65
4.3.6. Диссоциация, активированная электронами 69
4.3.7. Диссоциация отрицательных ионов при отрывеэлектрона 70
4.4. Методы секвенирования пептидов на приборах с матрично-активированной лазерной десорбцией/ионизацией 71
4.4.1. Метод задержанной экстракции. Распад в источнике, РВИ (In Source Decay, ISD) 71
4.4.2. Распад за пределами источника, РПИ (Post Source Decay, PSD) 72
Глава 5. Идентификация белков и пептидов 7 6
5.1. Идентификация с использованием баз данных 76
5.1.1. Метод идентификации белков "снизу вверх"("Bottom-up") 76
5.1.2. Метод идентификации белков "сверху вниз"("Top-down") 91
5.2. Ручная идентификация пептидов 94
Глава 6. Основные сложности масс-спектрометрическогосеквенирования пептидов и пути их преодоления 97
6.1. Покрытие сиквенса 98
6.2. Аминокислоты с одинаковой целочисленной массой 102
6.2.1. Лизин и глутамин 102
6.2.2. Фенилаланин и окисленный метионин 104
6.3. Изомерные аминокислоты: лейцин и изолейцин 106
6.4. Циклизация коротких пептидов 108
6.5. Пептиды, содержащие дисульфидную связь 116
Глава 7. Использование для секвенирования масс-спектровотрицательных ионов 121
Глава 8. Количественный анализ белков с использованием высокоэффективной жидкостной хроматографиимасс-спектрометрии. Количественная протеомика 126
8.1. Сравнительная (количественная) протеомика 129
8.1.1. Безизотопный метод 129
8.1.2. Изотопные методы 132
8.2. Установление абсолютных количеств 145
Список литературы 149
Приложение. Bruker: Многомерный путь к разгадке протеома 163

Предисловие

Посвящается
профессорам химического факультета
МГУ им. М.В. Ломоносова
Александру Леонидовичу Курцу
Киму Петровичу Бутину

Важнейшие достижения масс-спектрометрии за последние 20 лет связаны с исследованиями природных соединений, включая биополимеры. С появлением методов ионизации электрораспылением и матрично-активированной лазерной десорбции/ионизации для масс-спектрометрии стали доступны сахара, нуклеиновые кислоты, белки, липиды и прочие биоорганические макромолекулы. Безусловно, наибольших успехов удалось достичь в исследовании белков. Благодаря чувствительности, информативности, экспрессности, возможности работать со смесями, масс-спектрометрия сегодня - основной метод анализа этих сложных для изучения объектов.

Пожалуй, можно признать, что современная масс-спектрометрия выиграла конкурентную борьбу с классическим методом установления первичной последовательности аминокислот в пептидах по Эдману, поскольку масс-спектрометрическое секвенирование оказалась существенно быстрее, чувствительнее, информативнее и даже дешевле. Быстрое и надежное определение первичной структуры белков, т.е. последовательности аминокислотных звеньев, само по себе уже превосходный результат. Однако масс-спектрометрия способна изучать структуры более сложных порядков (от 2 до 4), включая нековалентные взаимодействия белков с появлением надбелковых образований, устанавливать тип и место посттрансляционных модификаций, работать с гликопротеинами, липопротеинами, фосфопротеинами и т.д. Масс-спектрометрия стала незаменимой в медицине, поскольку способна быстро и надежно диагностировать сердечно-сосудистые, генетические и онкологические заболевания. Именно успехи масс-спектрометрии привели к формированию в конце прошлого века нового научного направления - протеомики. Огромна роль метода и в метаболомике.

К сожалению, в русскоязычной литературе до сих пор не существовало учебных пособий или монографий по этой важнейшей и многогранной по своему применению тематике. Россия кардинально отстает от развитых стран и по изучению этой дисциплины, и по использованию ее достижений. Масс-спектрометристам, работающим в России, приходится ориентироваться на англоязычные издания книг, оригинальные статьи и обзоры. В 2012 г. на русском языке была издана книга "Принципы масс-спектрометрии в приложении к биомолекулам" под редакцией Дж. Ласкин и X. Лифшиц (перевод с английского, изд-во "Техносфера"), представляющая собой сборник статей ведущих специалистов в области масс-спектрометрии в приложении к биологии. Книга рассчитана на подготовленных читателей. Она предоставляет

хорошую, во многом, заочную возможность познакомиться с современными достижениями в области масс-спектрометрии биомолекул, поскольку большинство описываемых в ней методов пока не используется в нашей стране.

Предлагаемая читателям книга "Основы масс-спектрометрии белков и пептидов" является первым учебным пособием на русском языке, излагающим основы масс-спектрометрии белков и пептидов. Книга написана в формате лекций для начинающих, иллюстрирована большим количеством рисунков, спектров, схем и сопровождается представительным списком цитированной литературы. Она рассчитана на студентов и аспирантов химических, физико-химических, биологических и медицинских специальностей; будет полезна научным сотрудникам, уже работающим в области исследований белков и пептидов или интересующимся этим научным направлением.

Цель издания такой книги - заинтересовать молодых исследователей информативной, очень красивой и востребованной во всем мире дисциплиной, дать возможность более эффективно применять масс-спектрометрию для решения своих собственных фундаментальных и прикладных научных задач.

Основное внимание в учебном пособии уделено методам ионизации белков и пептидов, процессам фрагментации этих соединений в газовой фазе. Достаточно подробно рассматриваются вопросы тандемной масс-спектрометрии, существующие методы инициирования фрагментации. Этот раздел очень важен в современной масс-спектрометрии. Он полезен для исследователей, работающих с любыми химическими соединениями и биополимерами. Несколько глав посвящены идентификации белков и пептидов. Сюда входят варианты автоматизированной идентификации, расшифровка спектров вручную, описание определенных сложностей масс-спектрометрического секве-нирования и вариантов их преодоления. Рассмотрены достоинства и недостатки двух основных подходов установления химической структуры белков: масс-спектрометрии "сверху-вниз" и "снизу-вверх". Отдельная глава посвящена вопросам количественного анализа.

Книга посвящена Александру Леонидовичу Курцу и Киму Петровичу Бутину, двум друзьям, замечательным профессорам химического факультета Московского государственного университета имени М.В. Ломоносова, очень близких нам в человеческом отношении, непосредственно участвовавшим в нашем химическом и гуманитарном образовании. Мы всегда высоко оценивали химическую эрудицию и потрясающие личностные качества этих ученых. Именно общение с этими людьми вдохновило нас в самом начале XXI века начать исследования в области масс-спектрометрии пептидов.

А.Т. Лебедев
К.А. Артеменко
Т.Ю. Самгина

Заголовок


2
2

Выделение и очистка белков осуществляется поэтапно.

1. Гомогенизация – это тщательное измельчение объектов биохимического исследования до однородного, то есть гомогенного состояния, то есть белки подвергаются тщательной дезинтеграции вплоть до разрушения клеточной стенки.
При этом используют:
а) ножевые гомогенизаторы типа Уорринга;
б) пестиковые гомогенизаторы Поттера - Эльвегейма;
в) шаровые и валковые мельницы – для более плотных объектов;
г) метод попеременного замораживания и оттаивания, при этом разрыв клеточной стенки происходит под действием кристалликов льда;
д) метод «азотной бомбы» – под высоким давлением клетки насыщаются азотом, затем давление резко сбрасывают, выделяется газообразный азот, который как бы взрывает клетку изнутри;
е) УЗ, различные пресс - методы, переваривание клеточных стенок ферментами. В большинстве случаев при гомогенизации выделяется тепло, при этом многие белки могут инактивироваться, поэтому все процедуры проводятся в холодных помещениях при t 0 или охлаждают сырье с помощью льда. При этом тщательно контролируют объем и время разрушения клеток, рабочее давление. Идеальным считается такой гомогенизат, который может подвергнуться дальнейшему экстрагированию.

2. Экстракция белков , то есть их перевод в растворенное состояние; чаще всего экстракцию проводят вместе с измельчением одновременно.

Экстракцию проводят:
а) растворением в 8-10% растворах солей;
б) с использованием буферных растворов с рН от кислых до слабощелочных (боратных, фосфатных, цитратных, трис - буферных: смесь трисаминометана с NH2 – CH3 + HCl;
в) осаждение белков органическими растворителями (этанол, метанол, бутанол, ацетон и их комбинациями), при этом происходит расщепление белково-липидных и белково-белковых компонентов, то есть разрушение ЧСБ.

3. Очистка и фракционирование белков. После экстрагирования производят разделение или фракционирование смеси на индивидуальные белки и их дальнейшую очистку:

а) высаливание – это процесс осаждения белков нейтральными солевыми растворами щелочных и щелочноземельных металлов.

Механизм высаливания – добавляемые анионы и катионы разрушают гидратную белковую оболочку белков, являющуюся одним из факторов устойчивости белковых растворов. Чаще всего применяются растворы сульфатов Na и аммония. Многие белки отличаются по размеру гидратной оболочки и величине заряда. Для каждого белка есть своя зона высаливания. После удаления высаливающего агента белок сохраняет свою биологическую активность и физико-химические свойства. В клинической практике применяется метод высаливания для разделения глобулинов (при добавлении 50% раствора сульфата аммония (NH 4)2SO 4 выпадает осадок) и альбуминов (при добавлении 100% раствора сульфата аммония (NH 4)2SO 4 выпадает осадок).

На величину высаливания оказывают влияние:
1) природа и концентрация соли;
2) рН-среды;
3) температура.

Главную роль при этом играют валентности ионов. Поэтому действие соли оценивают по ионной силе раствора μ:

, то есть ионная сила раствора (μ) равна произведению ½ концентрации каждого иона (С) на квадрат его валентности (V).

Метод Кона является разновидностью высаливания. Одновременно происходит экстракция и осаждения компонентов. Изменяя последовательно температуру (обычно низкие t o –0+8 o С), рН раствора и концентрированного этанола, из плазмы крови последовательно выделяют до 18 фракций белков.

Метод Кона применяют в фармацевтическом производстве при получении кровезаменителей;
б) методы хроматографии . Основоположником разработки хроматографических методов анализа считается русский ученый Михаил Цвет (1903). В настоящее время существует много ее разновидностей. В основе метода лежит способность веществ специфически адсорбироваться на адсорбенте, заключенном в колонку или помещенном на каком-либо носителе. При этом происходит разделение анализируемых веществ и их концентрирование в строго определенном слое адсорбента. Затем через колонку пропускают соответствующие элюенты (растворители), которые ослабляют силы адсорбции и вымывают адсорбированные вещества из колонки. Вещества собираются в коллекторе фракций.

Основополагающим в хроматографии является коэффициент распределения , который равен отношению концентрации вещества в подвижной фазе к концентрации вещества в неподвижной фазе (или стационарной фазе ).

Неподвижная стационарная фаза – может быть твердой или жидкой или смесью твердой и жидкой.

Подвижная фаза – жидкая или газообразная, она течет по стационарной, или пропускается через нее.

В зависимости от вида стационарной и подвижной фазы бывают различные модификации хроматографического анализа.

Адсорбционная – основана на различной степени адсорбции белков адсорбентом и растворимости их в соответствующем растворителе.

Применяемые адсорбенты – кремниевая кислота, Al 2 О 3 , CaCO 3 , MgO, древесный уголь. Адсорбент в виде суспензии с растворителем (чаще с буферным раствором) упаковывают в колонке (стеклянная вертикальная трубка). Образец наносят на колонку, затем через нее пропускают растворитель или смесь растворителей.

Разделение основано на том, что вещества с более высоким К распр. (Б), продвигаются по колонке с большей скоростью. Сбор фракций осуществляется с помощью коллектора фракций.

Распределительная хроматография – основана на распределении смеси белков между двумя жидкими фазами. Разделение может происходить на специальной хроматографической бумаге, а также в колонках, как в адсорбционной. Твердая фаза в данном случае служит только опорой для жидкой стационарной фазы. Хроматографическая бумага обладает свойством задерживать воду между своими целлюлозными волокнами. Эта вода - неподвижная стационарная фаза. Когда по бумаге под действием капиллярных сил движется неводный растворитель (подвижная фаза), молекулы вещества, нанесенного на бумагу, распределяются между двумя фазами в соответствии с их коэффициентом распределения. Чем выше растворимость вещества в подвижной фазе, тем дальше оно продвинется по бумаге вместе с растворителем.
В случае распределения хроматографии на колонке – носители – это целлюлоза, крахмал, силикагель и др., неподвижная фаза – вода. При нанесении на колонку вещества смеси движутся по колонке с разной скоростью с учетом Краспр.

Rf для каждого соединения в стандартных условиях величина постоянная.
Ионообменная хроматография – основана на притяжении противоположно заряженных частиц. Для этого используют различные ионообменные смолы: катионообменные – содержат отрицательно заряженные группы – сульфированные стиролы и КМЦ, которые притягивают положительно заряженные ионы исследуемых веществ. Их называют также кислотными ионообменниками.
Анионообменные смолы, или основные ионообменники, содержат положительно заряженные группы, притягивающие отрицательно заряженные молекулы белков
Триметиламиностирол, это производное стиролов и целлюлозы.
В зависимости от q разделяемых белков используют соответствующие ионообменники, с которыми взаимодействуют определенные белки, а другие беспрепятственно выходят из колонки. «Осажденные» на колонке белки снимают, используя более концентрированные солевые растворы или изменяя рН элюента.
Аффинная хроматография (или хроматография по сродству) основана на принципе избирательного взаимодействия белков или других макромолекул с иммобилизованными на носителях специфическими веществами – лигандами (это может быть кофермент, если выделяют фермент, антитело антиген и др. Благодаря высокой специфичности белков к иммобилизованным лигандам к нему присоединяется только один белок из смеси. Смывается буферными смесями с измененным рН или измененной ионной силой.
Достоинство – возможность одноэтапно выделить заданное вещество высокой степени чистоты.
Метод гель - фильтрации или метод молекулярных «сит» - это разновидность проникающей хроматографии.
Разделение молекул по размерам и форме основано на свойствах молекулярного сита, которые обладают многие пористые материалы, например органические полимеры с трехмерной сетчатой структурой, придающей им свойства гелей. Гель фильтрация – это разделение веществ с помощью гелей, основанное на различиях в размере молекул (сефароза, сефадекс, сефакрил, биогели и т.д.). Под действием эпихлоргидрина полисахаридные цепочки декстрана (синтезируется микроорганизмами) сшиваются в сетчатую структуру, становятся нерастворимыми в воде, но сохраняют к ней большое сродство. Благодаря этой гидрофильности полученные зерна (называемые сефадексом) сильно набухают с образованием геля, которым заполняют колонку. Метод основан на том, что крупные молекулы не проникают во внутреннюю водную фазу, а более мелкие молекулы сперва проникают в поры «сита», как бы застревают в них, а поэтому движутся с меньшей скоростью. Соответственно белки с большей Mr первыми поступают в приемник. В последнее время в проникающей хроматографии все чаще используют в качестве молекулярного сита пористые стеклянные гранулы.
Электрофоретический метод в биохимии – основан на различии скорости передвижения молекул в электрическом поле (аминокислоты, пептиды, белки, нуклеиновые кислоты).
Различие скорости движения зависит:
1. от q молекулы: подвижность молекул тем больше, чем больше суммарный q. Величина q зависит от рН;
2. от размеров молекул: чем крупнее молекулы, тем меньше их подвижность. Это связано с возрастанием сил трения и электростатических взаимодействий крупных молекул с окружающей средой;
3. от формы молекул: молекулы одинакового размера, но различной формы, например, фибрилл и глобул белка обладают различной скоростью. Это связано с различиями в силах трения и электростатического взаимодействия.
Виды электрофореза
а) Изоэлектрическое фокусирование. Разделение происходит на вертикальной колонке в град. как рН, так и напряжения. С помощью специальных носителей амфолитов в колонке устанавливается град. рН от 0 до 14. В колонку помещают смесь веществ, подключаю электроток. Каждый из компонентов движется к той части колонки, где значение рН соответствует его изоэлектрической точке и там останавливается, то есть фокусируется.
Достоинство: происходит разделение, очистка и идентификация белков в один прием. У метода высокая разрешительная способность (0,02 pI).
б) Изотахофорез – это электрофорез на поддерживающих средах. После включения электротока ионы с самой высокой подвижностью движутся к соответствующему электроду первыми, с самой низкой – последними, обладающие промежуточной подвижностью – располагаются посередине.
в) Диск-электрофорез – прибор состоит из двух сосудов с буфером – верхнего и нижнего, соединенных вертикальными трубками, содержащими разнопористый гель. По мере движения ионизированных частиц под действием электротока. Более высокая пористость – в верхней части геля.
г) Иммуноэлектрофорез – метод сочетающий электрофорез с иммунодиффузией (для обнаружения антигенов в сложных физиологических смесях). На специальный носитель перпендикулярно друг другу помещают смесь антигенов и смесь антител. При включении электротока они разделяются на индивидуальные вещества и диффундируют на гелевом носителе. В месте встречи антигена с соответствующим антителом происходит специфическая реакция преципитации в форме дуги. Количеств образовавшихся дуг соответствует количеству антигенов.

Методы определения Mr белков

У большого числа белков химический состав и последовательность аминокислот не установлена (1010–1012 белков), поэтому у таких белков определяют Mr. При этом используются различные методы.
а) Седиментационный метод – определение Mr проводят в специальных центрифугах (первая центрифуга была предложена шведским биохимиком Сведбергом), в которых удается создать центробежное ускорение, которое больше в 200 тыс. и более раз ускорения земного притяжения. Mr определяют по V седиментации молекул. По мере перемещения молекул от центра к периферии образуется резкая граница белок-растворитель. Скорость седиментации выражают через константу седиментации (S):

где V – скорость перемещения границы белок-растворитель (см/с);
 – угловая скорость ротора (рад/с);
 – расстояние от центра ротора до середины ячейки с раствором белков (см).
Величина константы седиментации S, которая равна 110–13 С условно принята за 1 и называется 1 Сведбергом (S). S для белков лежит в пределах 1-50 S, иногда до 100 S.
Mr белков определяется по уравнению Сведберга:

где R – универсальная газовая постоянная;
Т – абсолютная температура по Кельвину;
S – константа седиментации;
Д – коэффициент диффузии;
 – плотность растворителя;
V – парциальный удельный объем газа.
Этот метод дорогостоящий из-за применения аппаратуры.
Более просты и дешевы:
б) Гель-фильтрация в тонком слое сефадекса.
Длина пробега белка (в мм) находится в логарифмической зависимости от Mr.
Х – Mr искомого белка на калибровочном графике.
в) Диск-электрофорез в полиакриламидном слое – также существует зависимость между логарифмом Mr калибровочных белков и длиной их пробега.

Методы определения гомогенности белков

Степень чистоты выделенного белка определяется:

  • ультрацентрифугированием;
  • методом диск - электрофореза;
  • различными иммунохимическими методами;
  • определением растворимости белка (метод Нортропа) основан на правиле фаз, согласно которому растворимость чистого вещества при данных условиях опыта зависит только от температуры, но не зависит от концентрации вещества в твердой фазе.

Если белок гомогенный, то на графике получается один перегиб (а), если есть примеси белков (б, в), то получим несколько перегибов кривой насыщения. У всех белков свои индивидуальные кривые растворимости.