Слайд 1
Моделирование структуры биомакромолекул
Акберова Н.И., 2017
Лекция 1
Слайд 2Моделирование структуры биомакромолекул
Для чего?
Слайд 3Структура белков определяет их функцию
Моделирование структуры биомакромолекул
Слайд 5Первичная структура: последовательность
Пептидная сязь
МОНОМЕР
ПОЛИМЕР
Аминокислота
Полипептид
Первичной структурой белка является его аминокислотная последовательность
>small ubiquitin-related
modifier 3 precursor [Homo sapiens]
MSEEKPKEGVKTENDHINLKVAGQDGSVVQFKIKRHTPLSKLMKAYCERQG
LSMRQIRFRFDGQPINETDTPAQLEMEDEDTIDVFQQQTGGVPESSLAGHSF
Слайд 6
Первичная структура: последовательность
Двадцать аминокислот, встречающихся в белках, имеют различные свойства.
Слайд 7Первичная структура: последовательность
Слайд 8Вторичная структура: α-спирали, β-листы, петли
α-спирали и β-листы формируются путем образования водородных
связей между атомами кислорода и водорода главной цепи.
Слайд 9
Вторичная структура: α-спирали
Слайд 10Вторичная структура: β-листы
Антипараллельный β-лист
Параллельный β-лист
β-лист
β-тяж
Смешанный β-лист
Слайд 14Третичная структура: пространственная укладка белка (фолд)
Слайд 15Четвертичная структура: мультимерные белки и белковые комплексы
Гемоглобин
- тетрамер
Рибосома: РНК-белковый комплекс
- синтез
белка
Реплисома
- копирование ДНК
Слайд 16Сворачивание белка (фолдинг)
Сворачивание белка - процесс укладки полипептидной цепи в компактную
пространственную структуру.
Аминокислотная последовательность белка одназначно определяет его пространственную структуру [Anfinsen et al., 1960s].
Пространственная структура белка определяет его функцию.
Слайд 17Нековалентные (“слабые”) взаимодействия
Водородные связи
Ионные связи
Гидрофобные взаимодействия
Ван-дер-Ваальсовы взаимодействия
Слайд 18Гидрофобность аминокислот
Гидрофобные эффекты играют важную роль в сворачивании белка
Экспериментально измеренные уровни
гидрофобности аминокислот
Слайд 19Определение пространственной структуры белка
Экспериментальный подход
Вычислительный подход
- Предсказание пространственной структуры белка на
основе информации о его последовательности
- Рентгеноструктурный анализ
- Метод многомерного ЯМР
- Метод криоэлектронной микроскопии
Molecular Conceptor v. 2.11, Synergix ltd., USA
Слайд 20Преимущества метода рентгеноструктурного анализа.
принципиально достижимо высокое разрешение. Разрешение выше 1Å позволяет
определять степень протонирования а/к остатков в белках
возможность разрешать структуры объектов большого размера (вирусная капсида, рибосома, фотосинтетический реакционный центр, т.д.), состоящих из нескольких десятков тысяч атомов.
Molecular Conceptor v. 2.11, Synergix ltd., USA
Слайд 21Ограничения метода рентгеноструктурного анализа биомолекул
Molecular Conceptor v. 2.11, Synergix ltd., USA
20
человеколет на GroEL
Слайд 22Схема рентгеноструктурного исследования
Слайд 23Наработка и очистка белка
Выращивание кристалл(а/ов)
Molecular Conceptor v. 2.11, Synergix ltd., USA
Слайд 24Снятие рентгенограмм кристаллов
Molecular Conceptor v. 2.11, Synergix ltd., USA
Регулярный Кристалл Размером
Слайд 25Определение координат тяжелых атомов биомолекулы
Molecular Conceptor v. 2.11, Synergix ltd., USA
Слайд 26Protein Structure Initiative (NIGMS, NIH, USA, 2001-2010, 2011-2015)
Выбор объекта
$750M
Экспрессия белка
С высоким
выходом
Высокоэффективная
очистка
Кристаллизация
Отбор кристаллов, Сбор данных
4 крупных и 6 малых центров разрешили за 7 лет более 3000 белковых структур (40% новых структур)
Полуавтоматическое
Разрешение структуры
Валидация стр-ры, Помещение в PDB
Полуавтоматическая
публикация
Новая структура каждые 2 дня!
GroEL за 2 месяца.
Service R.B., Science 319, 1610 (2008)
Слайд 27Многомерная ЯМР спектроскопия
Преимущества:
молекулы в растворе (тяжѐлая вода), не нужно выращивать кристалл
положения
атомов водорода м.б. определены
информация о динамике
атомов м.б. определена
В бел ках 103 – 104 протонов Метильные и метиленовые группы 0,8-3,5 ppm, ароматические, индольные и иммидазольные кольца 6,5-8 ppm
В ДНК/РНК Н-2/Н-8 пуринов 8,4-
9 ppm, Н-5 пиримидинов 6,3-6,6 ppm, Н-6 8,0-8,5 ppm, метильная группа тимидина 2,3-2,4 ppm.
Molecular Conceptor v. 2.11, Synergix ltd., USA
Слайд 28Bruker Biospin AVANCE 1000
The World’s First 1 Gigahertz NMR Spectrometer
World’s First
1 Gigahertz NMR Spectrometer based on unique
23.5 Tesla Standard-Bore, Persistent Superconducting Magnet (12-tonne, 4.5-metre-tall machine)
Dr. Lyndon Emsley, European Centre for High Field NMR (CRMN) in Lyon, France.
Nature 463,605(2010).
€11.7-million (US$16.3-million)
http://www.bruker-biospin.com/av1000-dir.html
Слайд 29Ограничение метода многомерного ЯМР
Molecular Conceptor v. 2.11, Synergix ltd., USA
Структура белков
< 300 а/к остатков м.б. Определена этим методом, что составляет менее половины известных белковых последовательностей. Известны примеры разрешения структур белков из 700 а/к.
Дороговизна получения образцов с изменѐнным изотопным составом
(13С, 19F, 31P)
Невысокая точность разрешения структуры
Слайд 30Физические принципы метода ядерного магнитного резонанса
Характерные спектры химических групп и соединений
Molecular
Conceptor v. 2.11, Synergix ltd., USA
Слайд 31Сбор данных
Анализ, Соотнесение (assignment)
Molecular Conceptor v. 2.11, Synergix ltd., USA
Слайд 32
Sequential NOEs ("NOESY walks") in aromatic- H1'/H5 region of TWJ-TC acquired
in D20 at 30'C with a 300 ms mixing time. (A) Strand 1 connectivities. (B) Strand 2 connectivities.
Leontis, N. et al., Biophysical Journal, 68, 251 (1995).
Слайд 33Определение координат атомов молекулы
Molecular Conceptor v. 2.11, Synergix ltd., USA
Для структур
разрешѐнных методом многомерного ЯМР представлено 10-20 структур. Усреднѐнная структура имеет наибольшую достоверность.
Слайд 34Электронная микроскопия
Определяется форма крупных межмолекулярных комплексов методом диффракции электронных пучков.
Типичное разрешение
этого метода 3-5 Å не позволяет определять координаты атомов.
Образцы в замороженном состоянии, что предотвращает радиационные повреждения и удерживает их в нативном состоянии.
Molecular Conceptor v. 2.11, Synergix ltd., USA
Слайд 35Банк белковых структур. Protein Data Bank
(PDB)
http://www.rcsb.org/pdb
Research Collaboratory for Structural Bioinformatics
Каждая структура имеет
свой идентификатор (4 символа) и ей соответствует
файл, в котором приведены координаты тяжѐлых атомов.
Структура PDB файла. (Brookhaven Protein Data Bank)
Слайд 36https://www.dnastar.com/blog/structural-biology/why-structure-prediction-matters/
Слайд 37Ab initio - моделирование укладки “из первых принципов” - без использования
дополнительной информации о структурах схожих белков.
Предсказание на основе гомологии (homology modeling) -
моделирование на основе известных структур схожих белков.
Тридинг (Threading) - моделирование на основе слабой гомологии.
Предсказание пространственной структуры белка
Слайд 38Предсказание структуры ab initio
Функция потенциальной энергии
Модель водного раствора
Оценка попарного взаимодействия между
аминокислотами
Поиск в пространстве всевозможных конформаций
Модель на основе “решетки”
Молекулярная динамика
Использование библиотек известных 3D фрагментов
Предсказание вторичной структуры
Слайд 39Предсказание структуры с использованием решетки
HP-модель (Hydrophobic-Polar) - рассматривает гидрофобные взаимодействия как
наиболее важные.
Не существует эффективных алгоритмов
Плохо отражает реальность
Слайд 40
Предсказание структуры с использованием решетки
Слайд 41Используются структурно консервативные фрагменты длиной 4-10 аминокислот
Поиск в пространстве конформаций осуществляется
методом Монте Карло
Полученные структуры кластеризуются и в качестве результата выдаются наилучшие структуры для каждого кластера
ROSETTA
Слайд 42Предсказание структуры на основе гомологии
Выравнивание рассматриваемой последовательности с последовательностями белков с
известной 3D структурой (обычно >30% сходства)
Наложение моделируемой последовательности на известную структуру согласно выравниванию
Локальное улучшение полученной пространственной структуры
Число уникальных укладок (фолдов), наблюдающихся в белках, ограничено
(несколько тысяч)
90% помещаемых в PDB структур имеют уже известные укладки (фолды)
Слайд 44Предсказание структуры на основе гомологии
Raw model
Loop modeling
Side chain placement
Refinement
Слайд 45Тридинг (Threading) - предсказание структуры на основе слабой гомологии
MTYKLILN …. NGVDGEWTYTE
Главное
отличие от моделирования по гомологии - поиск наилучшей структуры осуществляется с помощью выравнивания последовательности со структурой, а не с последовательностью. При этом используется специальным образом определенная весовая функция.
Слайд 46Основные компоненты тридинга
библиотека уникальных укладок (фолдов)
функция, определяющая вес выравнивания последовательности со
структурой
алгоритм нахождения наилучшего выравнивания
Слайд 47
CASP - конкурс методов предсказания структуры белков
Critical Assessment of protein Structure
Слайд 48Гомологическое моделирование третичной структуры
белка на основе первичной структуры
Стратегия построения пространственной структуры
белков методом моделирования по гомологиям:
Определения круга гомологичных белков;
Нахождение структурно-консервативных элементов в структуре гомологов (SCRs);
Выравнивание последовательности модельного белка с последовательностями гомологов, с учѐтом наличия SCR;
Присвоение координат атомов остатков, входящих в SCR, соответствующим атомам модельного белка согласно выравниванию;
Предсказание конформации петель, соединяющих SCR, а также N- и С-концов пептидной цепи белка;
Поиск оптимальной конформации боковых остатков аминокислот модельного
белка, отличающихся от остатков опорного белка;
Использование методов регуляризации структуры (энергетическая минимизация и молекулярная динамика) для уточнения молекулярной структуры с целью устранения стерических напряжений созданных при построении моделей.
Слайд 49Присвоение координат атомов
В первую очередь присваиваются координаты атомам полипептидной цепи.
Затем присваиваются
координаты атомам боковых цепей. Благоприятный случай, когда аминокислота модельного белка совпадает с соответствующей кислотой белка- гомолога. В этом случае конформация боковой цепи остаѐтся неизменной. Если боковая цепь аминокислоты модельного белка короче, чем соответствующая цепь аминокислоты гомолога, более короткая цепь повторяет насколько это возможно более длинную (торсионные углы одинаковы). Если же аминокислота модельного белка более длинная, то начальный ход повторяет ход боковой цепи в белке-гомологе, а последующие атомы цепи помещаются в развѐрнутую (extended) конформацию,
вероятно вызывая сильные напряжения в структуре модельного белка.
Слайд 50Поиск конформации соединяющих петель
После того, как присвоены координаты атомам, составляющим петли,
мы имеем модельную структуру, которая нуждается в приведении еѐ в соответствие со следующими требованиями:
Геометрия пептидной цепи модельной структуры должна быть регулярной (транс- конформация пептидных групп, близкие к равновесным значения валентных углов и дли связей);
Атомы не должны перекрываться, т.е. расстояния между несвязанными атомами не должны быть существенно меньше, чем сумма их ван-дер-ваальсовских радиусов;
Боковые цепи аминокислот должны находиться в равновесной конфигурации;
▪Если в молекуле имеются дисульфидные мостики (Cys-Cys связи), то расстояния между соответствующими атомами серы должны быть приведены в соответствие с геометрией;
В структуру должны быть помещены необходимые простетические группы.
Слайд 51Построение пространственной структуры D-amino-acid
oxidase из Trigonopsis variabilis (Yeast)
В качестве опорного белка
была использована пространственная структура D-Amino Acid Oxidase из Rhodotorula gracilis (PDB идентификатор 1C0L)
Слайд 53Типичная процедура регуляризации модельной структуры белка
Энергетическая минимизация участков сочленения SCR и
петель с упором на восстановление нормальной пептидных связей;
Энергетическая минимизация пептидной цепи и боковых остатков петель;
Энергетическая минимизация боковых цепей аминокислот, принадлежащих SCR, подвергшихся замене при присваивании координат;
Энергетическая минимизация всех боковых остатков белка;
Энергетическая минимизация (500-1000 шагов) всей структуры модельного белка;
Молекулярная динамика модельного белка в вакууме на протяжении 20-50 пикосекунд;
Финальная энергетическая минимизация структуры белка (200-500 шагов).
Результатом этой процедуры будет белковая структура с прав ильно й стереох имией (длины валентных связей и значения валентных углов не будут существенно отличаться от равновесных значений), с отрицательной энергией несвязанных взаимодействий (свидетельство того, что не наблюдается перекрытие ван-дер-ваальсовских радиусов атомов), с отрицательной энергией электростатических взаимодействий (произошло сближение противоположно заряженных атомов) и с ненулевой энергией водородных связей (в молекуле установились водородные связи).
Дальнейшая регуляризация структуры приведѐт к еѐ улучшению с точки зрения стереохимии, но
при этом возрастут искажения структуры активного центра (центра связывания) вашей структуры.
Модельная ст руктур а по ст р о ена и отрелаксирована. Она обладает участками структурно- консервативных областей, унаследованных от белков гомологов, правильной стереохимией (результат регуляризации). Дальнейшие манипуляции с этой структурой (подгонка геометрии активного центра, точечные мутации) зависят от цели исследований. Полученную структуру надо рассматривать как средство иллюстрации результатов вашей работы (объяснения экспериментальных фактов, гипотезы).