Задача межмолекулярного распознавания «Розеттский камень»: эволюционно-физический подход



Скачать 146.54 Kb.

Дата16.02.2017
Размер146.54 Kb.
Просмотров118
Скачиваний0
ТипЗадача

Возможное и невозможное в компьютерном моделировании биомолекул
Чугунов Антон
Лаборатория моделирования биомолекулярных систем http://model.nmr.ru
Институт биоорганической химии РАН http://ibch.ru
«Проблемы медицинской биоинформатики»
20 ноября 2012 г.
«Альфа-спираль для Полинга»
© Джулиан Восс Андре, 2004. Сталь, высота 3 м
Портланд, США

1. Кое-что из общих глав молекулярного моделирования
2. Ионные каналы и нейротоксины: задача межмолекулярного распознавания
3. «Розеттский камень»: эволюционно-физический подход к предсказанию структуры белков
4. «Молекулярный микроскоп»: энигма молекулярной динамики
План лекции

«Кремниевый» эксперимент
I. Введение в молекулярное моделирование

In silico (от in silicon) – новый латинизм, расширяющий методологию биологического эксперимента за пределы
in vivo («в живом») и in vitro («в стекле»)

In silico – идеология полностью компьютерного, но достоверного эксперимента

Подход in silico многоуровневый:

моделирование поведения отдельных молекул,

биохимических процессов,

отдельных физиологических систем и

популяций и экосистем

Молекулярное моделирование
I. Введение в молекулярное моделирование
Молекулярное моделирование – набор вычислительных методов, позволяющих с разной степенью физической корректности на атомарном уровне изучать молекулярные системы разной сложности
1. Методы
эмпирических
силовых полей
2. Биоинформатика
3. Моделирование
на основании
гомологии
4. Молекулярный
докинг
0. Квантовая механика

Эмпирические силовые поля (ЭСП)
I. Введение в молекулярное моделирование
Квантово-механическая система рассматривается в приближении классической (Ньютоновской) физики:
Взаимодействие между атомами описывается суммой термов потенциальной энергии:
U
общ
= U
валентн
+ U
невалентн
,
U
валентн
=
U
bond
+
U
angle
+
U
torsion
,
U
невалентн
=
U
vdW
+
U
coulomb
+ U
hbond
R
0
α
0
φ
0
i
i
i
i
r
d
dU
F
dt
r
d
m






2 2
??????
????????????????????????
??????
????????????
=
1 2
??????
????????????
(??????
????????????
− ??????
0,????????????
)
2
??????
??????????????????????????????

????????????
)=
1 2
α
????????????

????????????
− α
0,????????????
)
2
??????
??????????????????????????????????????????
φ
????????????????????????
= ??????
φ
1 + cos ???????????? − φ
0
??????
??????????????????
(??????
????????????
) =
??????
????????????
??????
12

??????
????????????
??????
6
??????
??????????????????????????????????????????
??????
????????????
= ??????
??????
??????
??????
??????
ε
??????
??????
????????????

Параметры ЭСП. Топология молекул
I. Введение в молекулярное моделирование
[ NH2 ]
[ atoms ]
type mass chrg
N
NT
14.00670
−0.83
H1
H
1.00800 0.415
H2
H
1.00800 0.415
[ bonds ] r
0
k
N
H1 0.1000 1.8700e+07
N
H2 0.1000 1.8700e+07
-C
N
0.1330 1.0600e+07
[ angles ]
α
0
k
-O -C N
124.000 502.080
CA -C N
120.000 334.720
-C N H1 120.000 292.880
-C N H2 120.000 292.880
H1 N H2 120.000 334.720
[ dihedrals ]
φ
0
k n
-CA -C N H1 180.000 33.472 2
[ nonbond ]
A
B
NT
0.24362E−02 0.16924E−05
H
0.00000E+00 0.00000E+00

Силовое поле – набор констант, описывающих конкретный вид потенциальных термов для всех типов атомов

В файле топологии всем атомам соотносятся параметры силового поля, а также партнеры по валентным связям
Файл топологии для фрагмента
аминокислоты:

ЭСП: оптимизация геометрии молекулы
I. Введение в молекулярное моделирование
Алгоритмы минимизации свободной энергии позволяют приводить структуру в энергетически (и геометрически) выгодное состояние

X
Y
a(x , y )
0 0
a(x , y )
0 0
b b c c d d
U(x,y)
Энергетический контур функции x +ny
2 2
Линейный поиск вдоль линии bacd.
U(x,y)
U(x,y)
U(x,y)











0 0
0 0
,
0
,
0
,
)
'
,
'
(
y
x
y
x
dy
dU
y
dx
dU
x
y
x

Разновидности:
Метод скорейшего спуска
 Метод сопряжённых градиентов

Приложения:
 «Релаксация» структуры молекул
 Оптимизация комплексов рецептор–лиганд
 Сравнение термодинамических параметров разных состояний системы
 Устранение невыгодных взаимодействий
 «Формирование» конформации, удовлетворяющей заданным условиям

ЭСП: метод Монте Карло
I. Введение в молекулярное моделирование
Сканирование конформационного пространства координаты атомов, двугранные углы, …
Оценка конформаций
критерий Метрополиса
Достоинства метода:
Позволяет широко представить конформационное пространство исследуемой молекулы
Недостатки:
Метод не дает динамической картины поведения системы.
Длительность моделирования для получения представительной выборки «хороших» конформаций нелинейно зависит от числа степеней свободы молекулы
(
)
(
)
1
(
)
(
)
U R
U R
i
i
kT
random
p
U
e
p
U
p







Накопление «хороших» (низких по энергии) конформаций
Николас Метрополис

ЭСП: метод молекулярной динамики (МД)
I. Введение в молекулярное моделирование
Основа: численное решение уравнения Ньютона

наблюдение за эволюцией системы во времени
Результат МД — траектория: файл, содержащий координаты и скорости атомов через равные промежутки времени
МД модулирует различные ансамбли — состояния, в которых микроскопические параметры могут быть произвольными, а макроскопическое состояние удовлетворяет заданным условиям (NPT, NVT)
i
i
i
i
r
d
dU
F
dt
r
d
m






2 2

ЭСП: историческая справка по МД
I. Введение в молекулярное моделирование
МД «биллиардных шаров» (конец 50-х)
Alder B.J., Wainwright T.E. (1957).
Phase transition for a hard sphere system.
J. Chem. Phys. 27, 1208–1209
UNIVAC 1 использовал
5200 электрова куумных ламп, весил 13 т.
1955 г.
Бэрни Алдер (стоит), Том
Вайнрайт и Мэри Мэнсайн
Метод ЭСП
(начало 70-х)
Моделирование биомолекул
Шнейр Лифсон, Майкл Левит
Levitt M. (1969). Detailed Molecular
Model for Transfer Ribonucleic Acid.
Nature 224, 759–763
Динамика белковой глобулы (конец 70-х)
Мартин Карплюс,
Эндрю Мак-Кэммон
McCammon J.A., Gelin B.R., Karplus M. (1977).
Dynamics of folded proteins.
Nature 267, 585–590

ЭСП: граничные условия в МД
I. Введение в молекулярное моделирование
Периодические граничные условия
служат для сведения к минимуму «краевых эффектов»

заключаются в «размножении» ячейки с системой вокруг ее реального положения

частицы внутри «виртуальной» ячейки друг с другом не взаимодействуют
Поддержание постоянных температуры и
давления
осуществляется с помощью алгоритмов, называемых термостатом и баростатом

Накладывается условие постоянства суммарной кинетической энергии частиц в системе

Основано на добавлении к уравнению движения силы, пропорциональной скорости частицы
(аналог жидкого трения)
??????
??????
??????
2
??????
??????
????????????
2
= ??????
??????
− γ
????????????
????????????
Разновидности
термостатов:

Берендсена

Нозе-Гувера

коллизионный термостат


Нейротоксины: к каждой мишени своя «пуля»
За слайд спасибо А. Василевскому
II. Задача межмолекулярного распознавания

Потенциал-чувствительные Na
+
-каналы
отвечают за потенциал действия в возбудимых клетках

α-субъединица: четыре гомологичных повтора (DI–IV), по 6 TM-сегментов в каждом (S1–6)

S1–S4: Потенциал-чувствительный домен
(каждый третий остаток в
S4
— R/K)

S5–S6: пóровый домен и селективный фильтр

У насекомых один тип, у млекопитающих — девять (Na v
1.1–1.9)

6+ сайтов связывания нейротоксинов: тетродо-, граяно-, бреви-, коно-, токсинов скорпионов, …
α-токсины скорпионов
( инактивацию)
Пóра
Пора
Селективный фильтр
β-токсины скорпионов
( активацию)
II. Задача межмолекулярного распознавания

β
1
β
2
β
3
α
{
Млекотоксин Aah2
N
α-Токсины селективны к подтипам рецепторов
«Млекотоксины»
Aah2
VKDGYIVDDVNCTYFCGR-NAYCNEECTKLKGESGYCQWASPYGNACYCYKLPDHVRTKGPG-RCH--
BmK M8
VKDGYIADDRNCPYFCGR-NAYCDGECKKNRAESGYCQWASKYGNACWCYKLPDDARIMKPG-RCNGG
Bmk αTx11
GRDAYIADSENCTYFCGS-NPYCNDVCTENGAKSGYCQWAGRYGNACYCIDLPASERIKEGG-RCG--
:
*
**
.*.
**
*
*
*
* *.*
*
:
*
.: .:*
*
*
*
***. *
*
**
*
:
*
**
*
* *
*
+ Aah1, Aah3, Bot3, Lqh2, Lqq5

«Инсектотоксины»
LqhαIT
VRDAYIAKNYNCVYECFR-DAYCNELCTKNGASSGYCQWAGKYGNACWCYALPDNVPIRVPG-KCHRK
Lqq3
VRDAYIAKNYNCVYECFR-DSYCNDLCTKNGASSGYCQWAGKYGNACWCYALPDNVPIRVPG-KCH--
**
*
*
**
****
**
*
*
*
*
** *.*
*
*.*
*
*******
*
*
*
******
*
*
**
*
*
**
**
********
*
*
*
*
+ Aah2_chimera, BmK αIT1, Bot IT1, BjaIT

“α-Подобные” токсины
(действуют и на насекомых, и на млекопитающих)
BmK M1
VRDAYIAKPHNCVYECAR-NEYCNDLCTKNGAKSGYCQWVGKYGNGCWCIELPDNVPIRVPG-KCH--
BmK M2
VRDAYIAKPHNCVYECAR-NEYCNNLCTKNGAKSGYCQWSGKYGNGCWCIELPDNVPIRVPG-KCH--
BmK M4
VRDGYIALPHNCAYGCLN-NEYCNNLCTKDGAKIGYCNIVGKYGNACWCIQLPDNVPIRVPG-RCHPA
BmK M7
VRDAYIAKPENCVYHCAG-NEGCNKLCTDNGAESGYCQWGGRYGNACWCIKLPDDVPIRVPG-KCH--
Lqh3
VRDGYIAQPENCVYHCFPGSSGCDTLCKEKGGTSGHCGFKVGHGLACWCNALPDNVGIIVEGEKCHSX
**
*
**
* *.
**
*
*
*
: *
*
...*.
*
:
*
:
*
*
*
*
**
*:* * *
*
:
*
*
+ Bom3, Bom4, Bot1, Bot2, Lqh4, Lqh6, OD1, BmK M10
C-конец
«Модуль
специфичности»
RT-петля
II. Задача межмолекулярного распознавания

«Модульная» структура α-токсинов
Анализ конформационной подвижности выявил две «псевдодомена»:
«специфичный» и «коровый» модули
Модуль специфичности у млекотоксинов более подвижен!
II. Задача межмолекулярного распознавания

Метод «белковой топографии»
1. Подготовка молекулы
2. Отнесение констант
3. Расчет поверхности
4. Проекция на сферу
5. Интерполяция на координатную сетку
M
Гидрофильно
Гидрофобно
6. Картографическая проекция
(Мольвейде)
II. Задача межмолекулярного распознавания
МГП
М
= ??????
??????
× ??????( ??????
??????
− ??????
??????
)
??????
??????=1
← гидрофильно
МГП
гидрофобно


Модуль специфичности в млекотоксинах
гидрофильнее, чем в инсектотоксинах
← hydro ph ili c
hydro ph ob ic

Модуль специфичности
Функционально вариабельные остатки
II. Задача межмолекулярного распознавания

Домен
III
Домен
I
Домен
IV
Домен
II
Модульная организация токсинов отражает
доменную структуру каналов
 3D-модель Na v
1.2 построена по шаблону
K
v
1.2/2.1
 Внеклеточный вид
 Расположение доменов:
«против часовой стрелки»
II. Задача межмолекулярного распознавания

III. «Розеттский камень»
ROSETTA: эволюционно-физический подход
к предсказанию структуры белков
1. Выделение структурно- консервативных фрагментов
2. «Сборка» фрагментов в силовом поле
3. Оптимизация
«высокого разрешения»
Розеттский камень: Египет, 1799 г.
Приложения в структурной
биологии:
 Предсказание структуры
 Моделирование «петель»
 Белок-лигандный и белок- белковый докинг
 Моделирование фибрилл
 Фолдинг РНК
 Дизайн новых функций
 Дизайн интерфейсов белок-
ДНК

III. «Розеттский камень»
Предсказание структуры
Белок Hox-B1 (эксперимент)
ROSETTA (предсказание)

Уникальное достижение: предсказание структуры “ab initio”

Уникальные компьютерные ресурсы:
70000 (!) компьютеров (Rosetta @ Home)

Неуникальные ограничения:

Размер белков: <150 а.к.о.

Удачи довольно редки
Bradley et al., Science 309, 1868–1871

«Правильные» структуры отличает наличие “energy gap”-а

Найти их может быть чрезвычайно сложно

Стратегия оптимального поиска неизвестна :-(

III. «Розеттский камень»
«Дизайнерские» ферменты
Элиминация Кемпа — реакция отщепления атома водорода от неионизуемого углеродного атома; природные ферменты
неизвестны
Активный сайт «дизайнерского» фермента: предсказание Розетты и кристаллографи- ческая структура
Этапы дизайна:
1. Поиск оптимального положения химических групп а/к остатков
2. Поиск белка-«каркаса»
3. Построение модели
4. Синтез и проверка активности
5. Подтверждение роли остатков (мутагенез)
6. In vitro-эволюция
Röthlisberger et al., Nature 453, 190-195

III. «Розеттский камень»
«Научный краудсорсинг» вместо «Дома-2»
Дэвид Бейкер
Игра FoldIt
В ряде случаев игроки FoldIt находили более правильную 3D-структуру белка, чем это удавалось компьютеру
Cooper et al., Nature 466, 756-760

VI. «Молекулярный микроскоп»
«Энигма» молекулярной динамики
Открытия, сделанные Левенгуком:

Инфузории

Бактерии

Вакуоли в клетке

Сперматозоиды

Мышечные волокна

Структура кофейных зерен :-)

VI. «Молекулярный микроскоп»
В пример другим миллиардерам*
Дэвид Шоу (D.E. Shaw)

Образование: Университет Калифорнии, потом
Стэнфорд (Ph.D.; 1980)

Университет Колумбии: исследования в области высокопроизводительных вычислений

1988: основан хеджевый фонд “D. E. Shaw & Co.”;
«математический» подход к финансовым торгам

1996: FORTUNE: «Фонд D.E. Shaw & Co. на
сегодня — самая таинственная сила на Уолл-
стрит»

2001: Шоу оставляет управление фондом и с головой уходит в компьютерную биохимию и биофизику

2008: Forbes оценивает состояние Шоу в
2.5 млрд. $

Независимый НИИ “D. E. Shaw Research” занимается разработкой алгоритмов и платформ для молекулярной динамики и приложениями в области структурной биологии и драг-дизайна
* — На правах рекламы.
Шутка :-)

VI. «Молекулярный микроскоп»
Anton: увидеть все до атома?

Массивно-параллельный компьютер для молекулярной динамики

512 специализированных процессоров (application-specific integrated circuit)

Шина 400 МГц

Оптимизация для расчетов электростатики, сил Ван-дер-Ваальса, преобразований Фурье
(по 32 конвейера @ 800 МГц)

Коммуникации: сеть «3D-тор», 607 Гбит/с. Латентность: 50 нс

Производительность в МД:
1000-кратно превосходит «обычные» суперкомпьютеры

VI. «Молекулярный микроскоп»
Миллисекунда: много или мало?
Обычно шаг интегрирования в МД равен 1–2 фс; на ПК счет миллисекундной траектории займет сотни лет

Для небольших белков виллина и
FiP35 проведена МД 0.1–1 мс; наблюдались несколько актов сворачивания / разворачивания

Более крупный белок БПТИ: фолдинга в МД достичь не удалось, но конформационные переходы вблизи нативной структуры соответствуют данным ЯМР

Первая опубликованная МД БПТИ: несколько пикосекунд (10
−12
с)
McCammon & Karplus (1977). Nature 267, 585
Shaw et al. (2010). Science 330, 341–346

VI. «Молекулярный микроскоп»
Калиевый канал in silico
МД потенциал-чувствительного K
+
-канала показала последовательные стадии открывания/закрывания канала и движения ПЧД

Инактивация: закрытие поры и «гидрофобный коллапс»

Масштабные движения вольт-сенсора и 15 Å-перемещение ТМ-спирали S4
Jensen et al. (2012). Science 336, 229–233

Выводы

Современная техника молекулярного моделирования позволяет
«заглядывать» в наиболее ранние этапы биологических процессов

Такая имитация представляет не только фундаментальный интерес, но и служит основой для рациональной модификации и дизайна биологических молекул с практически важными свойствами

Наиболее крупные белковые молекулы, в случае отсутствия экспериментально определенной пространственной структуры, пока приходится моделировать на основе «шаблонов»

В компьютерном моделировании главное — не компьютеры и программы, а все равно мозги :-)

Торжество компьютерных методов: предсказание строения белков
Молекулярная динамика биомолекул. История полувековой давности
Драг-дизайн: как в современном мире создаются новые лекарства
454-секвенирование
ДНК
На заре молекулярной графики
Ловля бабочек, или чем структурная геномика поможет биологии

Невидимая граница: где сталкиваются
«нано» и «био»
Недоупорядоченные белки
Антимикробные пептиды — возможная альтернатива традиционным антибиотикам
Зрительный родопсин — рецептор, реагирующий на свет
Рецепторы в активной форме
Миллисекундный барьер взят!

Калиевый канал
in silico
Пространственно- временное моделирование в биологии
Липидный фундамент жизни
Компьютерные игры в молекулярную биофизику биологических мембран
Рецептор
“нетрадиционной ориентации”
Биохакеры: молекулярная биология в стиле «сделай сам»

Спасибо за внимание!


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©nethash.ru 2017
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал