1. Перечень компетенций с указанием этапов (уровней) их формирования



Скачать 350.48 Kb.
Дата18.12.2016
Размер350.48 Kb.
Просмотров152
Скачиваний0
ТипПротокол
Волгоградский государственный университет


УТВЕРЖДЕНО

__ ________201_ г.

Директор института

Приоритетных технологий

______ (подпись) ______ (Запороцкова И.В.)


РЕКОМЕНДОВАНО КАФЕДРОЙ ______________

Протокол №_____

__ ______ 201_ г.

Заведующий кафедрой

Биоинженерии и биоинформатики

________ (подпись) ______ (Новочадов В.В.)



ФОНД ОЦЕНОЧНЫХ СРЕДСТВ
по дисциплине
«Базы данных и основные методы биоинформатики»
Направление подготовки

Код 06.05.01- Биоинженерия и биоинформатика

Составитель ФОС по дисциплине



Широкий Александр Александрович., к.ф-м.н,, доц.

Волгоград 2015 г.



1. Перечень компетенций с указанием этапов (уровней) их формирования.

ОПК-8: Способность находить и использовать информацию накопленную в базах данных по структуре геномов, белков и другой биологической информации, владением основными биоинформатическими средствами анализа геномной, структурной и иной биологической информации.


Знать:

Уровень 1

Основные принципы биоинформационного поиска информации

Уметь:

Уровень 1

Применять на практике методы исследования объектов

Владеть:

Уровень 1

Техническими приемами биоинформационных исследований




2. Описание показателей и критериев оценивания компетенций на различных этапах их формирования, описание шкал оценивания.

Уровень освоения компетенции1

Планируемые результаты обучения (в соотв. с уровнем освоения компетенции)2

Критерии оценивания результатов обучения

13

24

35

46

57

(Шифр компетении)-уровень8

Знать:

Отсутствие знаний, см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

Уметь:

Отсутствие умений, см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

Владеть:

Отсутствие навыков, см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

ОПК-8

уровень 1
















3. Типовые контрольные задания или иные материалы, необходимые для оценки знаний, умений, навыков и (или) опыта деятельности, характеризующих этапы формирования компетенций в процессе освоения образовательной программы.

3.1. Задания для оценивания результатов обучения в виде знаний.

типы контроля:

- индивидуальное собеседование,

- письменные ответы на вопросы.



3.2. Задания для оценивания результатов обучения в виде умений и владений.

- индивидуальные задания в рамках курса (по блокам)



3.2.1. – Основы биоинформатики (ОПК-8 З.1)

Задание 1. Укажите в предыдущем тексте варианты путей нахождения информации, о том, как и когда P. Hogeweg определила биоинформатику. Попробуйте найти эту же информацию в Интернете традиционным способом и укажите проблемы, с которыми вы столкнулись при поиске информации.
Это ожидаемо! В Интернете часто под биоинформатикой понимают телепатию, парапсихологию, какие-то «биоинформационные» поля и тому подобные околонаучные вещи. Эта мистика не имеет ничего общего с дисциплиной, которую вы начинаете изучать. Поэтому не следует искать биологическую информацию с использованием популярных поисковиков общего назначения. Это бесполезная трата времени, указывающая на грубый непрофессионализм того, кто пытается что-либо найти.

То, насколько биоинформатика динамична, насколько ее границы еще не вполне состоялись, демонстрирует экспрессия одного из наиболее авторитетных ученых с этой сфере – Михаила Гельфанда (Институт проблем передачи информации РАН), при объяснении студентам МГУ, что это за наука. Полный текст лекции по введению в биологические базы данных Юрия Порозова, откуда взята эта цитата, доступен по ссылке http://www.myshared.ru/slide/283265/.

«Биоинформатика – это способ заниматься биологией, не наблюдая живые существа, как зоологи, не делая опытов в пробирке, как экспериментальные биологи, а анализируя результаты массовых данных или целых проектов.

Там есть два аспекта. Один – чисто практический. Оказывается, глядя на буковки, или на структуры белков, или на карты белковых взаимодействий, которые получены из таких массовых экспериментов, вы можете делать совершенно конкретные, проверяемые биологические утверждения.

Вторая вещь. Это началось с чистой техники. Размер генома человека – 3 миллиарда нуклеотидов, 3 миллиарда букв. Их надо где-то хранить, ими надо уметь манипулировать. Это чисто техническая сторона. Но очень важная. Кроме того, оказалось, что можно делать утверждения уже не настолько частные, что «этот белок делает это», а строить утверждения о системе взаимодействия белков в клетке. Описания общих свойств на уровне целой клетки.

Третий аспект биоинформатики, с моей точки зрения, самый интересный, потому что самая правильная биоинформатика – это биоинформатика эволюционная. Интереснее всего описывать не то, как клетка устроена сейчас, а то, как она такой получилась. Что происходило, что породило такие механизмы внутри клетки и т. д. Эволюционная биология - наука очень старая, а молекулярная эволюция, то есть использование молекулярных данных для реконструкции эволюционных событий, – вещь более новая. Она стала возможной, когда такие данные стали приходить в эволюционную биологию. Происходят, по-видимому, некие культурные войны между классическими эволюционными биологами и молекулярными эволюционистами. Причем они происходят в одну сторону…»

М. Гельфанд

Биоинформатика и ее связь с другими дисциплинами.

Биоинформатика ≈ вычислительная молекулярная биология наиболее тесно связана с информатикой (в том числе – с теорией алгоритмов), теорией вероятностей, математической статистикой и молекулярной биологией. В практической деятельности акценты модно расставить по-разному.


БИОинформатика:

Цели, задачи и результаты

биологические

БиоИНФОРМАТИКА
Создание и использование баз

данных, алгоритмов и программ,

математических методов анализа

биологической информации

Вычислительная МОЛЕКУЛЯРНАЯ

биология:

объекты изучения – биологические молекулы (белки, ДНК, РНК …) и их поведение в живых системах

ВЫЧИСЛИТЕЛЬНАЯ

молекулярная биология:

объекты изучения – результаты массовых экспериментов (последовательности, экспрессии генов, пространственные структуры сложных молекул …)


Задание 2. Предшествующая информация взята из вводной лекции в. н. с., доц. А. В. Алексеевского студентам факультета биоинженерии и биоинформатики МГУ имени М. В. Ломоносова. Зайдите на учебный сайт этого факультета http://kodomo.fbb.msu.ru и отыщите эту лекцию. Установите на своем PC активную ссылку на эту лекцию. Попытайтесь найти продолжения в многоточиях (…) лектора.
Молекулы, с которыми работает биоинформатика, имеют информационную составляющую. Таким образом, их можно представить и как молекулы, состоящие из атомов, и как последовательности…

Например, любой фрагмент ДНК, помимо классической структурной формулы (из атомов водорода, углерода, азота, кислорода и фосфора), может быть описан как последовательность нуклеотидов:


-GATCAACACTACTTGACTTCAAGACTTACCATAAAGAAAACTATAGTGTG-

-GTATTGGCAAAAGACAAGACAAATAGATCAACATAACAAAATAAAGGGCC-

-ATGAAATAGACCCATATAGTCAATTGATTTTTGACAAAGAAGGATTGGCAA-

-TAGAATGGGGTAAAGATAGTCTTCTCAACAAACGGTACCAGAATGACTGAA-
Задание 3. Попробуйте вручную найти первые 20 аминокислот соответствующей белковой последовательности. Найдите в интернете программу автоматического перевода кодонов в аминокислотные последовательности. Сравните трудоемкость ручного и машинного перевода для этих «биологических языков». Подумайте, что будет, если удалить из последовательности количество символов, не кратных трем с начала цепи, ее конца, из середины. Что вам известно о защитных механизмах в ядре клетки против таких «правок текста».
Первоначально аминокислотные последовательности белков определяли, отщепляя по одному аминокислотному остатку и определяя, каков он. Но в конце 70-х годов XX века был изобретен существенно более быстрый и дешевый метод экспериментального определения последовательности ДНК – секвенирование. Это привело к лавинообразному накоплению данных о последовательностях и расшифровке полных наборов генетическиой информации – геномов. В настоящее время общедоступные базы данных известных последовательностей содержат около 6 х 106 записей. Прямой поиск потребует слишком больших затрат машинного времени, а сервер просто не сможет обрабатывать массовые запросы. Решение заключается в создании специальных индексных таблиц для ускорения поиска. Это классический пример использования методов биоинформатики. Любая база данных содержит:

  • Записи (они же документы, entries) – каждая запись соответствует одному объекту, информация о котором хранится в базе.

  • Поля (fields) – каждое поле соответствует некоторому типу информации. Разделение на поля – продукт творчества создателей базы. Например, для базы адресов предприятий полями будут являться название, юридический адрес, фактический адрес, телефон, e-mail, URL.

Банк данных – по своему содержанию, является базой данных, но обычно это предполагает (а) общедоступность и (б) некую степень универсальности ресурса.

В качестве первого знакомства с профессиональной базой данных мы выбрали не самую молекулярную, но абсолютно незаменимую для современного специалиста в области биологии и медицины. Это знаменитый NCBI PubMed Central.
Задание 4. Зарегистрируйтесь к следующему занятию на PubMed и ознакомьтесь с ресурсами, которые он в себя включает. Обратите внимание на ресурсы в области молекулярной биологии и наличие полнотекстового доступа PubMed Central. Скриншоты стартового окна и странички регистрации приведены ниже. Как и большинство подобных ресурсов, он строится на сочетании формальной логики и интуитивного дизайна, так что особых комментариев не требует.


3.2.2. – PuBMed и PubMed Central ((ОПК-8 З.1))

Задание 1. Воспроизведите описанный выше поиск на ресурсе PubMed Central и сверьте полученные вами данные, а также первую сверху ссылку с приведенным ниже скриншотом. Объясните полученные вами расхождения. Попробуйте сузить поиск, добавив фильтр по году выпуска, ограничив доступ только к публикациям не старше 2010 года. Оцените, какая доля публикаций по теме относится к последнему пятилетию.


Чтобы найти публикации человека, который подписывает статьи как Carol G. Chen (один из соавторов статьи, открытой ранее), следует написать в строке запроса: Carol G Chen [Author].
описание: c:\users\администратор\desktop\автор статьи.png
Чтобы самому не писать слово "Author", можно воспользоваться сервисом "Limits", на котором можно установить дополнительные ограничения (например, в меню «Dates» можно установить лимит по времени, за который были опубликованы статьи).


Задание 2. Найдите в PubMed Central статьи крупных отечественных молекулярных биологов из МГУ имени М. В. Ломоносова: заведующего кафедрой биоинженерии академика РАН М. П. Кирпичникова (Kirpichnikov M. P.), заведующего кафедрой иммунологии, члена-корреспондента РАН С. А. Недоспасова (Nedospasov S. A.), декана факультета биоинженерии и биоинформатики, академика В. П. Скулачева (Skulachev V. P.). Сохраните ссылки на наиболее интересные из них.
Для просмотра статьи достаточно начать на один из активных доступов: в е-pub формате или .pdf-формате.

Мы также можем просмотреть наши предыдущие запросы на PMC, воспользовавшись окошком Recent activity.



С помощью поиска по ключевым словам, можно отметить и отправить (через меню «Send to») интересующие нас статьи в личную коллекцию. Чтобы просмотреть ее, по окончании работы нужно зайти в список коллекций («My NCBI» -> «Collections»).
описание: c:\users\администратор\desktop\ол.png
Задание 3. Создайте свои «золотые коллекции» статей 2012-2014 годов по ключевым цитокинам (сигнальным молекулам межклеточных взаимодействий) – ФНО-α (tumor necrosis factor alpha) и ИЛ-1 (interleukin 1). Оцените общий объем публикаций. Пооткрывайте и выберите на основании авторских коллективов, университетов и институтов, а также тематики, обзоры или статьи из самых известных мировых журналов. Проверьте эффективность работы, закрыв PubMed и вновь обратившись к нему и своей коллекции. Работает?

3.2.3. – Банки данных биологической информации ((ОПК-8 У.1))



Задание 1. Зайдите на сайт SIB, приведенный выше (начало внушительного списка доступных баз данных приведено на скриншоте). Попытайтесь выйти на 2-3 сайта высокоспециализированных баз данных (например, семейств белков, межмолекулярных взаимодействий, токсикологических и т. п.). Не забудьте обратиться к помощи в виде Help или User Manual. Найдите сведения об объеме ресурса и кратко охарактеризуйте его целевое назначение. Если вы можете выделить особенности дизайна, отличающие такие базы данных от неспециализированного медико-биологического ресурса PubMed, укажите их.


Сравнение последовательностей – одна из важнейших элементарных операций вычислительной биологии и биоинформатики, являющаяся основание для многих других, более сложных манипуляций. На первый взгляд, задача не представляет особой сложности и заключается в определении схожих и отличающихся частей последовательностей. Тем не менее, за кажущейся простотой скрывается целый класс разнообразных задач, для эффективного решения которых зачастую требуются применять специальные алгоритмы.

Для работы с данными о составе биологических последовательностей предназначены многие базы данных и прикладные программы. Наиболее распространены следующие форматы описания последовательностей.

FASTA – формат для представления данных последовательности в виде текста. Иногда используются расширения .fna (Fasta Nucleic Acid) или .faa (Fasta Amino Acid) – для нуклеотидных и аминокислотных последовательностей соответственно.

EMBL – формат, используемый для представления нуклеотидных и пептидных последовательностей в базах данных EMBL (European Molecular Biology Laboratory).

GenBank – формат, используемый NCBI (National Center for Biotechnology Information) для представления нуклеотидных и пептидных последовательностей в базах данных GenBank и RefSeq.

PDB – формат для представления структур биологических молекул в базе данных Protein Data Bank.

SwissProt – формат для представления белковых последовательностей, используемый базой данных SwissProt.

Stockholm – формат, используемый базами Pfam и Rfam для представления множественного выравнивания последовательностей.
Задание 2. Зайдите на сайт SIB, а с него переходите поочередно на ресурсы UniProt, NCBI protein resourse и Pfam. Все они входят в top-20, и расположены на первой же странице поисковика. Проанализируйте на примере поиска интерлейкина-1, какие форматы записи последовательностей используют эти базы данных, насколько они совместимы и как организован экспорт для сравнения этих последовательностей специализированными программами.

3.2.4. – GenBank-NCBI ((ОПК-8 У.1))



Задание 1. Варьируя опциями запроса, постарайтесь получить информацию по ИЛ-2А, максимально близкую той, что приведена на скриншоте. Попробуйте изменить вид организма или вывести информацию о нескольких видах, нескольких интерлейкинах.

Используя дополнительное меню, вы можете ограничить поиск в соответствии с тем, что вы ищете конкретно: организм, публикация и т.п. Вы можете использовать фильтры, расположенные справа. Наиболее популярные фильтры доступны сразу, остальные открываются с помощью Manage Filters:



Выберем, например фильтр mRNA (1), получим на единственный источник с данными о mRNA искомого интерлейкина. Выбрав этот результат (привыкаем использовать Search), можно посмотреть общую информацию о нуклеотидной последовательности, получить доступ к расширению FASTA и графике:





Изменить формат отображающейся информации можно, нажав в левом углу Display Settings, после чего выбрать то, что вам необходимо и применить эти параметры. В этом случае информация будет выдаваться в заданном вами объеме и очередности.

Для того, чтобы сохранить файл с результатами поиска, в правом углу нужно кликнуть SendCoding Sequences и выбрать нужный формат записи. После этого нажмите Create format и сохраняйте.


Для изменения вида кликните Customize view в правой стороне экрана, и выберите нужные параметры. Для отображения части последовательности применяется опция Change region show.




Если у вас несколько последовательностей, выберите Highlight Bar, это поможет быстро перемещаться между анализами без потери данных.

Общая информация о гене выдаются сразу же, после активирования ссылки на него, и включает в себя имя гена и его тип, официальный символ, синонимы, первоисточник и связанные ссылки, кодирующий белок, а также тип организма с полной систематикой. Ссылка Genomic context позволяет показать точное место гена, то есть сайт в конкретной хромосоме данного организма. Так же можно визуализировать геномные области:



Используя другие опции, большинство из которых построено в интуитивном дизайне, можно познакомиться с типичными фенотипами, ассоциированными с экспрессией гена, актуализировать информацию о кодируемых белках, связанных последовательностях, известных вариациях структуры гена и описанных молекулярных взаимодействиях. Доступно еще несколько дополнительных ссылок, полезных при специальных исследованиях. Актуальная библиография доступна из одноименной опции.


Достаточно типовой является задача, когда нам нужно отыскать и сравнить ген двух и более различных организмов. В этом случае мы выбираем эти организмы и с помощью программы BLAST сравниваем последовательности. Вначале находим нужные гены и открываем их последовательности в формате FASTA. Эти последовательности копируем целиком, чтобы вставить в соответствующие окна программы BLAST. На самом деле программа готова работать с любым текстовым файлом, так что найденные последовательности можно набирать как текст, используя, например блокнот MS Windows, и хранить в текстовых файлах.


Далее вставляем нужные нам последовательности BLAST, жмем одноименную клавишу, программа начинает сравнение:


Задание 2. Используя NCBI BLAST выясните, каким организмам они принадлежат и какие белки они кодируют. Ознакомьтесь с описанием гена в GenBank и сохраните его для отчёта (текстовые файлы можно получить у преподавателя или отсканировать и распознать изображение самостоятельно).

    1. CTTTCTCTCTTCTCTGGGCCTCCCCCAGCTCATCATGGCTCTCTGGATCCGATCACTGCCTCTTCTGGCTCTCCTTGTCTTTTCTGGCCCTGGAACCAGCTATGCAGCTGCCAACCAGCACCTCTGTGGCTCCCACTTGGTGGAGGCTCTCTACCTGGTGTGTGGAGAGCGTGGCTTCTTCTACTCCCCCAAAGCCCGACGGGATGTCGAGCAGCCCCTAGTGAGCAGTCCCTTGCGTGGCGAGGCAGGAGTGCTGCCTTTCCAGCAGGAGGAATACGAGAAAGTCAAGCGAGGGATTGTTGAGCAATGCTGCCATAACACGTGTTCCCTCTACCAACTGGAGAACTACTGCAACTAGCCAAGAAGCCGGAAGCGGGCACAGACATACACTTACTCTATCGCACCTTCAAAGCATTTGAATAAACCTTGTTGGTCTACTGGAAGACTTGTGCC

    2. GCCCTGCTCGTCCTCTGGGAGCCCAAGCCTGCTCAGCCTTTTGTCAAACAGCACCTTTGTGGTCCTCACCTGGTGGAGGCTCTGTACCTGGTGTGTCGGGAACGTGGTTTCTTCTACACACCCAACTCCCGTCCTGAACTGACGACCCGCAAGTGCCAACTGGAGCTGGCTGCTCCAGGCCCGGACGCCGGGGATCTTCAGACCTGGGCACTGGAGGTTGCCCGGCAGAAGCGTCGAATTGTGGATCAGTGCTGCACCAGCATCTGCACCCTCTACCAACTGGAGAACTACTGCAACTGAGTTCAATCAATTCCCGATCCACCCCTCTGCAATGAATAAAGCCTTTGATGAGC

    3. GCTCATTAACGTTTCGCTTGGCTAAGTGCGCACCTCGTCACTGAAACCAGTTAGCAAAAGAAATTTTTGTTCAAGCTTAAACCGATACCTACGTCACTATTCGATCATTTTGAATGCAAATTATTCCCAGATTAATAAACTAGGTCGCCATCCGTGGCGCTGCCGCCGGGCTGCGGACCCGTACTTTCGACGGAAAATATCGGGACCATTTTCATAAACGATCTATGATACAGTTTTAAAACACTTTAACGCTTTCCATCGTGCACACTTAAAACAAAACTCATAAAGTGAAAGTTCATATCCTGGCAAGTAAAAAGTGATAAATGTTAAAACGTCTGAAGTGATAGTCTGGAGTTTGATTACCAGGTGAAGAAGATAATATATATGGGATGTACAAAGTTGGCAACGAAGCCCCCCTTCTAACAACAATGAAAAAGGGAGTAATCCTACTTTCTCACTTTCAATAATAAACATACGCACGTCAGCCACCGTCGAAGTCTCCAACGCCGCATTAAAAATAATTAATTATGATGCTAACAACTGAACACATAATGCATGGGCATCCCCACTCGTCAGTCGGGCAGAGTACTCTATTTGGGTGCTCCACGGCGGGCCATAGCGGAATAAATCAGCTGGGCGGCGTATATGTTAATGGCCGGCCACTGCCCGATTCAACGCGTCAAAAAATTGTCGAATTGGCTCATTCCGGCGCACGTCCTTGTGATATTTCAAGAATACTACAAGTGTCCAACGGTTGCGTAAGCAAAATTTTGGGCAGATATTATGAAACTGGATCGATAAAACCTCGAGCTATAGGTGGTTCAAAGCCACGAGTAGCTACAACCCCGGTTGTGCAAAAAATTGCAGATTACAAACGGGAATGTCCCAGCATATTTGCGTGGGAAATACGAGATCGACTGCTATCGGAACAAGTTTGCAATAGTGATAACATTCCAAGTGTTTCATCTATTAATCGAGTCTTACGTAACCTGGCCTCACAAAAGGAGCAGCAAGCTCAGCAACAAAACGAATCCGTTTATGAAAAGCTTCGCATGTTTAATGGCCAAACGGGCGGATGGGCATGGTATCCAAGCAATACAACGACGGCACATTTGACGCTACCACCAGCAGCTTCCGTTGTGACATCTCCTGCAAATTTATCAGGACAGGCCGATCGGGATGATGTTCAAAAAAGAGAATTACAATTTTCAGTAGAAGTTTCGCATACAAACTCTCACGATAGTACATCGGATGGAAACTCTGAACATAATTCATCCGGGGACGAAGACTCTCAAATGCGGTTGCGCCTAAAAAGGAAGTTACAGCGCAATCGGACATCATTTTCTAATGAGCAAATTGACAGTCTTGAAAAAGAATTTGAAAGAACACATTATCCCGATGTTTTTGCGCGAGAAAGGCTTGCTGATAAAATTGGTTTGCCAGAGGCACGTATTCAGGTTTGGTTTTCAAACCGACGAGCTAAATGGCGCCGAGAAGAAAAAATGCGAACTCAGAGACGATCGGCCGATACCGTGGACGGCAGTGGTCGAACCAGCACGGCAAATAATCCTTCAGGAACAACTGCATCTTCCTCCGTCGCAACGTCAAACAACTCGACTCCAGGGATTGTGAACTCAGCAATCAACGTTGCGGAACGAACATCATCTGCATTAGTTAGTAATAGCCTTCCCGAGGCTTCAAATGGACCAACTGTTTTGGGTGGTGAAGCTAATACTACACACACCAGCTCTGAAAGCCCACCCCTTCAGCCAGCGGCACCGCGGCTACCCTTAAATTCTGGATTCAACACCATGTACTCATCTATTCCACAACCGATTGCAACGATGGCTGAAAATTACAACTCCTCATTAGGATCAATGACCCCGTCATGCTTACAACAACGCGATGCCTATCCTTACATGTTTCACGATCCGTTATCACTAGGATCTCCCTATGTGTCAGCCCACCATCGAAACACAGCTTGCAACCCCTCAGCTGCGCACCAACAGCCCCCTCAGCATGGCGTTTATACCAATAGTTCTCCAATGCCATCATCAAACACAGGTGTCATTTCTGCGGGCGTTTCGGTGCCTGTCCAGATTTCAACGCAAAATGTATCTGACCTAACGGGAAGCAATTACTGGCCACGTCTTCAGTGATCGTCAATCTTTGGCTCACCATTAGATCATTTGTCAAAGGCGACTGCCGCTGCAATCATTGCCGCACAAGCAGCTGAGAAAAGCCATAAACACCGAAAAGAGCATTCAATTGTTAGTATACACACCAC

    4. GACACACACACACACACACACACACACACACACACACACACAGAGAGAGAGAGAATCCCTCCCAGCATTGGTCATCCGCCCCCCCACCCAGGCTTCCACTCCCCCTCCCCTCTTATCTCCCCTGGCTTCCCCTCCTCTCGGGCGCTGCGAAAAGCAGCCGCACTTAGTCAACAAATGGCACGTGGGAGAAGTTGGAATCTGAGAATTGCTCTCACACACCAACCCAGCAACATCCGTGGAGAAAACTCTCACCAGCAACTCCTTTAAAACACCGTCATTTCAAACCATTGTGGTCTTCAAGCAACAACAGCAGCACAAAAAACCCCAACCAAACAAAACTCTTGACAGAAGCTGTGACAACCAGAAAGGATGCCTCATAAAGGGGGAAGACTTTAACTAGGGGCGCGCAGATGTGTGAGGCCTTTTATTGTGAGAGTGGACAGACATCCGAGATTTCAGAGCCCCATATTCGAGCCCCGTGGAATCCCGCGGCCCCCAGCCAGAGCCAGCATGCAGAACAGTCACAGCGGAGTGAATCAGCTCGGTGGTGTCTTTGTCAACGGGCGGCCACTGCCGGACTCCACCCGGCAGAAGATTGTAGAGCTAGCTCACAGCGGGGCCCGGCCGTGCGACATTTCCCGAATTCTGCAGACCCATGCAGATGCAAAAGTCCAAGTGCTGGACAATCAAAACGTGTCCAACGGATGTGTGAGTAAAATTCTGGGCAGGTATTACGAGACTGGCTCCATCAGACCCAGGGCAATCGGTGGTAGTAAACCGAGAGTAGCGACTCCAGAAGTTGTAAGCAAAATAGCCCAGTATAAGCGGGAGTGCCCGTCCATCTTTGCTTGGGAAATCCGAGACAGATTACTGTCCGAGGGGGTCTGTACCAACGATAACATACCAAGCGTGTCATCAATAAACAGAGTTCTTCGCAACCTGGCTAGCGAAAAGCAACAGATGGGCGCAGACGGCATGTATGATAAACTAAGGATGTTGAACGGGCAGACCGGAAGCTGGGGCACCCGCCCTGGTTGGTATCCGGGGACTTCGGTGCCAGGGCAACCTACGCAAGATGGCTGCCAGCAACAGGAAGGAGGGGGAGAGAATACCAACTCCATCAGTTCCAACGGAGAAGATTCAGATGAGGCTCAAATGCGACTTCAGCTGAAGCGGAAGCTGCAAAGAAATAGAACATCCTTTACCCAAGAGCAAATTGAGGCCCTGGAGAAAGAGTTTGAGAGAACCCATTATCCAGATGTGTTTGCCCGAGAAAGACTAGCAGCCAAAATAGATCTACCTGAAGCAAGAATACAGGTATGGTTTTCTAATCGAAGGGCCAAATGGAGAAGAGAAGAAAAACTGAGGAATCAGAGAAGACAGGCCAGCAACACACCTAGTCATATTCCTATCAGCAGTAGTTTCAGCACCAGTGTCTACCAACCAATTCCACAACCCACCACACCGGTTTCCTCCTTCACATCTGGCTCCATGTTGGGCCGAACAGACACAGCCCTCACAAACACCTACAGCGCTCTGCCGCCTATGCCCAGCTTCACCATGGCAAATAACCTGCCTATGCAACCCCCAGTCCCCAGCCAGACCTCCTCATACTCCTGCATGCTGCCCACCAGCCCTTCGGTGAATGGGCGGAGTTATGATACCTACACCCCCCCACATATGCAGACACACATGAACAGTCAGCCAATGGGCACCTCGGGCACCACTTCAACAGGACTCATTTCCCCTGGTGTGTCAGTTCCAGTTCAAGTTCCCGGAAGTGAACCTGATATGTCTCAATACTGGCCAAGATTACAGTAAAAAAAAAAAAAAAAAAAAAAGGAAAGGAAATATTGTGTTAATTCAGTCAGTGACTATGGGGACACAACAGTTGAGCTTTCAGGAAAGAAAGAAAAATGGCTGTTAGAGCCGCTTCAGTTCTACAATTGTGTCCTGTATTGTACCACTGGGGAAGGAATGGACTTGAAACAAGGACCTTTGTATACAGAAGGCACGATATCAGTTGGAACAAATCTTCATTTTGGTATCCAAACTTTTATTCATTTTGGTGTATTATTTGTAAATGGGCATTTGTATGTTATAATGAAAAAAAGAACAATGTAGACTGGATGGATGTTTGATCTGTGTTGGTCATGAAGTTGTTTTTTTTTTTTTAAAAAGAAAACCATGATCAACAAGCTTTGCCACGAATTTAAGAGTTTTATCAAGATATATCGAATACTTCTACCCATCTGTTCATAGTTTATGGACTGATGTTCCAAGTTTGTATCATTCCTTTGCATATAATTAAACCTGGAACAACATGCACTAGATTTATGTCAGAAATATCTGTTGGTTTTCCAAAGGTTGTTAACAGATGAAGTTTATGTGCAAAAAAGGGTAAGATATAAATTCAAGGAAGAAAAAAAGTTGATAGCTAAAAGGTAGAGTGTGTCTTCGATATAATCCAATTTGTTTTATGTCAAAATGTAAGTATTTGTCTTCCCTAGAAATCCTCAGAATGATTTCTATAATAAAGTTAATTTCATTT


Задание 3. Используя NCBI BLAST, сравните попарно две гомологичные последовательности (ab, cd) между собой. Просмотрите результат и опишите разницу (отсутствующие фрагменты цепочек, точечные мутации и т. п.) в отчете.
3.2.5. – Базы данных белков и белковые последовательности ((ОПК-8 В.1))

Задание 1. Выполняя задания 2 и 3 предыдущей темы, вы установили, какой белок кодируется нуклеотидными последовательностями a, b, c, d. Найдите в SwissProt описания соответствующих белков, затем сравните их аминокислотные последовательности и опишите различия так же, как в этих заданиях.

Задание 2. Используя сведения, содержащиеся в банке данных UniProtKB, составьте подробное описание следующих биологических молекул: matrix metalloproteinase-1, matrix metalloproteinase-10, matrix metalloproteinase-12, matrix metalloproteinase-13, matrix metalloproteinase-3, matrix metalloproteinase-9, interleukin-1 receptor type 1, interleukin-6, interleukin-8, interleukin-17 alpha, interleukin-4 receptor. В качестве первого организма выберите человека, в качестве второго – выберите лабораторное животное, для которого имеются аннотации все перечисленных белков.
Задание 3. Выясните, какой белок, и какого организма кодирует следующая последовательность:

    1. MALWTRLVPLLALLALWAPAPAHAFVNQHLCGSHLVEALYLVCGERGFFYTPKARREVEGPQVGALELAGGPGAGGLEGPPQKRGIVEQCCAGVCSLYQLENYCN

    2. NRGETGPAGPRGPAGPAGSSGKDGVGGLPGPIGPPSPRGRTGDIGPAGPPGTPGPPGPPGPPGGGFDFSFVAQPSQEKAPDPFRHYRADDANVARDRDLEVDTTLKSLSQQIENIRSPEGTKKDPARSCRDLKMCHPEWKSGEYFVDPNQGCTLDAVKVYCNMETGETCVYPTQANIPQKNWYTSKNAKDKKHVWFGETMSDGFQFEYGGEGSDAADVNIQLTFLRLMATEASQNITYHCKNSIAYMDQQAGNLKKALLLQGSNEIEIRAEGNSRFTYSVTEDGYTRHTGAWGKTVIDYKTTKTSRLPIIDIAPMDVGAPDQEFGIDVGP

    3. MSTESMIRDVELAEEALAKKAGGPQGSRRCLCLSLFSFLLVAGATTLFCLLHFEVIGPQKEEFPAGPLSINPLAQGLRSSSQTSDKPVAHVVANVKAEGQLQWQSGYANALLANGVKLKDNQLVVPTDGLYLIYSQVLFRGQGCPSTNVFLTHTISRIAVSYQTKVNLLSAIKSPCQRETPEGAEAKPWYEPIYLGGVFQLEKDDRLSAEINLPDYLDFAESGQVYFGIIAL

3.2.6. – Банк трехмерной структуры белка PDB и программа RASMOL ((ОПК-8 В.1))
Задание 1. Используя сведения, содержащиеся в банке PDB, попробуйте найти 3D структуры следующих белков: коллагена II типа человека, фибриногена человека, рецептора интерлейкина-1 крысы, аланил-аминотрансферазы крысы, аспартат-аминотрансферазы крысы, нитроксидсинтазы 3 человека. В случае наличия субъединиц или димерных молекул попробуйте воспроизвести эти структур по-отдельности, и скопировать их в протокол.
Создание 3D моделей. RasMol.

Далее хотелось бы показать, как создаются 3D модели и познакомиться с программами, которые используются для этого. Конец XX и первое десятилетие XXI века принесли лавинообразное увеличение количества исследованных биополимеров. Тому способствовали изменения, в основном биохимических, методов исследования, в результате чего выявлены миллионы последовательностей. Между ними и знаниями о функциях этих белков возник определенный разрыв. Иными словами, мы знаем, каков набор и порядок аминокислот в цепи этого белка, и что этот белок умеет, но не до конца не понимаем, как ЭТА структура обеспечивает ЭТУ функцию. На этом пути практически неизбежен этап воспроизведения трехмерной структуры полимера.

Основные этапы расшифровки 3D структуры биополимеров блестяще изложен в лекции С. А. Спирина и А. Б. Рахманиновой (МГУ, 2010). Общая схема из нее и краткое изложение правил работы с программой RasMol приведены ниже.

Задание 2. Зайдите на учебный сайт факультета биоинженерии и биоинформатики МГУ имени М. В. Ломоносова http://kodomo.fbb.msu.ru, где в разделе биоинформатика отыщите лекцию С. А. Спирина и А. Б. Рахманиновой. Повторите вслед за ними поиск трехмерной структуры молекулы, приведенной в лекции в качестве примера.
Итак, 1 этап – экспериментальный. Он предусматривает непосредственный анализ белковых и нуклеиновых молекул. Пока преобладает рентгеноструктурный анализ, сейчас его хорошо дополняют ЯМР и атомно-силовой микроскоп.

Второй этап – вычисление и моделирование. В идеале должны получиться инвариантные последовательности мономеров, из которых сложен полимер и его «крупные блоки», составляющие основу пространственной структуры.

Третий этап - применение программ визуализации для построения окончательной 3D-модели. Второй и третий этапы относятся к исключительной компетенции биоинформатики.

Основные программы для работы с 3D-структурами:

- RasMol – визуализация, подготовка изображений и простейший анализ;

- PyMol – визуализация, качественная подготовка изображений, включает больше возможностей для анализа;

- SwissPDBBriewer или DeepView – могут производить анализ и сравнение структур, визуализация уступает двум предыдущим.

Из приведенных программ RasMol может быть отнесена к средствам выбора, поскольку в ней оптимально сочетаются достаточно хорошая визуализация с широким спектром средств анализа, несложен для освоения, обладает хорошей внутренней логикой. Последняя версия программы 2.7.5 доступна на сайте http://www.openRasMol.org



Визуализация молекулы белка.

Можно выбрать одну из трех конфигураций (точнее четырёх, с учетом наложения).




В проволочной модели ковалентные связи между атомами изображаются линиями, соединяющими их центры. При использовании шариковой модели атомы изображаются шариками, по умолчанию радиусы пропорциональны радиусам Ван-дер-Ваальса. Остовная модель предусматривает изображение только условных линий, соединяющих центры С1-атомов аминокислот.

Работа в системе RasMol идет параллельно в двух окнах – графическом и командном. В каждый момент имеется некоторое выделенное множество атомов. Все действия программа производит исключительно с этим множеством. Каждому действию соответствует команда, набираемая в командном окне.

Наиболее употребительные команды:

- backborne <число> – остовная модель;

- wireframe <число> – проволочная модель;

- spacefill <число> – шариковая модель;

- ribbons <число> – ленточная модель;

- color <цвет> – словами (например, red) или в RGB-формате [255, 0, 0];

- background <цвет> – цвет фона.

Для визуализации необходимо научиться выделять необходимые атомы. Для этого используется определенный синтаксис. Например:

ser – будут выделены все атомы всех серинов в молекуле;

ser : A – все атомы всех серинов цепи А;

ser 70 : A.CA – только Cα атом серина, 70-й в цепи А;

ser 70 : A.C? – все атомы углерода в серине 70;

*.CA – все Cα атомы в цепи А.

Существуют сочетания, которые однозначно воспринимаются программой наиболее употребительные выделения: C, H, N, O, S, P, water, iron, protein, dna, rna, all и ряд других.

После того, как множество атомов выделено, используются команды обращения к этому множеству.

select <множество> – выделить, оставив в графическом окне все без изменений;

restrict <множество> – выделить и стереть остальные атомы из графического окна;

define <множество> – создать имя выделенному множеству, с которым можно работать впоследствии, вызывая по этому имени.

Для работы с множествами выбранных атомов используются логические операторы AND, OR, NOT, а также WITHIN. При этом запятая (,) синонимична оператору OR. То есть: select protein or dna = select protein, dna.

Для создания и стирания подписей используются команды label и label off. По умолчанию, далее информация задается в режиме %n%r.%c.%a, где поочередно зад имя остатка (n), номер остатка (r), идентификатор цепи (c) и имя атома (а). Аналогичным образом используется оператор backbone для работы с копиями записей. Также полезными могут оказаться следующие команды работы в RasMol с файлами:

- zap – начать все заново;

- load – загрузить файл с координатами атомов;

- save – сохранить список выделенных атомов в .pdb;

- whrite – сохранить картинку в формате .gif;

- whrite script – создать скрипт-файл (не очень удобен);

- script – вводить команды из текстового режима.

Впрочем, лучшие подсказки содержатся непосредственно в самой программе RasMol. Активнее используйте Users Manual!
Задание 3. Загрузите в RasMol информацию об аминокислотной последовательности интерлейкина-1 альфа человека. Попробуйте построить модели с различной графической интерпретацией молекулы. Сохраните их. Затем откройте PDB и посмотрите для сравнения, модели, представленные в этом банке данных. Прокомментируйте результаты.
Задание 4. С помощью ББД GenBank http://www.ncbi.nlm.nih.gov/ GenBank/index.html) и Protein Data Bank (http://www.rcsb.org/pdb/), осуществите поиск нуклеотидной последовательности изоцитрат-дегидрогеназы (isocitrate dehydrogenase). Найдите и сохраните научные статьи, относящиеся к этому ферменту. Получите файл, описывающий 3D структуру белка. Просмотрите третичную структуру белка с использованием 3D-браузера, сохраните изображение у себя в протоколе в виде проволочной модели.

3.2.7. – Инструменты для анализа биологической информации ((ОПК-8 У.1, В.1))



Задание 1. Выберите себе белок из следующего списка (в скобкахимя соответствующего гена): collagen alpha-1 (I) chain (COL1A1), collagen alpha-2 (I) chain (COL1A2), collagen alpha-1 (II) chain (COL2A1), collagen alpha-1 (III) chain (COL3A1), collagen alpha-1 (V) chain (COL5A1), collagen alpha-3 (VI) chain (COL6A3), collagen alpha-1 (IX) chain (COL9A1), collagen alpha-1 (XI) chain (COL11A1), collagen alpha-1 (VII) chain (COL7A1). Выполните поиск выбранного белка по базе данных UniProt, выберите два родственных организма, где встречается выбранный Вами белок (например, мышь и крыса) и откройте описание белков. Просмотрите информацию, представленную в БД. Сохраните её – она понадобится для составления отчета. Найдите сведения о последовательности аминокислот и экспортируйте их в формат FASTA. Используя NCBI BLAST сравните последовательности аминокислот Вашего белка для выбранных Вами организмов (подсказка: для парного выравнивания двух последовательностей следует использовать blastp). Просмотрите отчёт BLAST. Создайте файл отчета в удобном для Вас формате. В отчёте должны быть следующие сведения: наименование белка, имя кодирующего гена, краткие сведения о белке и (самое важное !) описание результатов работы BLAST – что Вы увидели.
Задание 2. В базе данных нуклеотидных последовательностей содержится два варианта транскрипции mРНК гена трансформирующего фактора роста бета 2 (TGFB2). Найдите их и сравните между собой с помощью NCBI BLAST. Опишите различия цепочек нуклеотидов. Посчитайте в автоматическом режиме, сколько раз в аминокислотной каждой из этих двух последовательности TGFB2, выделенного из организма человека, встречается фенилаланин, лейцин, глицин, аланин, изолейцин.
Задание 3. Используя известные Вам базы данных, найдите белок, максимально гомологичный белку лубрицину (lubricin), выделенному из синовиальной жидкости человека. Объясните, почему Вы считаете его таковым.
Задание 4. Перед Вами работа по полной аннотации белка, выполненная одним из студентов. Преподаватель удалил часть информации из отчетного файла. С использованием изученных ресурсов восстановите отчет.

Белок BCCP_ECOLI (полное его название - <удалено> или <удалено> в ацетилКоАкарбоксилазе) синтезируется в организме <удалено>, виде из порядка <удалено>, класса гамма-протеобактерий, типа протеобактерий, царства бактерий. Он кодируется геном <удалено>.

Белок состоит из одной аминокислотной цепи, содержащей <удалено> аминокислот. Вот его последовательность в <удалено> (т.е. в формате записи, где встречаются только однобуквенные обозначения аминокислот в соответствующем порядке): <удалено>

Зная последовательность белка, а также массу каждого из аминокислотных остатков, можно посчитать молекулярную массу всего белка: она равна <удалено> кД.

Вторичная структура белка состоит из <удалено>, альфа-спирали не встречаются.

Белок связывается с лигандом <удалено>. Его третичная структура, построенная при помощи программы RasMol, представлена на рисунке (в цепи белка желтыми стрелками отмечены <удалено>, синим цветом отмечены <удалено>, а лиганд <удалено> отмечен зеленым цветом): <удалено>.
Белок содержит один <удалено>-связывающий домен, располагающийся на участке с <удалено> по <удалено> аминокислоту в последовательности белка. Связывание белка с <удалено> происходит по <удалено> аминокислоте, так что мутация в этом сайте может привести к нарушению функции белка.
В бактерии белок является компонентом ацетилКоэнзима А в комплексе карбоксилазы; сначала биотинкарбоксилаза катализирует карбоксилизацию белка-носителя, затем транскарбоксилаза переносит карбоксильную группу, чтобы сформировать малонилКоА. Таким образом, BCCP_ECOLI катализирует синтез малонилаКоА, первого посредника в синтезе жирных кислот.

Подробные данные об этом белке можно найти в различных базах данных: запись в базе UniProt <удалена активная ссылка>, она же в тесктовом виде <удалена активная ссылка> (в ней он числится под идентификационным номером BCCP_ECOLI, под несколькими кодами доступа (наиболее распространенный – P0ABD8)), запись в PDB <удалена активная ссылка> (запись 1bdo).

При поиске информации о белке также были найдены статьи о нем и его функциях в бактерии. Вот три первых из них (приведены аннотации, найденные в базе данных UniProt):

1. Название: <удалено> Авторы: Li S.-J., Cronan J.E. Jr.

2. Название: <удалено> Авторы: Li S.-J., Cronan J.E.Jr.

3. Название: <удалено> Авторы: Kondo H., Shiratsuchi K., Yoshimoto T., Masuda T., Kitazono A., Tsuru D., Anai M., Sekiguchi M., Tanabe T.
4. Процедуры оценивания знаний, умений, навыков и (или) опыта деятельности, характеризующих этапы формирования компетенций.

4.1. Методика формирования результирующей оценки по дисциплине.

Учебным планом по данной дисциплине предусмотрен зачет. Максимальное количество баллов, которое может набрать обучающийся, 100.

За выполнение заданий текущего и промежуточного контроля обучающийся может набрать максимальное количество баллов:

За первый модуль – 30 баллов.

За второй модуль – 30 баллов.

За третий модуль – 40 баллов.

Сумма баллов складывается следующим образом: полный ответ на семинарском занятии – 2 балла, дополнение на семинарском занятии – 1 балл, доклад на семинарском занятии – до 3-х баллов, проверочная работа на лекции – до 2-х баллов, модульная контрольная работа – 10 баллов.

При успешном освоении курса обучающийся, набравший 60 баллов или более, может быть освобожден от зачета и получить оценку, в соответствии с количеством набранных им баллов.

7-10 баллов заслуживает обучающихся, который: демонстрирует полное изложение основных положений

предложенных вопросов, обнаруживает знание основных точек зрения на теоретические проблемы,

рассматриваемые в вопросах контрольной работы, логично строит ответ, делает обоснованные

выводы и обобщения, демонстрирует знание и понимание определений предложенных терминов.

4-6 баллов заслуживает обучающий, который:- демонстрирует частичное изложение основных

положений предложенных вопросов, допускает ошибки при изложении точек зрения на

теоретические проблемы, рассматриваемые в вопросах контрольной работы, испытывает затруднения

при составлении выводов и обобщений, демонстрирует частичное знание и понимание определений

предложенных терминов.

1-3 балла заслуживает обучающий, который:- демонстрирует незнание либо отрывочные представления

по вопросам контрольной работы,- предлагает ошибочные определения предложенных терминов.

4.2. Типовые модульные работы и критерии их оценивания.

Модуль 1 (ОПК-8 З.1)


1. Бионформатика как научная дисциплина и как технологическая платформа: определение, основные понятия, цели и задачи.

2. Взаимосвязи бионформатики с другими дисциплинами физико-химической биологии и общей биологии.

3. Набор информации, характеризующий белки.

4. Набор информации, характеризующий нуклеиновые кислоты.

5. Последовательности аминокислот и нуклеотидов как основная информационная составляющая биоинформатики.
Модуль 2 (ОПК-8 З.1)


  1. Форматы файлов, используемых в биоинформатике. Запись аминокислотных последовательностей. Запись нуклеотидных последовательностей.

  2. Принципы восстановления последовательности мРНК с учетом сплайсинга. База данных GenBank. Репозиторные и аналитические функции GenBank.

  3. Форматы описания первичной структуры белков (аминокислотной последовательности). Структурная информация о белках и её машинно-читаемая запись. Сравнение форматов PDB, PDB-XML и MMDB-Cn3D. Файлы формата aln. Другие форматы записи нуклеотидных и аминокислотных последовательностей, информация о них на ресурсах EMBL-EMI и emboss.

  4. Источники биологической информации и базы данных в Интернете. Классификация и типы баз данных. Всеобъемлющие, универсальные и комбинированные базы данных. Базы данных по конкретным организмам.

  5. Базы данных по типам молекул. Дополнительные базы данных. Высокоспециализированные базы данных.

  6. Проблемы баз данных: избыточность, наличие ошибок, проблемы, связанные с открытостью. GenBank – NCBI. База нуклеотидных последовательностей EMBL.

  7. База данных по белкам SwissProt.

  8. База структурной информации о белках PDB – Protein Data Bank. Встроенные инструменты для работы с базами данных в Интернете.

  9. Аггрегаторы информации из баз данных и ссылок на ресурсы.

  10. Семейство баз данных KEGG. Базы данных по малым молекулам и лекарственным препаратам.

  11. Базы данных по метаболомике и её приложениям.

  12. Токсикологические базы данных.

Модуль 3 (ОПК-8 З.1)




  1. Интернет-инструменты для работы с информацией из биологических баз данных. Сочетание информации из различных баз данных, включая биологические и библиографические.

  2. Базы данных функциональных фрагментов, доменов, мотивов и классифицированных структур. Инструменты для автоматизированного сопряжения информационных обменов с различными базами данных.

  3. Инструменты SCOP и SRS. Оценка и механизмы повышения эффективности поиска. Программные средства и Интернет-сервисы для биоинформационного анализа.

  4. Инструменты для анализа нуклеотидных и белковых последовательностей. Трансформация последовательностей.

  5. Парное и множественное выравнивание последовательностей. Предсказание свойств биополимеров из их последовательности.

  6. Предсказание пептидных профилей белков. Пердсказание наличия структурных и функциональных доменов и мотивов. Серверы для поиска доменов.

  7. Поиск по сходству доменной структуры.

  8. Сравнение пространственных структур белков, поиск сходных и отличающихся фрагментов.

  9. Оценка качества сравнительного анализа последовательностей и пространственных структур.

  10. Инструменты визуализации.



4.3. Типовые экзаменационные материалы (в случае наличия экзамена).

Зачет по дисциплине предусмотрен учебным планом. Вопросы к зачету. (ОПК-8 З.1)

1.​ Биоинформатика как научная дисциплина и как технологическая платформа: определение, основные понятия, цели и задачи.

2.​ Взаимосвязи биоинформатики с другими дисциплинами физико-химической биологии и общей биологии.

3.​ Набор информации, характеризующий биополимеры (белки, нуклеиновые кислоты).

4.​ Последовательности аминокислот и нуклеотидов как основная информационная составляющая биоинформатики.

5.​ Форматы файлов, используемых в биоинформатике.

6.​ Запись аминокислотных последовательностей. Запись нуклеотидных последовательностей. Принципы восстановления последовательности мРНК с учетом сплайсинга.

7.​ База данных GenBank. Репозиторные и аналитические функции GenBank.

8.​ Форматы описания первичной структуры белков (аминокислотной последовательности).

9.​ Структурная информация о белках и её машинно-читаемая запись.

10.​ Сравнение форматов PDB, PDB-XML и MMDB-Cn3D.

11.​ Файлы формата *.aln.

12.​ Другие форматы записи нуклеотидных и аминокислотных последовательностей, информация о них на ресурсах EMBL-EMI и emboss.

13.​ Источники биологической информации и базы данных в Интернете.

14.​ Классификация и типы баз данных.

15.​ Всеобъемлющие, универсальные и комбинированные базы данных.

16.​ Базы данных по конкретным организмам.

17.​ Базы данных по типам молекул.

18.​ Дополнительные базы данных. Высокоспециализированные базы данных.

19.​ Проблемы баз данных: избыточность, наличие ошибок, проблемы, связанные с открытостью.

20.​ GenBank – NCBI.

21.​ База нуклеотидных последовательностей EMBL.

22.​ База данных по белкам SwissProt.

23.​ База структурной информации о белках PDB – Protein Data Bank.

24.​ Встроенные инструменты для работы с базами данных в Интернете.

25.​ Агрегаторы информации из баз данных и ссылок на ресурсы.

26.​ Семейство баз данных KEGG.

27.​ Базы данных по малым молекулам и лекарственным препаратам.

28.​ Базы данных по метаболомике и её приложениям.

29.​ Токсикологические базы данных.

30.​ Интернет-инструменты для работы с информацией из биологических баз данных.

31.​ Сочетание информации из различных баз данных, включая биологические и библиографические.

32.​ Базы данных функциональных фрагментов, доменов, мотивов и классифицированных структур.

33.​ Инструменты для автоматизированного сопряжения информационных обменов с различными базами данных.

34.​ Инструменты SCOP и SRS.

35.​ Оценка и механизмы повышения эффективности поиска.

36.​ Программные средства и Интернет-сервисы для биоинформационного анализа.

37.​ Инструменты для анализа нуклеотидных и белковых последовательностей. Трансформация последовательностей.

38.​ Парное и множественное выравнивание последовательностей.

39.​ Предсказание свойств биополимеров из их последовательности.

40.​ Предсказание пептидных профилей белков.

41.​ Предсказание наличия структурных и функциональных доменов и мотивов.

42.​ Серверы для поиска доменов. Поиск по сходству доменной структуры.

43.​ Сравнение пространственных структур белков, поиск сходных и отличающихся фрагментов.

44.​ Оценка качества сравнительного анализа последовательностей и пространственных структур.



45.​ Инструменты визуализации.


1 В соотв. с п.1 и рабочей программой

2 В соотв. с п.1 и рабочей программой.

3 Результат «1» - неудовлитворительная оценка результатов обучения. Отсутствие знаний, умений, навыков. Данный результат указывает на несформированность порогового (входного) уровня знаний, умений, навыков.

4 Результат «2»- неудовлетворительная оценка результатов обучения. Фрагментарные знания, умения навыки.

5 Результат «3» - удовлетворительная оценка результатов обучения. В целом успешное, но не систематическое применение навыков (для категории «владеть»), несистематическое использование знаний (для категории «уметь»), неполные представления о чем-либо (для категории «знать»)

6 Результат «4» - удовлетворительная оценка результатов обучения. В целом успешное, но содержащее определенные пробелы применения навыков (для категории «владеть»), определенные пробелы в умении использовать соотв. знания (для категории «уметь»), определенные пробелы в знаниях (для категории «знать»).

7 Результат «5» - удовлетворительная оценка результатов обучения. Успешное и систематическое применение навыков (для категории «владеть»), сформированное умение использовать полученные знания (для категории «уметь»), сформированные систематические представления о... (для категории «знать»).

8 Напр., «(ОК-1)-I» (уровень рекомендуется указывать римскими цифрами)


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©nethash.ru 2017
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал