Программа предназначена для преподавателей, ведущих данную дисциплину, и студентов, ее изучающих. 2Цели освоения дисциплины Целью освоения дисциплины «Введение в компьютерное зрение»



Скачать 94.09 Kb.
Дата14.02.2017
Размер94.09 Kb.
Просмотров328
Скачиваний0
ТипПрограмма



Правительство Российской Федерации
Федеральное государственное автономное образовательное учреждение высшего профессионального образования
"Национальный исследовательский университет
"Высшая школа экономики"


Общеуниверситетский факультатив

Программа дисциплины
Автор программы:

Одобрена на заседании Департамента программной инженерии «___»____________ 2014 г.

Руководитель департамента Авдошин С.М._____________________________________________
Согласована Отделом методического сопровождения

основных образовательных программ «___»____________ 2014 г.

Начальник отдела Боченина Н.В.______________________________________________________
Утверждена Первым проректором НИУ ВШЭ «___»_____________2014 г.

Первый проректор Радаев В.В. _______________________________________________________

Москва, 2014

Настоящая программа не может быть использована другими подразделениями университета и другими вузами без разрешения департамента-разработчика программы.

1Область применения и нормативные ссылки


Настоящая программа учебной дисциплины устанавливает минимальные требования к знаниям и умениям студента и определяет содержание и виды учебных занятий и отчетности.

Программа предназначена для преподавателей, ведущих данную дисциплину, и студентов, ее изучающих.


2Цели освоения дисциплины


Целью освоения дисциплины «Введение в компьютерное зрение» является углубление знаний студентов в области распознавания образов, обработки видео и изображений, 3D реконструкции и цифровой фотографии.

3Компетенции обучающегося, формируемые в результате освоения дисциплины


Учебной задачей курса является выработать у студентов навыки применения и разработки алгоритмов компьютерного зрения, анализа существующих решений и выбора наиболее подходящего для конкретной задачи компьютерного зрения.

В результате изучения курса студенты должны:



знать:

  • базовые понятия, принципы и методы обработки изображений и видео;

  • базовые понятия, принципы и методы распознавания образов;

  • основные задачи компьютерного зрения и пути их решения;

  • библиотеки компьютерного зрения, такие как OpenCV;

  • особенности разработки алгоритмов компьютерного зрения в распределённой среде;

  • ограничения алгоритмов компьютерного зрения.


иметь представление:

  • о современных исследованиях в области обработки изображений и распознавания образов.


уметь:

  • реализовывать базовые алгоритмы компьютерного зрения в виде десктопных приложений;

  • разрабатывать собственные пути решения простейших задач обработки изображений и распознавания образов;

  • использовать сторонние библиотеки компьютерного зрения, такие как OpenCV;

  • оптимизировать результаты работы алгоритмов компьютерного зрения с использованием дополнительных вычислительных мощностей видеокарты.

В результате освоения дисциплины студент осваивает следующие компетенции:


Таблица

Общекультурные и профессиональные компетенции, формируемые у слушателей курса

Компетенция

Код по ОС НИУ

 владение культурой мышления, способность к обобщению, анализу, восприятию информации, постановки цели и выбору путей ее достижения

ОК-1

стремление к саморазвитию, повышению своей квалификации и мастерства

ОК-6

умение критически оценивать свои достоинства и недостатки, наметить пути и выбрать средства развития достоинств и устранения недостатков

ОК-7

осознание социальной значимости своей будущей профессии, обладание высокой мотивацией к выполнению профессиональной деятельности

ОК-8

готовность использовать основные законы естественнонаучных дисциплин в профессиональной деятельности, применять методы математического анализа и моделирования, теоретического и экспериментального исследования

ОК-10

владение иностранным языком на уровне, достаточном для разговорного общения, а также для поиска и анализа иностранных источников информации

ОК-11

понимание основных концепций, принципов, теорий и фактов, связанных с информатикой

ПК-1

способность к формализации в своей предметной области с учетом ограничений используемых методов исследования

ПК-2

готовность к использованию методов и инструментальных средств исследования объектов профессиональной деятельности

ПК-3

готовность обосновать принимаемые проектные решения, осуществлять постановку и выполнение экспериментов по проверке их корректности и эффективности

ПК-4

способность формализовать предметную область программного проекта и разработать спецификации для компонентов программного продукта

ПК-6

умение применять основы информатики и программирования к проектированию, конструированию и тестированию программных продуктов

ПК-10

навыки чтения, понимания и выделения главной идеи прочитанного исходного кода, документации

ПК-11

навыки моделирования, анализа и использования формальных методов конструирования программного обеспечения

ПК-12

способность оценивать временную и емкостную сложность программного обеспечения

ПК-13

способность создавать программные интерфейсы

ПК-14

навыки использования различных технологий разработки программного обеспечения

ПК-16

умение применять основные методы и инструменты разработки программного обеспечения

ПК-17



4Место дисциплины в структуре образовательной программы


Настоящая дисциплина является общеуниверситетским факультативом. Дисциплина читается во 2 - 4 модулях учебного года. Количество кредитов – 4.

Освоение дисциплины требует знания основ программирования и разработки приложений, базовые знания линейной алгебры, математического анализа и теории вероятностей.


5Тематический план учебной дисциплины


Таблица . Тематический план факультативной дисциплины

№ п/п

Наименование раздела

Всего часов

Аудиторные часы

Самостоя-тельная работа

Лекции

Семинары

2 модуль

1

Введение в компьютерное зрение

3

1

-

2

2

Восприятие света глазом человека. Камеры и оптика

3

1

-

2

3

Оцифровка изображений. Пиксели, гистограммы и цветовые пространства.

8

2

2

4

4

Линейная фильтрация. Матрица свертки

10

2

2

6

5

Частотное представление изображений

10

2

2

6

6

Морфология, выделение контуров и сегментация

10

2

2

6




Итого в модуле 2

44

10

8

26

3 модуль

7

Реконструкция и преобразования изображений

8

2

2

4

8

Выявление характеристических точек, метод Харриса для выявление углов

12

2

4

6

9

Сопоставление характеристических точек. SIFT, SURF и HoG

18

4

4

10

10

Базовые понятия машинного обучения. Кластеризация. Классификация

16

4

2

10

11

Введение в распознавание образов. Алгоритмы распознавания лиц. Eigenfaces, Viola Jones

12

2

2

8




Итого в модуле 3

66

14

14

38

4 модуль

12

Optical character recognition

8

2

2

4

13

Камеры и проекции

10

2

2

6

14

Эпиполярная геометрия и 3D реконструкция

14

4

4

6

15

Метод Structure from Motion

8

2

2

4

16

Цифровая фотография

8

2

2

4

17

Современные достижения в компьютерном зрении. Ограничения и перспективы.

8

2

2

4




Итого в модуле 4

56

14

14

28




Всего

166

38

36

92



6Формы контроля знаний студентов


Таблица . График контроля знаний слушателей факультатива

Тип

контроля


Форма контроля

1 уч. год

Параметры

1

2

3

4




Текущий

(неделя)


Домашние работы




1

1

1

Домашние практические задания, представляющее собой реализацию алгоритма, относящегося к теме данного модуля, и отчет со сравнительным анализом существующих решений и собственной разработки

Итоговый (модуль)

Экзамен










1

Защита индивидуального проекта перед комиссией, состоящей из преподавателей данного курса


6.1Критерии оценки знаний, навыков


Каждый студент в течение всего курса будет работать над индивидуальным проектом по разработке приложения для демонстрации работы изученных алгоритмов компьютерного зрения. Задания будут распределены на первой лекции, затем на семинарах будет осуществляется поэтапный прием работ.

В конце каждого модуля студент должен сдать домашнее задание, представляющее собой реализацию алгоритма, относящегося к теме данного модуля, и отчет со сравнительным анализом существующих решений и собственной разработки.

В четвертом модуле предусмотрен экзамен в форме защиты проекта перед комиссией. В состав комиссии входят преподаватели дисциплины. Оценка за зачет выставляется по десятибалльной шкале.

6.2Порядок формирования оценок по дисциплине


Итоговая оценка И рассчитывается по следующей формуле:
И = 0.15 * (ДЗ1+ ДЗ2 + ДЗ3 + С) + 0.4 * Э, где

И - итоговая оценка

ДЗ1, ДЗ2, ДЗ3 – оценки за домашние задания в конце каждого модуля

С - оценка за работу на семинарах, включающую участие в обсуждениях, подготовке презентаций промежуточных этапов проекта, посещение лекций и семинаров

Э - оценка за зачет в форме защиты работы
Способ округления — арифметический.
Итоговая оценка конвертируется из десятибалльной шкалы в пятибалльную и проставляется в зачетную ведомость в соответствии со следующей таблицей.
Таблица 4. Соответствие оценок по десятибалльной и пятибалльной системам.


По десятибалльной шкале

По пятибалльной шкале

1 – неудовлетворительно

2 – очень плохо

3 – плохо


неудовлетворительно – 2

4 – удовлетворительно

5 – весьма удовлетворительно



удовлетворительно – 3

6 – хорошо

7 – очень хорошо



хорошо – 4

8 – почти отлично

9 – отлично



10 – блестяще

отлично – 5



7Содержание дисциплины

7.1Введение в компьютерное зрение


Понятие "Компьютерное зрение". Цели и задачи компьютерного зрения. Краткая история визуальных медиа. Современные исследования в области компьютерного зрения. Смежные области: компьютерная графика, цифровая фотография, машинное обучение.
Основная литература:

        1. [Chapter 1] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011

        2. [Chapters 1-3] Petrou M. Image Processing: The Fundamentals, Second Edition / M. Petrou, C. Petrou. – Hoboken, NJ: John Wiley & Sons, 2011



7.2Восприятие света глазом человека. Камеры и оптика


Зрительная система человека. Палочки и колбочки. Спектральная чувствительность глаза. Оптические иллюзии. Перспективная, ортографическая и сферическая проекции. Фокусное расстояние, глубина резкости, выдержка, светочувствительный элемент. Линзы: хроматические аберрации, дисторсия. Базовые законы оптики.
Основная литература:

        1. Хьюбел Д. Глаз, мозг, зрение / Д. Хьюбел. – Москва: Мир, 1990

        2. Волосов Д. С. Фотографическая оптика / Д.С. Волосов. – Москва: Искусство, 1971


Дополнительная литература:

  1. Tabernero J. Lens Oscillations in the Human Eye. Implications for Post-Saccadic Suppression of Vision / J. Tabernero, P. Artal // Advances in Optics and Photonics – April 2014. - Volume 6. - Issue 3. - Pages 340-367

  2. Русинов М. М. Композиция оптических систем / М.М. Русинов. – Ленинград: Машиностроение, 1989

  3. Сивухин Д. В. Общий курс физики. Оптика. / Д. В. Сивухин. – Москва: Наука, 1985



7.3Оцифровка изображений. Пиксели, гистограммы и цветовые пространства


Цифровое представление изображений: матрица пикселей. Гистограммы. Цветовые пространства RGB, HSV и YCbCr. Гауссова пирамида изображений. Бинаризация и сегментация.
Основная литература:

        1. [Chapter 2] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011

  1. [Chapter 2] Yaroslavsky L.P. Advanced Digital Imaging Laboratory Using MATLAB / L.P. Yaroslavsky – Bristol: IOP Publishing, 2014


Дополнительная литература:

  1. Poynton A.C. Digital Video and HDTV: Algorithms and Interfaces / A.C. Poynton – San Francisco: Morgan Kaufmann, 2003

  2. Gaussian-Laplacian Pyramid Image Coding [Электронный ресурс] – Режим доступа: http://fourier.eng.hmc.edu/e161/lectures/canny/node3.html

  3. The Gaussian Pyramid [Электронный ресурс] - Режим доступа: http://www.cse.yorku.ca/~kosta/CompVis_Notes/gaussian_pyramid.pdf



7.4Линейная фильтрация. Матрица свертки


Математическая модель изображения. Медианный фильтр VS Матрица свертки с ядром Гауссиана. Взиамокорреляционная функция. Примеры линейной фильтрации: размытие, увеличение резкости. Шумы: соль и перец, импульсный, гауссов. Способы подавления шумов.
Основная литература:

        1. [Chapters 3.1-3.2] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

  1. Ramamoorthy K. Noise Suppression using Weighted Median Filter for Improved Edge Analysis in Ultrasound Kidney Images / K.Ramamoorthy, T.Chelladurai, P.N.Sundararajan, M.Krishnamurthy // International Journal of Computer Science and Mobile Computing –January 2014. – Volume 3. – Issue 1. - Pages 97-105

  2. Ludwig J. Image Convolution. / J. Ludwig. - Portland: Portland State University, 2009

  3. Stockman G.C. Computer Vision / G.C. Stockman, L. G. Shapiro – New Jersey: Prentice Hall, 2001



7.5Частотное представление изображений


Преобразование Фурье. Гауссиан и Лапласиан. Лапласиан Гуассиана и Гауссиан Лапласиана. Матрица градиентов изображения. Применение дискретного косинусного преобразования в JPEG.
Основная литература:

        1. [Chapter 3.4] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

  1. Van Loan C. Computational Frameworks for the Fast Fourier Transform / C. Van Loan // SIAM – 1992.

  2. [Chapter 30] Cormen T.H. Introduction to Algorithms, 2nd. ed. / T.H. Cormen, C.E. Leiserson, R.L. Rivest, C. Stein - New York: MIT Press and McGraw-Hill, 2001

7.6Морфология, выделение контуров и сегментация


Морфологические операции: эрозия, дилатация, замыкание, размыкание. Морфологическое выделение контуров. Суперпиксели. Методы сегментации изображений: кластеризация, края и области, эвристические и энергетические. Оператор Кенни.
Основная литература:

        1. [Chapter 3.3.2] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

  1. Sridhar B. An Unsupervisory Qualitative Image Enhancement using Adaptive Morphological Bilateral Filter for Medical Images. / B. Sridhar, K.V.V.S. Reddy, A.M. Prasad // International Journal of Computer Applications – 2014. - Volume 99.

  2. Cheng Y. Mean Shift, Mode Seeking, and Clustering / Y. Cheng // IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) – 1995. - Volume 17.  – Issue 8. – Pages 790–799

7.7Реконструкция и преобразования изображений


Геометрические преобразования изображений: аффинные, евклидовые и проективные. Геометрическое отношение между изображениями. Image Warping. Восстановление сцены изображения. Ретаргетинг.
Основная литература:

        1. [Chapters 3.1, 3.6.1, 6.1] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

              1. Patel H.M. A Review on Design, Implementation and Performance analysis of the Image Inpainting Technique based on TV model / H.M. Patel, H.L. Desai // International Journal of Engineering Development and Research – 2014. – Volume 2. – Issue 1. – Pages 191-195

              2. Patel J. Exemplar based Image Inpainting with Reduced Search Region / Patel J, Sarode T.K. // International Journal of Computer Applications – 2014. – Volume 92. – Issue 2.

              3. Nielsen F. Interactive Point-and-Click Segmentation for Object Removal in Digital Images / F. Nielsen, R. Nock // Computer Vision in Human-Computer Interaction – Volume 3766. – Pages 131-140, 2005

              4. Shen J. Inpainting and the Fundamental Problem of Image Processing / J. Shen // SIAM – 2003. – Volume 36. – Issue 5



7.8Выявление характеристических признаков, метод Харриса для выявление углов


Практическое применение характеристических признаков. Инвариантные локальные признаки изображения. Свойства характеристических признаков: повторяемость, уникальность, компактность, локальность. Выявление углов методом Харриса.
Основная литература:

        1. [Chapters 4.1.1-4.1.2] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

              1. Kurz D. Absolute Spatial Context-Aware Visual Feature Descriptors for Outdoor Handheld Camera Localization / Kurz D., Meier P.G., Plopski A., Klinker G. // International Conference on Computer Vision Theory and Applications (VISAPP) – 2014. – Pages 56-67

              2. Canny J. A Computational Approach To Edge Detection / J. Canny // IEEE Trans. Pattern Analysis and Machine Intelligence – 1986. - Volume 8.  – Issue 6. – Pages 679–714

              3. Harris C. A Combined Corner and Edge Detector / C. Harris, M. Stephens // Proceedings of the 4th Alvey Vision Conference – 1988. - Pages 147–151



7.9Сопоставление характеристических точек. Построение панорам.


Локальные дескрипторы. Разница Гауссиан. Харрис-Лаплас. Гистограмма направленных градиентов (HoG). Дескриптор Scale-invariant feature transform (SIFT). Дескриптор Speed Up Robust Features (SURF). Построение панорам на основе сопоставления характеристических точек.
Основная литература:

        1. [Chapters 4.1.3, 4.3.2, 9] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

              1. Burt J.P., Adelson E.H. A Multiresolution Spline With Application to Image Mosaics / J.P. Burt, E.H. Adelson // ACM Transactions on Graphics – October 1983. - Volume 2. - Issue 4. Pages 217-236



7.10Базовые понятия машинного обучения. Кластеризация. Классификация


Понятие "Машинное обучение". Цели и задачи машинного обучения. Кластеризация. Алгоритм K-средних: плюсы и минусы. Построение визуальных словарей. Графовые алгоритмы кластеризации. Классификаторы. Дилемма смещения отклонения. Метод опорных векторов. Алгоритм усиления классификаторов AdaBoost.
Основная литература:

        1. [Chapter 5.3] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

              1. Ahn H. A low complexity image stitching using advanced feature matching in mobile environments / Ahn H., Lee Y.H., Lee J.H., Cho H.J. // Journal of Computer Virology and Hacking Techniques – May 2014. - Volume 10. - Issue 2. – Pages 129-136

              2. Lipman Y. Feature Matching with Bounded Distortion / Y. Lipman, S. Yagev, R. Poranne, Jacobs D.W., R. Basri // ACM Transactions on Graphics (TOG) – May 2014. – Volume 33. – Issue 3.

              3. Bishop C.M. Pattern Recognition and Machine Learning / C.M. Bishop - London: Springer, 2006

              4. Mitchell T. Machine Learning / T. Mitchell – New York: McGraw Hill, 1997



7.11Введение в распознавание образов. Алгоритмы распознавания лиц. Eigenfaces, Viola Jones


Метод скользящего окна. Применение модели Bag-of-Words для классификации изображений. Пространственное представление пирамид изображения. Основы процесса распознавания образов. Проблемы распознавания лиц. Существующие алгоритмы распознавания лиц.
Основная литература:

        1. [Chapter 14] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

              1. Mathias M. Face Detection without Bells and Whistles / M. Mathias, R. Benenson, M. Pedersoli, L. Van Gool // Lecture Notes in Computer Science - 2014. - Volume 8692 - Pages 720-735

              2. Viola P. Robust real-time face detection / P. Viola, M.J. Jones // International journal of computer vision, Springer – 2004. – Volume 57. – Issue 2. – Pages 137-154



7.12Optical character recognition


Методы распознавания текста. Распознавание номерных знаков. Распознавание рукописного текста. Работа OCR в Adobe Reader.
Основная литература:

        1. Schantz H. F. The history of OCR, optical character recognition / H. F. Schantz // Manchester Center, Vt.: Recognition Technologies Users Association – 1982.

        2. Keys G.C. System and method for distributed optical character recognition processing / G.C. Keys, A.G. Jennings, H. Kitada // Google Patents – 2014.



Дополнительная литература:

              1. Chandarana J. Optical Character Recognition / J. Chandarana, M. Kapadia // International Journal of Emerging Technology and Advanced Engineering – May 2014. – Volume 4. – Issue 5. – Pages 220-223

              2. Farhad M.M. An efficient Optical Character Recognition algorithm using artificial neural network by curvature properties of characters / M.M. Farhad // Electronics & Vision (ICIEV), 2014 International Conference on Informatics (IEEE) – May 2014. – Pages 1-5

              3. Suen, C.Y. Future Challenges in Handwriting and Computer Applications. / C.Y. Suen, R. Plamondon, A. Tappert, A. Thomassen, J.R. Ward, K. Yamamoto // 3rd International Symposium on Handwriting and Computer Applications, Montreal - May 29, 1987.



7.13Камеры и проекции


Строение простейшей "пинхол" камеры. Камера обскура. Современные камеры и геометрия. Моделирование проекции. Матрица проекции. Ортографическая и перспективная проекции.
Основная литература:

        1. [Chapters 2.1.3-2.1.6] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

              1. Dunford N. Linear Operators, Part I: General Theory / N. Dunford, J. T. Schwartz – New York: Interscience, 1958

              2. Meyer C.D. Matrix Analysis and Applied Linear Algebra / C.D. Meyer // Society for Industrial and Applied Mathematics – 2000.



7.14Эпиполярная геометрия и 3D реконструкция


Проективная геометрия. Построение перспективы по 2 и 3 точкам. Вычисление точек и линий схода. Понятие "3D реконструкция". Методы и задачи 3D реконструкции. Калибровка камеры по объектам-маркерам. Прямая линейная калибровка. Стерео: эпиполярная геометрия. Параметры камеры: внешние и внутренние.
Основная литература:

        1. [Chapters 7, 11] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

  1. Hartley R. Multiple View Geometry in Computer Vision. / R. Hartley, A. Zisserman - Cambridge: Cambridge University Press, 2003

  2. Luong Q.T. Learning Epipolar Geometry / Q.T. Luong // Artificial Intelligence Center. SRI International. Retrieved 2007-03-04.

  3. Nalwa S.V. A Guided Tour of Computer Vision / S.V. Nalwa // Addison Wesley – 1993. - Pages 216–240



7.15Метод Structure from Motion


Фундаментальная матрица. Типы неоднозначности. Работа с неполными данными. Построение трехмерного облака точек на основе нескольких фотографий объекта. Алгоритм RANSAC. Применение метода Structure from Motion на больших пространствах.

Основная литература:

        1. [Chapters 8.1-8.4] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

  1. Spica R. Coupling Visual Servoing with Active Structure from Motion / R. Spica, P. Robuffo Giordano, F. Chaumette // IEEE Int. Conf. on Robotics and Automation, ICRA'14, Hong-Kong : Hong-Kong – 2014.

  2. Shapiro L.G. Computer Vision / L.G. Shapiro, G.C. Stockman - New Jersey: Prentice Hall, 2001

  3. Dellaert F. Structure from Motion without Correspondence / F. Dellaert, S. Seitz, C. Thorpe, S. Thrun // CVRP – 2000.



7.16Цифровая фотография


Цифровая рефокусировка изображений. Создание и передача текстуры. Освещение и рендреинг на основе изображения. High Dynamic Range (HDR). Tone mapping.
Основная литература:

        1. [Chapter 10] Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011


Дополнительная литература:

  1. Mann S. Intelligent Image Processing / S. Mann - Hoboken, NJ: Wiley-IEEE Press, 2002

  2. Raskar R., Agrawal A., Tumblin J. Coded Exposure Photography: Motion Deblurring using Fluttered Shutter / R. Raskar, A. Agrawal, J. Tumblin // ACM TRANS. GRAPH – 2006. – Volume 25. - Pages 795-804



7.17Современные достижения в распознавании объектов. Ограничения и перспективы.


Наиболее перспективные тренды в компьютерном зрении. Использование дополнительных сенсоров: Microsoft Kinect, Leap Motion, Razer Hydra.
Дополнительная литература:

  1. Pattern Recognition and Signal Analysis in Medical Imaging / Anke Meyer-Baese, Volker J. Schmid - Oxford: Academic Press: 2014

  2. Microsoft Kinect [Электронный ресурс] - Режим доступа: http://www.microsoft.com/en-us/kinectforwindows/

  3. Leap motion [Электронный ресурс] - Режим доступа: https://www.leapmotion.com/

Siggraph 2014 Papers [Электронный ресурс] - Режим доступа: http://s2014.siggraph.org/

8Образовательные технологии



9Оценочные средства для текущего контроля и аттестации студента

9.1Тематика заданий текущего контроля


Примерные вопросы для :

ДЗ № 1. Разработка мобильного или десктопного приложения, реализующего морфинг двух изображений в одно путем гауссовского наложения.

ДЗ № 2. Разработка мобильного или десктопного приложения, реализующего поиск лиц на фотографии.

ДЗ № 3. Разработка мобильного или десктопного приложения, реализующего вычисление положения камеры, исходя из проекции изображения.


9.2Вопросы для оценки качества освоения дисциплины


Примерный перечень вопросов к зачету по всему курсу или к каждому промежуточному и итоговому контролю для самопроверки студентов.

  1. Зрительная система человека

  2. Фокусное расстояние, глубина резкости, выдержка, светочувствительный элемент

  3. Цыетовые пространства RGB, HSV и YCbCr

  4. Гауссова пирамида изображений

  5. Бинаризация и сегментация

  6. Матрица свертки с ядром Гауссиана

  7. Линейная фильтрация изображений

  8. Шумы и способы их подавления

  9. Быстрое преобразование Фурье

  10. Гауссиан и Лапласиан. Лапласиан Гуассиана и Гауссиан Лапласиана

  11. Матрица градиентов изображения

  12. Морфологические операции над изображением: эрозия, дилатация, замыкание, размыкание. Морфологическое выделение контуров

  13. Оператор Кенни

  14. Геометрические преобразования изображений: аффинные, евклидовые и проективные

  15. Геометрическое отношение между изображениями

  16. Инвариантные локальные признаки изображения

  17. Выявление углов методом Харриса

  18. Локальные дескрипторы. Дескриптор Scale-invariant feature transform (SIFT). Дескриптор Speed Up Robust Features (SURF)

  19. Разница Гауссиан

  20. Гистограмма направленных градиентов

  21. Кластеризация и классификация.

  22. Алгоритм K-средних: плюсы и минусы.

  23. Графовые алгоритмы кластеризации.

  24. Алгоритм усиления классификаторов AdaBoost.

  25. Распознавание методом скользящего окна.

  26. Пространственное представление пирамид изображения.

  27. Алгоритмы распознавания лиц Eigenfaces, Viola Jones

  28. Методы распознавания текста

  29. Моделирование проекции. Матрица проекции. Ортографическая и перспективная проекции

  30. Эпиполярная геометрия

  31. 3D реконструкция

  32. Structure from Motion

  33. High Dynamic Range (HDR)

  34. Tone mapping

  35. Использование дополнительных сенсоров: Microsoft Kinect, Leap Motion, Razer Hydra

9.3Примеры тем индивидуального проекта


Тематика индивидуального проекта выбирается студентами самостоятельно и утверждается преподавателями дисциплины.

Каждый студент в течение всего курса будет работать над индивидуальным проектом по разработке приложения для демонстрации работы изученных алгоритмов компьютерного зрения.

Примеры тем индивидуальных проектов:


  1. Разработка алгоритма восстановления старых фотографий

  2. Разработка приложения поиска специфических объектов на видеопотоке на примере обнаружения котов.

  3. Разработка приложения создания цилинидрических панорам

  4. Разработка алгоритмов ретаргетинга изображения

  5. Разработка приложения распознавания движений человека

  6. Разработка приложения распознавания движений человека

  7. Разработка приложения распознавания дорожных знаков

  8. Разработка приложения распознавания текста

  9. Разработка приложения 3D реконструкции объекта по видеопотоку



10Учебно-методическое и информационное обеспечение дисциплины

10.1Базовые учебники


  1. Sonka M. Image Processing, Analysis, and Machine Vision. / M. Sonka, V. Hlavac, R. Boyler – Stamford: Cengage Learning, 2014

  2. Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011

10.2Основная литература


  1. Sonka M. Image Processing, Analysis, and Machine Vision. / M. Sonka, V. Hlavac, R. Boyler – Stamford: Cengage Learning, 2014

  2. Szeliski R. Computer Vision Algorithms and Applications / R. Szeliski. – London: Springer-Verlag, 2011

  3. Petrou M. Image Processing: The Fundamentals, Second Edition / M. Petrou, C. Petrou. - Hoboken, NJ: John Wiley & Sons, 2011

  4. Paris S. Bilateral Filtering: Theory and Applications / S. Paris, P. Kornprobst, J. Tumblin, F. Durand // Foundations and Trends in Computer Graphics and Vision. – 2008. – Volume 4. – Issue 1.

  5. Wang J. Image and Video Matting: A Survey /J. Wang, M.F. Cohen // Foundations and Trends in Computer Graphics and Vision. – 2007. – Volume 3. – Issue 2.

  6. Tuytelaars T. Local Invariant Feature Detectors: A Survey / T. Tuytelaars, K. Mikolajczyk // Foundations and Trends in Computer Graphics and Vision. – 2007. – Volume 3. – Issue 3.

  7. Perez P. Poisson Image Editing / P. Perez, M. Gangnet, A. Blake // ACM Transactions on Graphics (TOG) – July 2003. – Volume 22. – Issue 3. – Pages 313-318

  8. Bhat P. GradientShop: A Gradient-Domain Optimization Framework for Image and Video Filtering / P. Bhat, L. Zitnick, M. Cohen, and B. Curless // ACM Transactions on Graphics (TOG) – 2009. – Volume 27. – Issue 2.

10.3Программные средства


2, JDK 1.8 и IntelliJ IDEA 13.1.

10.4Дистанционная поддержка дисциплины



11Материально-техническое обеспечение дисциплины

Автор: Сибирцева Е.А.




Каталог: data -> 2014
2014 -> Особенности проведения маркетИнговых исследований для новых товаров
2014 -> Программа исследования 28
2014 -> Специализированный журнал автомобильной тематики: специфика аудитории, контента, продвижения на рынок
2014 -> Федеральное государственное автономное образовательное
2014 -> Программа «Управление образованием»
2014 -> Приложения выберите пункт Электронная почта
2014 -> Клиент-серверная система на основе беспроводной сети стандарта ieee 802. 15. 4
2014 -> Гринкруг Ефим Михайлович (должность, звание) подпись (Ф. И. О.) (Дата) Москва, 2014 г реферат


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©nethash.ru 2019
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал