Литература 32 Приложение а 33 Задание



страница1/3
Дата07.04.2017
Размер0.91 Mb.
Просмотров575
Скачиваний0
ТипЛитература
  1   2   3

Содержание

Задание 1

Введение 1

2 Реализация алгоритмов 12

Литература 32

Приложение А 33










Задание

Определить основные алгоритмы распознавания образов, выявить свойства и характеристики, а так же этапы работ. Алгоритмы реализовать программно, для последующего получение результатов и их сравнения.


Введение

Способность распознавать считается одним из основных свойств человека. Образ представляет собой описание объекта. Так из множества характеристик объекта человек может определить тот необходимый образ. Данная способность представляет собой очень сложную информационную систему.

На данный день уже существуют системы с такими функциями. Распознавания образов постепенно овладевают системы, наделенные элементами искусственного интеллекта, например, роботы. Создание искусственных систем распознавания образов остаётся сложной теоретической и технической проблемой. Необходимость в таком распознавании возникает в самых разных областях — от военного дела и систем безопасности до оцифровки всевозможных аналоговых сигналов. Вот только некоторые примеры задач распознавания образов:


  • распознавание букв;

  • распознавание штрих-кодов;

  • распознавание автомобильных номеров;

  • распознавание лиц;

  • распознавание речи;

  • распознование изображений.

Методы распознавания образов играют ведущую роль в большинстве научных сферах. Системы помогают поставить медицинский диагноз, обработать нейробиологические сигналы, обнаружение и классификация гидроакустических сигналов, обработать изображения, в промышленном контроле, в системах переработки информации и т.д.


  1. Краткая теория

    1. История возникновения искусственных систем распознавания.


"Если тебе, дорогой друг, нужно разобраться в сложном нагромождении фактов или вещей, ты сначала разложи их на небольшое число куч по схожести. Картина прояснится и ты поймешь природу этих вещей".

Демокрит в "Письме ученому соседу".


Достаточно долгое время задача распознавания рассматривалась человеком со стороны биологического и психологического аспектов. При этом изучению подвергались лишь качественные характеристики, которые не позволяли точно описать механизм функционирования. Получение функциональных зависимостей было, как правило, связано с исследованием рецепторов органов слуха, осязания или зрения. Однако принципы формирования решения оставались загадкой. Считается, что основным заблуждением на заре исследования было мнение о том, что мозг функционирует по определенным алгоритмам, а следовательно, выяснив эту систему правил, можно ее воссоздать с помощью постоянно развивающихся вычислительных и технических средств.

Основанная Норбертом Винером в начале XX века новая наука, получившая название кибернетика (наука об общих закономерностях процессов управления и передачи информации в машинах, живых организмах и обществе), позволила в исследование вопроса распознавания образов ввести количественные методы. Другими словами, представить процесс распознавания образов (по сути - природное явление) математическими методами.

Отметим, что в процессе жизнедеятельности человека число принимаемых им решений конечно, но, в то же время, количество определяющих факторов может быть бесконечным. В качестве простого примера приведем следующий. На улице может идти дождь: проливной, моросящий, другими словами, различной силы, однако человек может принять лишь два решения - брать ему зонт или нет.

Количество возможных решений зависит от жизненного опыта. Поэтому автоматизация ряда процессов предполагает под собой конструирование автоматических устройств, способных реагировать на множество изменяющихся характеристик внешней среды каким-то определенным количеством удовлетворительных для человека реакций. Это означает реализацию главных особенностей принципов распознавания, заложенных природой, обеспечение реагирования на совокупность изменений.

Создание устройств, выполняющих функции распознавания различных объектов, в большинстве случаев обеспечивает возможность замены человека специализированным автоматом. Благодаря этому, значительно расширяются возможности сложных систем, выполняющих различные информационные, логические, аналитические задачи. Следует отметить, что качество работ, выполняемых человеком на рабочем месте, зависит от многих факторов (квалификации, опыта, добросовестности и т. д.). В то же время исправный автомат действует однообразно и обеспечивает всегда одинаковое качество. Автоматический контроль сложных систем позволяет вести мониторинг и обеспечивать своевременное обслуживание, идентификацию помех и автоматическое применение соответствующих методов шумоподавления, позволяет повысить качество передачи информации. Также понятно, что использование автоматических систем в ряде задач может обеспечить невозможное для человека быстродействие.

Подытожив выше описанное, отметим основные причины замены человеческого участия в задачах распознавания:



  • освобождение человека от однообразных операций для решения других более важных задач;

  • повышение качества и скорости принимаемых решений.

В течение достаточно продолжительного времени проблема распознавания привлекает внимание специалистов в области прикладной математики, а затем и информатики. Так, в частности, отмечают работы Р. Фишера, выполненные в 20-х годах и приведшие к формированию дискриминантного анализа как одного из разделов теории и практики распознавания. В 40-х годах А. Н. Колмогоровым и А. Я. Хинчиным поставлена задача о разделении смеси двух распределений.

В 50-60-е годы ХХ века на основе массы работ появилась теория статистических решений. В результате этого появления найдены алгоритмы, обеспечивающие отнесение нового объекта к одному из заданных классов, что явилось началом планомерного научного поиска и практических разработок. В рамках кибернетики начало формироваться новое научное направление, связанное с разработкой теоретических основ и практической реализации устройств, а затем и систем, предназначенных для распознавания объектов, явлений, процессов. Новая научная дисциплина получила название "Распознавание образов".

Таким образом, базой для решения задач отнесения объектов к тому или иному классу послужили, как это отмечается сегодня, результаты классической теории статистических решений. В ее рамках строились алгоритмы, обеспечивающие на основе экспериментальных измерений параметров (признаков), характеризующих этот объект, а также некоторых априорных данных, описывающих классы, определение конкретного класса, к которому может быть отнесен распознаваемый объект.

В последующем математический аппарат теории распознавания расширился за счет применения:



  • разделов прикладной математики; теории информации;

  • методов алгебры логики;

  • математического программирования и системотехники.

И к середине 70-х годов определился облик распознавания как самостоятельного научного направления, появилась возможность создания нормальной математической теории распознавания.


    1. Определения

Прежде, чем приступить к основным методам распознавания образов, приведем несколько необходимых определений.

Распознавание образов (объектов, сигналов, ситуаций, явлений или процессов) - задача идентификации объекта или определения каких-либо его свойств по его изображению (оптическое распознавание) или аудиозаписи (акустическое распознавание) и другим характеристикам.

Одним из базовых является не имеющее конкретной формулировки понятие множества. В компьютере множество представляется набором неповторяющихся однотипных элементов. Слово "неповторяющихся" означает, что какой-то элемент в множестве либо есть, либо его там нет. Универсальное множество включает все возможные для решаемой задачи элементы, пустое не содержит ни одного.



Образ - классификационная группировка в системе классификации, объединяющая (выделяющая) определенную группу объектов по некоторому признаку. Образы обладают характерным свойством, проявляющимся в том, что ознакомление с конечным числом явлений из одного и того же множества дает возможность узнавать сколь угодно большое число его представителей. Образы обладают характерными объективными свойствами в том смысле, что разные люди, обучающиеся на различном материале наблюдений, большей частью одинаково и независимо друг от друга классифицируют одни и те же объекты. В классической постановке задачи распознавания универсальное множество разбивается на части-образы. Каждое отображение какого-либо объекта на воспринимающие органы распознающей системы, независимо от его положения относительно этих органов, принято называть изображением объекта, а множества таких изображений, объединенные какими-либо общими свойствами, представляют собой образы.

Методика отнесения элемента к какому-либо образу называется решающим правилом. Еще одно важное понятие - метрика, способ определения расстояния между элементами универсального множества. Чем меньше это расстояние, тем более похожими являются объекты (символы, звуки и др.) - то, что мы распознаем. Обычно элементы задаются в виде набора чисел, а метрика - в виде функции. От выбора представления образов и реализации метрики зависит эффективность программы, один алгоритм распознавания с разными метриками будет ошибаться с разной частотой.



Обучением обычно называют процесс выработки в некоторой системе той или иной реакции на группы внешних идентичных сигналов путем многократного воздействия на систему внешней корректировки. Такую внешнюю корректировку в обучении принято называть "поощрениями" и "наказаниями". Механизм генерации этой корректировки практически полностью определяет алгоритм обучения. Самообучение отличается от обучения тем, что здесь дополнительная информация о верности реакции системе не сообщается.

Адаптация - это процесс изменения параметров и структуры системы, а возможно - и управляющих воздействий, на основе текущей информации с целью достижения определенного состояния системы при начальной неопределенности и изменяющихся условиях работы.

Обучение - это процесс, в результате которого система постепенно приобретает способность отвечать нужными реакциями на определенные совокупности внешних воздействий, а адаптация - это подстройка параметров и структуры системы с целью достижения требуемого качества управления в условиях непрерывных изменений внешних условий.

Примеры задач распознавания образов:



  • распознавание букв;

  • распознавание штрих-кодов;

  • распознавание автомобильных номеров;

  • распознавание лиц и других биометрических данных;

  • распознавание речи.




    1. Методы распознавания образов

В целом, можно выделить три метода распознавания образов:

Метод перебора. В этом случае производится сравнение с базой данных, где для каждого вида объектов представлены всевозможные модификации отображения. Например, для оптического распознавания образов можно применить метод перебора вида объекта под различными углами, масштабами, смещениями, деформациями и т. д. Для букв нужно перебирать шрифт, свойства шрифта и т. д. В случае распознавания звуковых образов, соответственно, происходит сравнение с некоторыми известными шаблонами (например, слово, произнесенное несколькими людьми). Один из используемых алгоритмов – это скелетезация. Это метод распознавания одинарных бинарных образов, основанный на построение скелетов этих образов и выделения из скелетов ребер и узлов. Далее по соотношению ребер, их числу и числу узлов строится таблица соответствия образам. Так, например, скелетом круга будет один узел, скелетом буквы П - три ребра и два узла, причем ребра относятся как 2:2:1. В программировании данный метод имеет несколько возможных реализаций. Так же можете просмотреть метод поточечное процентное сравнение с эталоном. Здесь должна быть некоторая предобработка, для получения инвариантности относительно размера и положения, затем осуществляется сравнение с заготовленной базой эталонов изображений - если совпадение больше чем какая-то отметка, то считаем образ распознанным.

Второй подход - производится более глубокий анализ характеристик образа. В случае оптического распознавания это может быть определение различных геометрических характеристик. Звуковой образец в этом случае подвергается частотному, амплитудному анализу и т. д. Один из методов – это инвариантные числа.
Из геометрии образов можно выделить некоторые числа, инвариантные относительно размера и поворота образов, далее можно составить таблицу соответствия этих чисел конкретному образу(почти как в алгоритме скелетезации). Примеры инвариантных числе - число Эйлера, эксцентриситет, ориентация(в смысле расположения главной оси инерции относительно чего-нить тоже инвариантного).

Следующий метод - использование искусственных нейронных сетей (ИНС). Этот метод требует либо большого количества примеров задачи распознавания при обучении, либо специальной структуры нейронной сети, учитывающей специфику данной задачи. Тем не менее, его отличает более высокая эффективность и производительность. Однако надо иметь ввиду, что нейросети иногда дают весьма интересные результаты, засчет своей нелинейной структуры, более того некоторые нейросети способны распознавать образы инвариантные относительно поворота без какой либо внешней предобработки. Так например сети на основе неокогнейтронов способны выделять некоторые характерные черты образов, и распознавать их как бы образы не были повернуты.




    1. Общая характеристика задач распознавания образов.

Общая структура системы распознавания и этапы в процессе ее разработки показаны на Рис. 1.1.

http://www.ci.ru/inform03_06/pict/p_24/tabl.jpg

Рис. 1.1 - Структура системы распознавания.

Задачи распознавания имеют следующие характерные черты.

Это информационные задачи, состоящие из двух этапов:



  • преобразование исходных данных к виду, удобному для распознавания;

  • собственно распознавание (указание принадлежности объекта определенному классу).

В этих задачах можно вводить понятие аналогии или подобия объектов и формулировать правила, на основании которых объект зачисляется в один и тот же класс или в разные классы.

В этих задачах можно оперировать набором прецедентов-примеров, классификация которых известна и которые в виде формализованных описаний могут быть предъявлены алгоритму распознавания для настройки на задачу в процессе обучения.

Для этих задач трудно строить формальные теории и применять классические математические методы (часто недоступна информация для точной математической модели или выигрыш от использования модели и математических методов несоизмерим с затратами).

Выделяют следующие типы задач распознавания:



  • задача распознавания - отнесение предъявленного объекта по его описанию к одному из заданных классов (обучение с учителем);

  • задача автоматической классификации - разбиение множества объектов, ситуаций, явлений по их описаниям на систему непересекающихся классов (таксономия, кластерный анализ, самообучение);

  • задача выбора информативного набора признаков при распознавании;

  • задача приведения исходных данных к виду, удобному для распознавания;

  • динамическое распознавание и динамическая классификация - задачи 1 и 2 для динамических объектов;

  • задача прогнозирования - суть предыдущий тип, в котором решение должно относиться к некоторому моменту в будущем.[1]




    1. Предобработка данных

В подавляющем большинстве случаев исходный сигнал, формируемый устройством ввода для системы распознавания, несет в себе огромное количество "лишней" информации, которая скрывает биометрические характеристики человека. Для того чтобы избавиться от ненужной информации в сигнале и сделать важные для нас параметры более "выпуклыми", существует стадия предобработки данных. Какая информация в исходном потоке является полезной, а какая "вредной", зависит от того, что, собственно, мы хотим измерять. Если измеряются только геометрические характеристики объекта на изображении, то, очевидно, информация о цвете и яркости не нужна. В другом случае данные о яркости конкретного объекта на изображении могут быть весьма полезными, но этот объект скрывается фоном сравнимой с ним яркости - в этом случае нам необходимо выделить его из окружающего фона. Для систем, принимающих решения на основе анализа видеофрагментов, весьма полезной предобработкой будет выделение областей, в которых наблюдается движение.

Какими же методами осуществляется первичная обработка данных? Прямого ответа на этот вопрос не существует. Все зависит от природы исходного потока и параметров, которые мы хотим выделять. Как правило, во время первичной обработки сигнал пропускается через набор фильтров самой разной природы - от простейших линейных фильтров, подавляющих шумы, до сложных нейроноподобных систем, выделяющих объекты заданного размера, линии определенного направления или ищущих границы между текстурами.

Применительно к системам идентификации личности, основанным на анализе геометрических характеристик объекта, содержащихся в изображении (отпечаток пальца, радужная оболочка глаза, лицо, изображение кисти руки и так далее), очень часто на стадии предобработки выполняется так называемая бинаризация исходного полутонового изображения, которая трансформирует исходное полутоновое изображение в бинарное, оставляя при этом интересующие нас объекты и удаляя шум и ненужную информацию о цвете и яркости.

Для систем, работающих в реальном масштабе времени (real-time systems), другой важнейшей задачей стадии предобработки является поиск в исходном сигнале полезной информации. Представим себе систему идентификации пользователя по лицу. Пусть она состоит из видеокамеры, платы захвата видеосигнала и соответствующего программного обеспечения. В этой системе блок предварительной обработки "просматривает" каждый кадр, поступающий с видеокамеры. Целью этого "просмотра", очевидно, будет поиск на изображении объектов, напоминающих человеческое лицо. Как только такой объект будет обнаружен, немедленно запускаются блоки идентификации. Другими словами, блок предварительной обработки данных может "включать" систему идентификации личности. Резюмируя вышесказанное, можно выделить две основные задачи блока предобработки исходного сигнала:



  • удаление "лишней" информации из исходного сигнала и подавление шума;

  • поиск информационных фрагментов в исходном потоке данных, их сегментация и включение блоков идентификации после их выделения.




    1. Проблема обучения распознаванию образов.

В целом проблема распознавания образов состоит из двух частей: обучения и распознавания. Обучение осуществляется путем показа отдельных объектов с указанием их принадлежности тому или другому образу (классу).

В результате обучения распознающая система должна приобрести способность реагировать одинаковыми реакциями на все объекты одного образа и различными — на все объекты различных образов. Важно, что в процессе обучения указываются только сами объекты и их принадлежность образу. За обучением следует процесс распознавания новых объектов обученной системой.

Автоматизация этих процедур и составляет проблему обучения распознаванию образов. Во - втором случае, когда человек сам разгадывает или придумывает, а затем навязывает машине правило классификации, проблема распознавания решается частично, так как основную и главную часть проблемы (обучение) человек берет на себя.

Проблема обучения распознаванию образов интересна как с прикладной, так и с принципиальной точки зрения. С прикладной точки зрения решение этой проблемы важно прежде всего потому, что оно открывает возможность автоматизировать многие процессы, которые до сих пор связывали лишь с деятельностью живого мозга. Принципиальное значение проблемы тесно связано с вопросом, который все чаще возникает в связи с развитием идей кибернетики: что может и что принципиально не может делать машина? В частности, может ли машина развить в себе способность перенять у человека умение производить определенные действия в зависимости от ситуаций, возникающих в окружающей среде? Пока стало ясно только то, что если человек может сначала сам осознать свое умение, а потом его описать, т. е. указать, почему он производит действия в ответ на каждое состояние внешней среды или как (по какому правилу)он объединяет отдельные объекты в образы, то такое умение без принципиальных трудностей может быть передано машине. Если же человек обладает умением, но не может объяснить его, то остается только один путь передачи умения машине — обучение на примерах.

Круг задач, которые могут решаться с помощью распознающих систем, чрезвычайно широк. Сюда относятся не только задачи распознавания зрительных и слуховых образов, но и задачи распознавания сложных процессов и явлений, возникающих, например, при выборе целесообразных действий руководителем предприятия или выборе оптимального управления технологическими, экономическими, транспортными или военными операциями. В каждой из таких задач анализируются некоторые явления, процессы, состояния внешнего мира, всюду далее называемые объектами наблюдения. Прежде чем начать анализ какого-либо объекта, нужно получить о нем определенную, каким-либо способом упорядоченную информацию. Такая информация представляет собой характеристику объектов, их отображение на множестве воспринимающих органов распознающей системы. Каждое отображение какого-либо объекта на воспринимающие органы распознающей системы, независимо от его положения относительно этих органов, принято называть изображением объекта (или отражением), а множества таких изображений, объединенные какими-либо общими свойствами, представляют собой образы.

При решении задач управления методами распознавания образов вместо терминов "изображение" или "отражение" применяют термин "состояние". Состояние — это множество отображений измеряемых текущих (или мгновенных) характеристик наблюдаемого объекта в следящей системе. Совокупность состояний определяет ситуацию. Понятие "ситуация" является аналогом понятия "образ". Но эта аналогия не полная, так как не всякий образ можно назвать ситуацией, хотя всякую ситуацию можно назвать образом. Если в качестве объекта наблюдения рассматривается некоторый объект управления, то понятие "ситуация"объединяет такие состояния этого объекта, в которых следует применять одни и те же управляющие воздействия. Если объектом наблюдения является военная игра, то ситуация объединяет все состояния игры, которые требуют, например, мощного танкового удара при поддержке авиации.

Выбор исходного описания объектов является одной из центральных задач проблемы ОРО. При удачном выборе исходного описания (пространства признаков) задача распознавания может оказаться тривиальной и, наоборот, неудачно выбранное исходное описание может привести либо к очень сложной дальнейшей переработку информации, либо вообще к отсутствию решения. Например, если решается задача распознавания объектов, отличающихся по цвету, а в качестве исходного описания выбраны сигналы, получаемые от датчиков веса, то задача распознавания в принципе не может быть решена.


    1. Технологии

Исследователи, работающие в корпорации Intel, выпустили ПО, лицензируемое по принципу открытого исходного кода, позволяющее разработчикам создавать компьютеры, которые читают по губам отдаваемые им команды, что обеспечивает лучшее распознавание сказанного.

Современные мощные алгоритмы распознавания речи хорошо работают при отсутствии фонового шума или при использовании хорошо настроенной гарнитуры, однако точность этих алгоритмов значительно снижается, когда приложения на их основе оказываются в условиях естественных шумов, характерных, например, для общественных мест. Программный пакет Audio Visual Speech Recognition (AVSR), объединенный с алгоритмами распознавания мимики лица из библиотеки компьютерного зрения Intel OpenCV, позволит компьютерам наблюдать за лицом человека и отслеживать движения его рта. Синхронизация видеоданных с результатами речевой идентификации в итоге обеспечит повышение точности распознавания речи и соответственно эффективности широкого спектра речевых приложений в шумных средах.

ПО AVSR является частью библиотеки Intel OpenCV и представляет собой инструментальный набор из более 500 используемых при обработке изображений функций, которые помогают исследователям разрабатывать новые приложения на основе технологий компьютерного зрения. Библиотека OpenCV создана для стимулирования инноваций в этой сфере и предоставляет доступ к исходному коду для реализации широкого спектра функций компьютерного зрения и обработки изображений. Разработчики используют код OpenCV в самых разных областях от детских игрушек до промышленного производства.



Поделитесь с Вашими друзьями:
  1   2   3


База данных защищена авторским правом ©nethash.ru 2017
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал