Распознавания образов отпечатков пальцев и рукописного текста с применением нейросетевых алгоритмов



Pdf просмотр
Дата07.04.2017
Размер1.6 Mb.
Просмотров146
Скачиваний1
ТипАнализ

ИССЛЕДОВАНИЕ И РАЗРАБОТКА МЕТОДОВ
РАСПОЗНАВАНИЯ ОБРАЗОВ ОТПЕЧАТКОВ
ПАЛЬЦЕВ И РУКОПИСНОГО ТЕКСТА С
ПРИМЕНЕНИЕМ НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ
Автор: Уваров Василий
Руководитель: к.т.н., доцент кафедры ИУ4 Власов А.И.
Министерство образования Российской Федерации
Московский государственный технический университет имени Н. Э. Баумана
Кафедра ИУ
-
4 «Проектирование и технология производства ЭС»
Москва , 2006 г.
диссертации магистра по направлению 220500:
«Проектирование и технология производства ЭС»

Цели и решаемые задачи:

Анализ и
обобщение известных математических алгоритмов классификации образов

Исследование методов получения образов отпечатков пальцев

Исследование методов получения образов почерка(в реальном времени)

Разработка собственных модификаций алгоритмов для проведения распознавания образов

Разработка системы распознавания отпечатков пальцев

Разработка алгоритмов, позволяющих обрабатывать растровые образы и приведения их к векторному виду

Применение нейронных сетей в задачах распознавания образов
Цель
:
исследование методов распознавания образов идентификации личности по отпечаткам пальцев и рукописному тексту, разработка модификаций методов и алгоритмов распознавания образов
Решаемые задачи
:
1

Постановка задачи
Распознавание
Речи в
системах безопасности предприятий,
мобильные телефоны
Графология,
Системы безопасности,
Карманные компьютеры,
Table PC
Системы безопасности
Дактилоскопия,
Системы безопасности,
Учет и контроль рабочего времени на предприятиях
Медицина
Медицина,
Системы безопасности
Медицина,
Системы безопасности
Медицина,
Системы безопасности
Объектом распознавания в системах идентификации является образ
- точечный рисунок или битовый образ — это массив битов, задающих цвет для каждой точки
(пикселя) в прямоугольном массиве точек
Количество битов, задающих цвет одной точки, определяет количество цветов, которые могут быть заданы для этой точки
2
голос
Рукописный почерк роспись
Клавиатурный почерк динамические
Отпечатки пальцев
ДНК
Форма ладони
Расположение вен на лицевой стороне ладони
Сетчатка глаза
Радужная оболочка глаза
Форма лица
Термограмма лица статические образ

Методы решения задач
3
Название метода
описание
преимущества
недостатки
Корреляционное
сравнение
Полученный со сканера образ накладывается на каждый эталон из базы данных поочередно, после чего прямо по пикселям изображений осуществляется просчет различий между ними.
низкие требования к
качеству изображения
отпечатка пальца
процесс сравнения отпечатка его
пальца
с
эталонами
должен
включать
в
себя
множество
итераций, на каждой из которых
изображение,
полученное
со
сканера,
поворачивается
под
небольшим углом или чуть-чуть
смещается.
Длительность
операций
Сравнение_по_особым_точкам'>Сравнение
по
особым точкам
создается так называемая карта с особыми точками
(конечные точки и
точки ветвления).Далее сравнивается эталонная карта с временной при получении образа.
быстрота его работы
высокие требования к качеству
изображения (выше 300dpi (500
dpi))
Сравнение
по
узору
Полученное со сканера изображение образа разбивается на множество маленьких квадратных зон. В пределах каждой зоны бугорки образуют изогнутые дуги.
Специальный модуль рассматривает линии в квадратиках поочередно и каждую из них описывает уравнением синусоидальной волны , то есть устанавливает начальный сдвиг фазы, длину волны и направление ее распространения.
достаточно
высокая
скорость его работы и
низкие требования к
качеству
получаемого
изображения
сложен для реализации

Обобщенный алгоритм распознавания образов
4
Этапы распознавания рукописного текста
Общие этапы распознавания образов
A
B
C
A
B
B
A
C
C
d e
f g
d e
h l


B
ij
G
ij
R
ij
ij
S
S
S
S
*
11
,
0
*
59
,
0
*
3
,
0



Где , , - красная, зеленая и синяя составляющие цвета исходного пикселя, - результирующий, серый цвет,
0.3,
0.59,
0.11
– коэффициенты преобразования.
R
ij
S
G
ij
S
B
ij
S
образ
Приведение образа к серой шкале приведения образа к черно-белому виду скелетизация образа приведения изображения к векторному виду
Определение особых точек
(вершины и узлы)
Построение карты особых точек
Распознавание НС
Выделения псевдослов из образа
Выделение строк
Определение угла наклона
Исправление погрешности скелетизации

Алгоритм скелетизации образа
Вес пикселя = 2
Вес пикселя = 3
Вес пикселя = 4
Вес пикселя = 5
Вес пикселя = 6
Вес пикселя = 7 5
Название метода
описание
Преимущества
/
недостат
ки
Волновой метод
скелетизации
Начиная с какой
- либо исходной точки изображения, волна движется по всему массиву черных пикселей. В процессе распространения, волна делится в узлах изображения и генерируются новые волны, движущиеся в различных направлениях. Тем самым, в процессе движения волны прослеживаются все кривые растрового текста. позволяет выделить не только растровый скелет, но и попутно сразу произвести векторизацию изображения.
Метод
скелетизации с
использованием
двумерной
триангуляции
На изображении можно выделить контур, после аппроксимации его получаем входные данные для триангуляции
- получаем набор соприкасающихся друг с другом треугольников, причем каждый из них должен соприкасаться с контуром либо ребром и всеми точками, либо тремя точками и ни одним ребром. Векторизованный набор линий
- точки образованные в результате деления внутренних ребер треугольников пополам. А узлами здесь будут точки – центры вписанных окружностей в треугольники, которые соприкасаются с контуром тремя точками и ни одним ребром.
позволяет выделить не только растровый скелет, но и попутно сразу произвести векторизацию изображения.
Требует немалых временных затрат
Скелетизация
путем
уменьшения
картинки по
границе
Процесс скелетизации состоит в последовательном итеративном удалении граничных пикселей на всем изображении до тех пор, пока за текущую итерацию не будет удалено ни одного пикселя.
найден шаблон?
Все пиксели удалены?
Конец скелетизации
Начало скелетизации да нет да нет
Вычисление значения веса для каждого пикселя
Для каждого граничного пикселя, имеющего значение веса, равное k, перебираем условия его устранения в соответствии с приведенной таблицей и значением веса.
Удалить пиксель

Приведение изображения к векторному виду
A
B
C
A
B
B
A
C
C
d e
f g
d e
h l
Название
метода
описание
Преимущества
/
недостат
ки
«Точная»
аппроксимация
основан на учете как можно большего количества особенностей траектории начертания линий особенно хорош, когда необходимо учесть все изгибы и в полной точности описать кривую.
данный метод не совсем подходит для систем распознавания тем, что он очень чувствителен к дефектам и шумам на изображении, что крайне нежелательно
Инвариантная аппроксимация
Не требует много вычислений
6
Зеленые – вершины
Красным
- узлы
Начало векторизации
A==B?
Result <= Accuracy ?
Конец векторизации нет да да нет
Две точки (A,B);
набор точек кривой (P1,…,Pn);
точности аппроксимации
Accuracy находим max расстояние между любой из этих точек до точки
, лежащей на наборе точек кривой
,
между точками
A
и
B
Находим max расстояние от прямой
, образованной
A и
B, до точки
, лежащей на наборе точек кривой между А
и
B
Result = Max(Dn), где D = расстояние, n – индекс в массиве точки, до которой расстояние максимально
Найденная точка С делит набор точек заключенных между точками
A и B этой прямой на два набора
(A, … ,C) и (C, … ,B)

Сегментация псевдослов
7
Находим внешний контур, ищем в полученном контуре 2 точки
- самую левую и самую правую. Затем ищем кратчайший путь по количеству ребер (поиском в ширину) от самой левой до самой правой. Далее выделяем критические точки.
1 - начало и конец (первые 2 точки)
2 - максимум и минимум
3 - переход из линии в контур и обратно
После обрезаем слово в нужных местах.
Начало сегментации
Конец сегментации
Берем исходное слово в виде графа, находим внешний контур ищем в полученном контуре 2 точки - самую левую и самую правую ищем кратчайший путь по количеству ребер
(поиском в ширину) от самой левой до самой правой. Таким образом мы получили путь предположительного общего движения пера
Далее в этом пути ищем критические точки
1 - начало и конец (первые 2 точки)
2 - максимум и минимум
3 - переход из линии в контур и обратно
(совокупности с графом внешнего контура)
далее по этим точкам обрезаем слово в нужных местах

Необходимо сместить данный узел в точку пересечения линии проходящей через точки смежные с узлом и перпендикуляром, опущенным из данного узла
Выделение псевдослов и строк, исправление погрешности скелетизации
Дело в том, что распознать текст напрямую, сделав одну векторизацию –
невозможно
Существует вполне определенный метод распознавания образов, называемый структурным
Под структурным методом понимается разбиение распознаваемых объектов на минимальные (законченные)
составляющие
8

Функциональные требования
Структурная схема подсистемы распознавания образов
Система распознавания образов
9

Разработка программного обеспечения системы
10
Диаграмма классов

Модель нейронной сети для распознавания почерка y{1}
Input 1 p{1}
p{1}
y {1}
Neural Network
1
a{1}
netsum logsig bias b{1}
weight
IW{1,1}
TDL
Delays 1 1
p{1}
1
y{1}
a{1}
a{1} a{2}
Layer 2
p{1}
a{1}
Layer 1
a{1}
1
p{1}
1
a{2}
netsum logsig bias b{2}
weight
LW{2,1}
TDL
Delays 1 1
a{1}
2х слойная сеть с логарифмическими сигмоидальными функциями активации в каждом слое
Слои нейроной сети
1- й слой
2- й слой
Обучение выполняется с помощью функции traingdx
, которая реализует метод обратного распространения ошибки с возмущением и адаптацией параметра скорости настройки.
11

Экспериментальная часть (
MatLab модель нейронной сети)
0 500 1000 1500 10
-2 10
-1 10 0
10 1
10 2
10 3
1570 Epochs
T
ra in in g
-B
lu e
G
o a
l-
B
la c
k
Performance is 0.0996367, Goal is 0.1 0
5 10 15 20 25 30 35 40 45 10
-1 10 0
10 1
47 Epochs
T
ra in in g
-B
lu e
G
o a
l-
B
la c
k
Performance is 0.592433, Goal is 0.6 0
0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0
5 10 15 20 25 30 35 40 45
Обучение в присутствии шума
(обучилась за 1570 циклов , качество 0.0.99)
Повторное обучение в отсутствии шума
(обучилась за 47 циклов, качество 0.59)
Среднее значение ошибки
(процент ошибки от уровня шума)
Зашумленный символ
(до распознавание)
Распознанный символ
12

Результаты работы
13
Сегментация псевдослов
Занесение шаблона отпечатка
Результаты распознавания
Загрузка образов
Векторизация образа
Сравнение отпечатков

Выводы
14
• Проанализированы методы и алгоритмы распознавания образов
• Предложен единый подход и алгоритм к распознаванию различных биометрических показателей человека(рукописный текст, отпечатки пальцев,
цифровые флюорограмм)

Реализован ряд алгоритмов, позволяющих качественно подойти к решению проблемы распознавания рукописного текста

Разработаны и реализованы алгоритмы сегментации и классификации штрихов

Разработан и реализован ряд алгоритмов, позволяющих быстро и
эффективно обрабатывать растровые данные и преобразовывать их к векторному представлению с минимальными потерями качества и данных
Это перевод изображения в
256
оттенков серого, переход от серой шкалы к бинарному черно
- белому изображению,
скелетизация изображения,
векторизация и аппроксимация штрихов ломаной линией

Разработан алгоритм,
который также является актуальным при распознавании рукописного текста, а именно это алгоритм сегментации штрихов на их совокупности представляющих собой отдельные псевдослова и строки текста

Для непосредственной классификации штрихов была реализована обучаемая
трехслойная
однонаправленная
нейронная
сеть
с
сигмоидальной функцией активации

Апробация

В.А. Уваров Нейросетевые методы в системах биометрической идентификации
// VI
международная молодежная научно – техническая конференции «Наукоемкие технологии и интеллектуальные системы 200 4
».
-
Сборник научных трудов. Москва. МГТУ им.Н.Э.Баумана. Москва. 16
-
17 апреля 200 4
г.

В.А. Уваров Нейросетевые методы в системах биометрической идентификации
// VII
международная молодежная научно – техническая конференции «Наукоемкие технологии и интеллектуальные системы 2005».
-
Сборник научных трудов. Москва. МГТУ им.Н.Э.Баумана. Москва. 16
-
17 апреля 2005 г.

В.А. Уваров Исследование и разработка методов распознавания образов отпечатков пальцев и рукописного текста с применением нейросетевых алгоритмов
// VIII
международная молодежная научно – техническая конференции «Наукоемкие технологии и интеллектуальные системы 200 6
».
-
Сборник научных трудов. Москва. МГТУ им.Н.Э.Баумана. Москва. 16
-
17 апреля 200 6
г.
Работа была отмечена дипломом второй степени на
VII- й
молодежной научно – технической конференции «Наукоемкие технологии и интеллектуальные системы
2005
»
(16-17
апреля
2005
г
.).
15

Дальнейшее развитие работы
Распознавание
Речи в
системах безопасности предприятий,
мобильные телефоны
Графология,
Системы безопасности,
Карманные компьютеры,
Table PC
Системы безопасности
Дактилоскопия,
Системы безопасности,
Учет и контроль рабочего времени на предприятиях
Медицина
Медицина,
Системы безопасности
Медицина,
Системы безопасности
Медицина,
Системы безопасности
В работе были рассмотрены методы распознавания образов отпечатков пальцев,
Рукописного текста и образов цифровых флюорограмм, в рамках дальнейшего рассмотрения и развития работы могут быть рассмотрены и разработаны модули распознавания образов, голоса, клавиатурного почерка, ДНК, ладони, глаза, лица
16
голос
Рукописный почерк роспись
Клавиатурный почерк динамические
Отпечатки пальцев
ДНК
Форма ладони
Расположение вен на лицевой стороне ладони
Сетчатка глаза
Радужная оболочка глаза
Форма лица
Термограмма лица статические образ


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©nethash.ru 2017
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал