Адаптивная обработка каллиграфической информации, представленной в виде рукописных символов



Pdf просмотр
страница1/7
Дата09.01.2017
Размер3.63 Mb.
Просмотров709
Скачиваний0
ТипАнализ
  1   2   3   4   5   6   7

Московский государственный технический университет имени Н.Э. Баумана


УДК: 81:002
На правах рукописи

Демин Алексей Анатольевич
АДАПТИВНАЯ ОБРАБОТКА КАЛЛИГРАФИЧЕСКОЙ ИНФОРМАЦИИ,
ПРЕДСТАВЛЕННОЙ В ВИДЕ РУКОПИСНЫХ СИМВОЛОВ
Специальность 05.13.01 – Системный анализ, управление и обработка информации (в технических системах)
Диссертация на соискание ученой степени кандидата технических наук
Научный руководитель: к.т.н., доцент, Власов А.И.


Москва – 2014

2

СОДЕРЖАНИЕ
Стр.
ВВЕДЕНИЕ ...................................................................................................................... 5
ГЛАВА 1.
АНАЛИЗ
МЕТОДОВ
И
СРЕДСТВ
ОБРАБОТКИ
ИНФОРМАЦИИ, ПРЕДСТАВЛЕННОЙ РУКОПИСНЫМИ СИМВОЛАМИ .... 14 1.1.
Актуальность обработки информации, представленной рукописными образами ....................................................................................................................... 14 1.2.
Классификация систем распознавания рукописных образов .......................... 16 1.3.
Анализ решений для распознавания рукописных образов .............................. 18 1.4.
Анализ обобщенной модели информации, представленной совокупностью рукописных образов ........................................................................ 22 1.5.
Постановка задачи обработки информации рукописных текстов в свете разрешения противоречий процессов формирования навыков каллиграфии ...... 26
Выводы по главе 1 ...................................................................................................... 31
ГЛАВА 2.
МАТЕМАТИЧЕСКИЕ
МЕТОДЫ
И
МОДЕЛИ
РАСПОЗНАВАНИЯ РУКОПИСНЫХ СИМВОЛОВ И ОБРАБОТКИ
КАЛЛИГРАФИЧЕСКОЙ ИНФОРМАЦИИ ............................................................ 32 2.1.
Обобщенная модель оперативного и автономного методов распознавания рукописных образов ................................................................................................... 32 2.2.
Метод обработки каллиграфической информации, представленной в виде рукописных символов ................................................................................................ 34 2.3.
Алгоритмы изменения цветности изображения для автономного метода распознавания.............................................................................................................. 36 2.4.
Фильтры шумоподавления и сглаживания для автономного метода распознавания.............................................................................................................. 39 2.5.
Методы получения векторов признаков рукописных символов для

3

Стр. автономного метода распознавания .......................................................................... 41 2.6.
Оперативные методы распознавания рукописных символов.......................... 46 2.7.
Математическая модель оперативного метода распознавания рукописных символов и обработки заключенной в них каллиграфической информации ....... 50
Выводы по главе 2 ...................................................................................................... 57
ГЛАВА 3.
РАЗРАБОТКА
ОБУЧАЮЩЕЙ
СИСТЕМЫ
ДЛЯ
ФОРМИРОВАНИЯ НАВЫКОВ КАЛЛИГРАФИИ ............................................... 58 3.1.
Анализ функциональных требований к обучающей системе ......................... 58 3.2.
Структурно-функциональная модель работы обучающей системы ............... 65 3.3.
Модели вариантов использования обучающей системы ................................. 70 3.4.
Логическая модель обучающей системы .......................................................... 76 3.5.
Модель реализации обучающей системы .......................................................... 83 3.6.
Модель развѐртывания обучающей системы .................................................... 86
Выводы по главе 3 ...................................................................................................... 91
ГЛАВА 4.
ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ОБУЧАЮЩЕЙ
СИСТЕМЫ ФОРМИРОВАНИЯ НАВЫКОВ КАЛЛИГРАФИИ .......................... 92 4.1.
Структура и состав экспериментального стенда исследования обучающей системы ................................................................................................... 92 4.2.
Опытная эксплуатация обучающей системы при решении образовательных задач ............................................................................................. 106 4.3.
Опытная эксплуатация обучающей системы при решении реабилитационно-медицинских задач .................................................................... 121 4.4.
Прогнозируемые результаты применения обучающей системы для восстановления тонкой моторики кистей рук и для диагностики состояния

4

Стр. организма у космонавтов ......................................................................................... 128
Выводы по главе 4 .................................................................................................... 137
ЗАКЛЮЧЕНИЕ ........................................................................................................... 138
СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ .............................. 140
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ ....................................................... 141
ПРИЛОЖЕНИЕ ........................................................................................................... 150


5

ВВЕДЕНИЕ
Актуальность
Объектом диссертационного исследования являются адаптивные методы формирования навыков каллиграфии.
Проблема обработки каллиграфической информации, содержащейся в рукописных текстах (то есть информации о структуре текста, связанной с правильным начертанием символов), выступает как основополагающая при решении целого ряда задач.
Одной из таких задач является задача быстрого, эффективного и качественного обучения младших школьников грамотному и каллиграфически правильному письму.
Рост информационных потоков, объема знаний и коммуникативной активности в современном обществе обуславливает возрастание требований к уровню владения письмом и иными базовыми образовательными навыками, необходимыми для активного участия в деятельности общества. В связи с этим процессы обучения письму, восстановления навыков письма, а также обработки и сохранения рукописной информации приобретают новое, сложное содержание, становясь предметом изучения для специалистов в области системного анализа.
Этому способствует усложнение самого понятия грамотности и повышение ее роли в обществе. Согласно материалам ЮНЕСКО основным навыком считается активное владение письмом, включая его рукописный вариант.
Обучение письму и совершенствование навыков письма рассматривается как основа сохранения человеческой культуры, современной цивилизации.
Навык письма тесно связан с развитием высших психических функций – внимания, восприятия, памяти, мышления. Навык письма является также двигательным, основанным на моторике и координации мелких движений рук. Он формируется одновременно и взаимозависимо с умственным развитием. Эта взаимосвязь лежит, например, в основе методик, определения школьной зрелости.

6

Они позволяют по степени выполнения специальных графических заданий провести диагностику «зрелости» мелкой моторики и одновременно – психологическую и физиологическую готовность детей к школьному обучению.
Обучение письму в свою очередь способно стимулировать развитие индивидуума. Это влияние лежит в основе обучающих упражнений по письму.
Такие упражнения не только прививают и совершенствуют базовый навык письма, но и способствуют совершенствованию функции зрительно-двигательной координации, зрительной памяти, произвольного внимания, аналитического восприятия.
Не менее важной задачей является восстановление навыков письма, утраченных в результате пребывания в невесомости, болезней или травм и тренировка нарушенной моторики рук с применением компьютерных методов реабилитационной терапии.
Психическая и физическая активизация, восстановление функций у больных, например, после перенесенного инсульта, наиболее успешно решается в системе комплексной реабилитации, включающей наряду с медикаментозным и физиотерапевтическим лечением упражнения по восстановлению нарушенной речи, навыков письма и пр.
Актуальны также иные задачи: реадаптация моторной активности рук после воздействия гипо- и микрогравитации, диагностика общего функционального состояния организма по состоянию моторики рук и функции письма, проблемы идентификации почерка и оперативного перевода рукописной информации в электронную форму, и др.
Рассмотренные задачи обуславливают актуальность создания комплексной
системы, выполняющей функцию упражнений для обучения письму, тренировки
навыков каллиграфии, корректировки почерка, восстановления нарушенных
умений письма. Разработка алгоритмов и методов, необходимых для создания
таких упражнений является междисциплинарной задачей, базирующейся на учении о психосоматическом развитии личности, использовании адаптивных

7
методик обучения, методах обработки информации (распознавание рукописных символов), технических решениях (сенсорный ввод) и т.д.
Анализ процессов обучения письму и восстановления нарушенных навыков письма как сложных прикладных объектов исследования, позволил выявить системные противоречия, заключенные в них. Важность такого анализа продиктована тем, что подобные исследования, отличающиеся междисциплинарным характером, редко проводятся, несмотря на их необходимость.
Разрешение этих противоречий может быть найдено на пути создания и применения упомянутой выше специальной обучающей системы и библиотеки упражнений для обучения и совершенствования навыков письма и восстановления мелкой моторики рук. Система позволит ввести обратную связь на уровне обучаемого, нивелируя несовершенство функции самоконтроля, обусловленное возрастом или болезнью, а также даст возможность индивидуализировать процессы обучения и реабилитации.
Исследованиями структурных аспектов рукописного текста, включая каллиграфию, занимались с начала 70-х годов XX века В.А. Ковалевский [1],
К.Фукунага [2], разработкой классификаторов для рукописных символов и компьютерным распознаванием – Д.Е. Ян [3], Н.Д. Горский и др. [4],
В.Л.Арлазаров и др. [5]. В XXI веке Н.В. Котович, О.А Славин исследовали скелетизацию рукописного текста и методы адаптивного распознавания [6],
В.В.Постников, A.A. Михайлов – методы сегментации текста [7], А.Б. Мерков – методы обработки слитного текста [8]; и др. Применением рандомизированных алгоритмов для распознавания и анализа каллиграфии рукописных текстов занимается научная школа проф. О.Н. Граничина [9, 10], и др.
Тем не менее, проблема обработки каллиграфической информации
рукописных тестов недостаточно исследована в аспекте формирования навыков
письма. Такая постановка проблемы дает возможность вести поиск ее решений, направленных в частности на разработку математического и алгоритмического

8
обеспечения для обучающей системы, позволяющей формировать навыки каллиграфии при обучении письму или реабилитационной терапии.
Цель работы:
Исследовать проблему обработки каллиграфической информации рукописного текста в аспекте создания и применения адаптивных методик по формированию навыков каллиграфии на основе упражнений по коррекции почерка.
Решаемые задачи:
- исследование методов визуализации, трансформации и анализа графических образов в реальном времени;
- системный анализ процессов формирования навыков каллиграфии при обучении письму и реабилитации функции мелкой моторики рук;
- классификация методов распознавания графических образов;
- разработка метода обработки каллиграфической информации, представленной в виде рукописных символов;
- разработка математических моделей и алгоритмов преобразования необработанных письменных символов в форму, адаптированную для компьютерной обработки;
- разработка алгоритма обработки рукописных образов в режиме реального времени для обучающей системы формирования навыков каллиграфии;
- проектирование базы данных для интеллектуальной системы обработки каллиграфической информации и формирования навыков письма;
- разработка адаптивной методики составления индивидуального курса обучения и восстановления навыков письма.
Методы исследования:
При решении поставленных задач в работе использованы методы системного анализа, нелинейного программирования, теории информационных систем и обработки данных, теория вероятностей, математическая статистика; также в работе были использованы методы обработки образов печатного и

9
рукописного текста с использованием оптимизированной файловой БД для хранения информационных структур символов.
Научная новизна работы:

разработан метод обработки каллиграфической информации, представленной в виде рукописных символов, основанный на алгоритмах автономного и оперативного распознавания, отличающийся введением алгоритмов сравнения и оценки каллиграфических символов с эталоном;

разработана математическая модель оценки рукописных символов в процессе написания, основанная на самообучающемся адаптивном рандомизированном алгоритме стохастической оптимизации, отличающаяся наличием расчета численной оценки сравнения каллиграфических символов с эталоном;

предложен алгоритм обработки рукописных образов в режиме реального времени, позволяющий оценить качество каллиграфии, скорость письма и прогресс выполнения упражнений;

формализована база данных специальных адаптивных упражнений для обучения письму, коррекции почерка, тренировки и восстановления мелкой моторики рук;

предложен адаптивный алгоритм подбора упражнений из базы данных на основе оценки качества письма для проведения индивидуальной коррекции почерка.
Достоверность научных положений работы подтверждена результатами численных экспериментов с математической моделью, а также экспериментальными исследованиями и опытной эксплуатацией обучающей системы формирования навыков каллиграфии, в ходе которых даны статистические оценки работы системы и применяющихся в ней алгоритмов
(количественные оценки приведены в пунктах «Научная новизна» и «Реализация результатов»).

10

Научная значимость результатов
Для достижения поставленной цели в работе был проведен системный анализ процессов распознавания рукописных символов и обработки заключающейся в них каллиграфической информации, в процессе которого были исследованы существующие алгоритмы распознавания рукописных текстов.
Проведенный анализ показал, что для обработки каллиграфической информации рукописных текстов может быть использован рандомизированный алгоритм стохастической оптимизации [9, 10]. Он был положен в основу математической модели для обучающей системы, позволяющей проводить обработку, визуализацию и преобразование каллиграфической информации и формировать навыки каллиграфии на основе адаптивных методов обучения с применением специальной библиотеки упражнений. Проведена разработка математического и алгоритмического обеспечения для этой системы.
Современные системы оптического распознавания имеют более низкую точность распознавания символов для рукописных текстов по сравнению с печатными текстами, из-за сложности их структурных характеристик, включая каллиграфию. Поэтому еще одной актуальной задачей, решенной в работе, было повышение точности обработки рукописных текстов при одновременном снижении потерь качества и данных.
Положения, выносимые на защиту:

математическая модель оценки рукописных символов в процессе написания, основанная на самообучающемся адаптивном рандомизированном алгоритме стохастической оптимизации.

алгоритм обработки рукописных образов в режиме реального времени, позволяющий оценить качество каллиграфии, скорость письма и прогресс выполнения упражнений.

библиотека специальных адаптивных упражнений для обучения письму, коррекции почерка, тренировки и восстановления мелкой моторики рук.

11


адаптивный алгоритм подбора упражнений на основе оценки качества письма для проведения индивидуальной коррекции почерка.
Практическая значимость полученных результатов
Разработанная система оценки каллиграфии может применяться в различных сферах деятельности: для обучения базовым навыкам письма, совершенствования каллиграфии, как одно из вспомогательных средств для обучения русскому и иностранным языкам, для восстановления нарушенного почерка в сфере восстановительной медицины и других областях.
В перспективе система может быть применена для решения частных прикладных задач, например, для автоматизированной экспертизы почерка, а также для оценки функционального состояния организма и тренировки рук в процессе реадаптации при воздействии гипо- и микрогравитации.
Созданный сенсорный комплекс для оценки каллиграфии позволяет вводить рукописный текст с планшета, КПК и других сенсорных панелей, распознавать введенные символы, анализировать отклонения их написания от эталона и предлагать рекомендации по улучшению почерка и скорости письма. С целью повышения грамотности пользователя в ПО комплекса могут быть введены словари для проверки орфографии и дополнительные алгоритмы для исправления ошибок пунктуации.
Практическую значимость имеют также решения, полученные на этапе разработке сенсорной системы для оценки каллиграфии. В частности, разработанная автором структура базы данных для хранения характеристик начертания символов, пригодная для реализации во всех основных СУБД и классических файловых БД, а также основанная на ней процедура классификации контуров при структурном подходе к распознаванию образов.
Реализация результатов
По результатам опытной эксплуатации системы «Электронная пропись» в учреждениях дошкольного и среднего образования г. Москвы для обучения письму младших школьников было сделано заключение о ее эффективности при

12
обучении письму и тренировке почерка учеников. Экспертные оценки на основании проведенных исследований с использованием экспертных панелей и метода средних арифметических рангов составили от 8,5 до 10 баллов по десятибалльной шкале.
Полученные результаты использованы в обучающем процессе Калужского государственного университета им. К.Э. Циолковского, что позволило разработать перспективные методики постановки руки в процессе обучения письму посредством комплексных упражнений с элементами развития почерка и мелкой моторики рук.
В результате применения комплекса в курсе реабилитации больных после инсульта в центрах восстановительной терапии НИИ цереброваскулярной патологии и инсульта Российского национального исследовательского медицинского университета им. Н.И. Пирогова Минздравсоцразвития России было отмечено достоверное ускорение восстановления мелкой моторики и улучшение показателей высших психических функций пациентов. Вынесено заключение о целесообразности применения системы «Электронная пропись» в комплексной программе реабилитационных мероприятий пациентов с острым нарушением мозгового кровообращения.
Апробация работы была проведена на научных семинарах кафедры проектирования и технологии производства электронной аппаратуры ФГБОУ
ВПО МГТУ им. Н.Э. Баумана (Москва, 2010-2014 гг.), IV Всероссийском конкурсе молодых ученых (Москва, 2012 г.), Третьей международной научно- технической конференции Аэрокосмические технологии (Москва, 2014 г.), Первая международная научная конференция «Научное развитие в европейских странах: новые концепции и современные решения» (Штутгарт, 2013 г.), десятом международном симпозиуме INTELS'2012 (Вологда, 2012 г.), Молодежной научно-технической конференции «Наукоемкие технологии и интеллектуальные системы» (Москва, 2010 г.).
Система «Электронная пропись» зарегистрирована в Роспатенте

13

(Свидетельство о регистрации программ для ЭВМ №2008611676).
Публикации
Основные результаты работы опубликованы в 11 печатных работах, из них две в журналах, рекомендованных ВАК для публикации результатов диссертаций.
Структура и объем работы:
Диссертационная работа состоит из введения, четырех глав, заключения и списка литературы. Общий объем работы 150 страниц, включая 76 иллюстраций, список литературы и приложения. Библиография содержит 67 наименований, из них 4 из иностранных источников.

14

ГЛАВА 1.

АНАЛИЗ МЕТОДОВ И СРЕДСТВ ОБРАБОТКИ
ИНФОРМАЦИИ, ПРЕДСТАВЛЕННОЙ РУКОПИСНЫМИ
СИМВОЛАМИ
1.1.

Актуальность обработки информации, представленной рукописными
образами
Проблему обработки информации, содержащейся в рукописных текстах, чаще всего исследуют как более узкую проблему распознавания текста, применяя для этого методы распознавания образов. Наиболее сложным и малоизученным аспектом работы с рукописными текстами остается обработка имеющейся в них структурной информации, включая каллиграфию.
Каллиграфия в современной методике обучения письму понимается как умение писать четким, устойчивым, удобочитаемым почерком. Следовательно, обработка каллиграфии рукописного текста – это извлечение структурной информации, связанной с начертанием символов в данном тексте и его отклонениями от принятого эталона начертания символов.
Выше было отмечено большое значение обработки рукописных текстов для решения задач обучения письму и восстановления навыков письма. Возрастание доли обмена рукописными текстами, такими как: элементы деловой или служебной переписки, формы страховых и кредитных организаций, журналы и заметки усиливает актуальность исследований в области обработки рукописных текстов. Все это обуславливает необходимость разработки устойчивой системы, позволяющей выполнять оперативное распознавание и интерпретацию рукописных данных и проводить корректировку почерка, тренировку правильного и быстрого письма. Методы анализа и оценки каллиграфии, использующиеся в этой системе, будут также ценны для применения при экспертной оценке почерка, почерковедении и иных областях.
Системный подход, используемый при распознавании рукописных образов.
В общем виде систему распознавания рукописных данных можно представить в

15
виде трех подсистем (Рисунок 1.1): подсистемы извлечения признаков, непосредственно подсистемы распознавания и подсистемы принятия решения, к какому классу относится данный объект.
Рисунок 1.1. Система распознавания рукописной информации
Разработка системы ввода текста, еѐ тестирование и отладка, невозможна без создания базы данных символов, в общем случае состоящей из следующих частей:

неконфликтные символы (отличающиеся по форме написания) в хорошем исполнении;

конфликтные символы в хорошем исполнении;

символы с нарушенными требованиями к качеству написания.
Открытых баз практически не существует, поэтому при разработке системы ввода рукописного текста приходится создавать и наполнять собственную базу символов.
Для достижения наиболее высокой скорости и качества распознавания используется несколько классификаторов работающих параллельно. Первый

16
производит быстрое распознавание с большим количеством гипотез, второй работает более медленно и производит более точную оценку обнаруженных сомнительных символов.
Система ввода обычно реализуется в виде программно-аппаратного комплекса, выполняющего следующие функции: считывание рукописного текста; распознавание вводимых символов; формально-логический и словарный автоматический контроль распознанной информации; возможность ручная верификация данных; запись обработанной информации в необходимом формате и ее хранение.
1.2.

Классификация систем распознавания рукописных образов
Классификация по методам распознавания. Классификация методов распознавания может базироваться на разных принципах, и поэтому классификации разных авторов могут существенно отличаться друг от друга. На
Рисунке 1.2 рассмотрен один из вариантов, учитывающий направления классификации по распознаванию отдельных символов и распознаванию наборов символов.
Рисунок 1.2. Методы распознавания рукописных данных

17

Классификация с учетом аппарата обработки данных. Все системы распознавания рукописных образов можно разделить с учетом аппарата обработки данных на несколько подгрупп в соответствии с используемыми методами, как приведено в Таблице 1.
Таблица 1.
Системы, классифицируемые с учетом аппарата обработки данных
Метод
Описание
Преимущество/недостаток
Логические методы
Подгруппа методов применяет алфавит значений признаков, состоящий только из 2х значений: истина и ложь.
Недостаток: использование лишь двух значений.
Преимущество: быстродействие модели.
Аналитические методы
Подгруппа методов применяет систему функций и критериев.
Пример – система, реализующая метод "обобщенного портрета"
Недостаток: отсутствие единого методического подхода к построению аналитической части.
Преимущество: возможность адаптации к используемому виду и размерности данных соответствующих аналитических выражений
Статистические методы
Подгруппа методов применяет инструменты статистики
(математическое ожидание, среднеквадратическое отклонение, и т.д.) для реализации процесса классификации
Недостаток: на результаты классификации влияет качество входной информации.
Преимущество: стабильные положительные результаты классификации при низкой зашумленности входных данных

18

Таблица 1 (продолжение)
Метод
Описание
Преимущество/недостаток
Бионические методы
Персептрон, сети с латеральным торможением и т.д.
Недостаток: проблемы в работе с вариативными образами.
Преимущества: сохранение способности к распознаванию информации при нарушении собственной структуры
(устойчивость к повреждениям); отсутствие необходимости к перебору вариантов.
Классификация с учетом характеристик процесса. Системы так же классифицируются с учетом характеристик процесса распознавания. При данной классификации все системы делятся на несколько подгрупп с учетом одного или нескольких параметров:

время распознавания (или количество шагов метода);

точность полученного результата;

общность получаемых результатов (универсальность метода);

количество и качество признаков, участвующих в реализации метода и т.д.
1.3.

Анализ решений для распознавания рукописных образов
Методы аналогичных случаев. Метод заключается в запоминании всех объектов обучающей выборки. Если системе предъявлен нераспознанный объект
*
x
, то она относит этот объект к тому образу (Рисунок 1.3), чей «представитель» оказался ближе всех к
*
x

19





x

x


Рисунок 1.3. Решающее правило «Минимум расстояния до ближайшего соседа»
Преимуществами метода рассуждений на основе аналогичных случаев являются простота использования полученных результатов, независимость решений от природы исследуемого образа, использование не «верных» решений, а всего лишь лучших из возможных.
Деревья решений
Преимущества использования деревьев решений заключаются в быстром процессе обучения, возможности использования этого метода в трудно формализуемых областях, использовании естественных языков для формулировки правил, высокой точности прогноза, сопоставимой с другими методами
(статистика, нейронные сети) и др. [18].
Недостаток – падение значимость классификации по мере движения до конечного узла.
Генетические алгоритмы
Генетический алгоритм может быть применен для распознавания рукописных символов. Перед его применением последовательно выполняется скелетизация, векторизация и удаление «шпор», разбиение на символы и их распознавание.
На Рисунке 1.6 показано отсканированное изображение, переведенное в однобитовый режим.

20

Рисунок 1.6. Отсканированное изображение в однобитовом режиме
Стадия скелетизации (утончения линий изображения) отличается простотой, быстродействием и дает наименьшее количество «шпор». Если в результате скелетизации образуются «шпоры», то запускается алгоритм удаления
«шпор».
Затем к изображению применяется алгоритм выделения отдельных символов (Рисунок 1.7).
Рисунок 1.7. Результат работы генетического алгоритма
Нейронные сети. Искусственные нейронные сети (ИНС) – это математическая или компьютерная модель, построенная по принципу работы биологических нейронных сетей. Упрощенная модель НС, представлена на
Рисунке 1.8.

Рисунок 1.8. Схема искусственной нейронной сети

21

Применение нейросетевых парадигм для решения какой-либо задачи возможно при следующих условиях:

могут быть представлены примеры решения задачи;

имеется взаимосвязь между входными и выходными данными, т. е. изменения на входе влияют на результат на выходе.
Искусственные нейронные сети являются достаточно эффективным инструментом в решении трудно формализуемых задач с неполной или плохо определенной информацией [19]. Например, для распознавания рукописных
символов. Пример такой сети схематически представлен на Рисунке 1.9.

Рисунок 1.9. Схема двухслойной нейронной сети для распознавания образов
Для обучения сверточной нейронной сети используется алгоритм обратного распространения ошибки. Обучение сети начинается с предъявления образа и вычисления соответствующей реакции. Сравнение с желаемой реакцией дает возможность изменять веса связей таким образом, чтобы сеть на следующем шаге могла выдавать более точный результат [15].
Основные способы обучения [27]:

обучение с учителем (выходное пространство решений нейронной сети известно);

обучение без учителя — нейронная сеть формирует выходное пространство решений только на основе входных воздействий
(самоорганизующиеся сети);

22


обучение с подкреплением — в сети действует система назначения штрафов и поощрений от среды.
В процессе обучения сеть в определенном порядке просматривает обучающую выборку. Один полный проход по выборке называется эпохой
обучения [27].
1.4.

Анализ обобщенной модели информации, представленной
совокупностью рукописных образов
Базовые образы единичных символов. База символов – одна из основных частей системы распознавания рукописных текстов (см. выше Рисунок 1.1 раздела
1.1). Представление символов в такой базе зависит от способа распознавания рукописного образа. Различные способы распознавания можно свести к трем типам: шаблонный, признаковый и структурный и множеству их вариантов [24].
Соответственно этим трем типам распознавания выделяются три общих способа построения базы символов.
В системах, использующих шаблонный способ, база символов является базой растровых шаблонов. Схема процесса распознавания иллюстрируется
Рисунком 2.1.

Рисунок 2.1. Выделение признаков образа

23

В системах, основанных на структурном способе, в базе данных хранится векторно-графовое представление символа. Распознаваемый символ подвергается процедуре скелетизации (утоньшению). Каждый полученный контур скелетного представления описывается в виде последовательного набора особых точек и
«цепного» кода.
Таким образом, базой символов в этом способе фактически является база
точек с координатами.
Существует также структурно-пятенный или «фонтанный» (от английского font — шрифт) метод распознавания, представляющий собой оригинальный вариант структурного способа. Образ в базе эталонов представляется в виде пятен, связанных парными отношениями.
В системах, использующих признаковый способ, база данных символов может рассматриваться, как база n-мерных векторов признаков.
Для разрабатываемого в данной работе программно-аппаратного комплекса используется метод оперативного распознавания, описанный ниже в разделах 2.6 и 2.7. Распознаватель в этом методе работает не с изображением как таковым, а с его признаками, представленными в виде n-мерного вектора свойств. Для построения базы символов используется признаковый способ.
Система способна к адаптации, за счет того, что в процессе распознавания центр кластера изменяется с учетом случайного возмущения, зависящего от конкретных условий распознавания. При этом алгоритм распознавания производит перенастройку (адаптацию) с учетом нового положения центра кластера.
Особенности обработки групповых образов. Распознавание упорядоченных наборов объектов (например, слов) имеет существенные отличия по сравнению с распознаванием отдельных символов (букв). Применяется схема, состоящая из следующих этапов:

Последовательность сегментируется на индивидуальные объекты по специфическим алгоритмам сегментации.

24


Каждый индивидуальный объект распознается одним из методов.

Результаты распознавания индивидуальных объектов сводятся в единый результат последовательности в целом по специальным правилам.
Первый и второй этапы данной схемы описаны в разделах 2.2 – 2.5. В данном разделе рассматривается только последний шаг распознавания и его взаимодействие с предыдущими двумя.
Метод адекватен только при распознавании случайной последовательности объектов. В задачах распознавания рукописного текста последовательности не случайны, а кроме того, еще и плохо разделимы. Для распознавания таких последовательностей наиболее всего удобно применение двух методов: скрытой
марковской модели (HMM, Hidden Markov Model) и метода графов. Для того чтобы не перебирать все варианты можно воспользоваться методом динамического программирования, например, алгоритмом Витерби.
Для обучения рассматриваемой скрытой марковской модели метод максимизации правдоподобия, т.е. находят максимум



n
X
P
X
P
i
i
1
}
{
}
{
, варьируя P.
Лучшего распознавания можно добиться, интегрируя марковские модели друг с другом или с нейронными сетями.
Для распознавания рукописных текстов, неоднозначно представимых в виде последовательностей простых объектов (частичный порядок), может быть применено распознавание графов.
Распознавание графов может осуществляться для двух случаев:
1)
в системе с распознавателем отдельных букв. При этом в такой системе лишь дополнительно разрабатывается способ разрешения неоднозначностей и ошибок сегментации; и
2)
в системе без отдельного распознавателя букв.
Особенности языковой локализации при обработке групповых образов. При обработке групповых образов построение и использование словаря имеет

25
специфические особенности. Можно рассмотреть их на примере использования скрытых марковских моделей. Чтобы распознавание слитных образов (слов, целого текста) было эффективным и качественным, модель должна включать в себя эталоны символов и базу данных слов. Нередко сегментатор, т.е. алгоритм, превращающий распознаваемый рукописный текст в последовательность символов из некоторого фиксированного пространства, отчасти встраивают в саму модель.
Одновременное распознавание слитной рукописной речи и языка, на котором написан распознаваемый текст возможно ввиду использования в системе распознавания текста структурированного словаря данного языка.
В процессе распознавания на этапе обращения к словарю задача выбора алгоритма распознавания может быть сведена к поиску кратчайшего пути в некотором графе и решена методом динамического программирования. Задача определения слова сводится к первой, если при сегментировании получено небольшое количество способов распознавания с ненулевой вероятностью. В этом случае выбор наиболее вероятных гипотез о значении распознаваемого слова будет достаточно прост. Задача оптимизации весовых коэффициентов для слов в базе данных похожа на обучение нейронных сетей и хорошо изучена.
Обобщенный алгоритм обработки информации, представленной совокупностью рукописных образов. Непосредственное распознавание – это сравнение выделенных областей изображения с имеющимися эталонами символов и проверка результата на допустимость.
Основное преимущество метода сравнения векторов от метода наложения состоит в том, что он учитывает совпадение распознаваемого символа и эталона по ключевым моментам (признакам символа), а не по его графической интерпретации (Рисунок 2.4). Поэтому вероятность того, что сравнение одного и того же символа с разными эталонами даст одинаковую степень совпадения намного меньше чем у алгоритмов сравнения печатных символов.

26

Рисунок 2.4. Графическая интерпретация символа
Для рукописного текста метод наложения эталонов практически неприменим, так как вариантов написания символа, его наклон и искажение может существовать бесчисленное множество. В системах распознавания рукописного текста используется сравнение только с векторными объектами и их связями между собой.
Для хранения описаний изображений символов можно использовать не визуальный объект TStringList, позволяющий легко работать со списком значений произвольной длины. Принятый формат хранения значений координат при этом выглядит так:
StringList[I]
=
IntToStr(Top)+','+IntToStr(Bottom)+
','+IntToStr(Left)+
','+IntToStr(Right);
То есть каждая строка списка – это координаты верхней, нижней, левой и правой границы изображения символа, разделѐнные запятой. После выделения символов из списка удаляются описания ранее выделенных строк.
1.5.

Постановка задачи обработки информации рукописных текстов в
свете разрешения противоречий процессов формирования навыков
каллиграфии
Выбор и использование рассмотренных выше методов для обработки информации, представленной в рукописных текстах, определяется качественными характеристиками и сложностью этой информации. Для этого необходимо

27
исследовать саму информацию и связанные с ней процессы методами системного анализа и обработки информации.
Применение такого подхода к исследованию процессов обучения письму и восстановления нарушенных навыков письма, рассматриваемых как сложные системы, позволяет выявить системные противоречия, заключенные в данных процессах.
Первое противоречие касается системной организации процесса обучения письму (Рисунок 1.10).

Рисунок 1.10. Карта системных противоречий, связанных с обучением письму
Для повышения эффективности процесса обучения требуется введение обратной связи на уровне ученика, то есть самоконтроль. Однако при использовании обычных педагогических методов несформированность детской психосоматики становится препятствием для введения такой связи (метод должен остаться простым, применение сложных методов невозможно). Поэтому учитель вынужден практически полностью контролировать процесс обучения письму. Это приводит к развитию у обучаемых негативных реакций (скука, быстрое развитие утомления и т.п.) и падению заинтересованности в приобретении новых знаний.
Второе противоречие связано с процессом оценки нарушений каллиграфии у больных (Рисунок 1.11).

28


Рисунок 1.11. Карта системных противоречий, связанных с восстановлением навыков письма
Необходимо создать стандартный, пригодный для использования у большинства больных, метод реабилитации нарушенных функций руки, который одновременно позволял бы разработать индивидуальный комплекс упражнений для каждого больного с учетом специфики его патологии. Однако при использовании средств восстановления письменной речи, принятых сейчас в реабилитационной терапии, невозможно одновременно достичь цели стандартизации метода и индивидуализации лечения. Методы лечения оказываются либо стандартными, но слишком упрощенными, либо индивидуализированными, но чересчур трудоемкими и сложными.
Дополнительным препятствием служит невозможность точной оценки восстановления нарушенных функций при использовании рутинных средств медицинской диагностики.
Разрешение обоих противоречий может быть найдено на пути создания и применения упомянутой выше специальной обучающей системы (программно- аппаратного комплекса) и библиотеки упражнений для обучения и совершенствования навыков письма и восстановления мелкой моторики рук
(Рисунок 1.12).

29

Рисунок 1.12. Разрешение противоречий процессов формирования навыков каллиграфии
Обучающая система позволит ввести обратную связь на уровне ученика, нивелируя возрастное несовершенство функции самоконтроля, а также даст возможность индивидуализировать процессы обучения и реабилитации.
Задача обработки информации, содержащейся в рукописных символах, с применением обучающей системы в настоящей работе решена для текстов, построенных на основе славянской и иероглифической письменности. Этот результат важен, поскольку адаптация известных моделей распознавания английской речи в данном случае невозможна [22].
Операция обработки вводимого рукописного текста производится в две стадии. На первом этапе производится приведение исходного изображения к
универсальному векторному виду. Для этого необходимо выполнить следующие преобразования, приводящие к инвариантному представлению данных:

приведение изображения к серой шкале;

приведение изображения к черно-белому виду;

анализ и удаление шумов на изображении не относящихся к тексту;

скелетизация черно-белого изображения;

векторизация изображения;

30


выделение слов на изображении;

выделение строк.
На этом же этапе решается задача сегментации вводимого рукописного текста на основе структурного подхода [23], который предполагает описание сложных объектов с помощью более простых подобъектов.
Целью второго этапа является классификация изображения. Задача классификации состоит в указании принадлежности входного образа одному из предварительно определенных классов, то есть, сравнение векторного представления (описания) введенного рукописного символа с векторным представлением (описанием) символа-эталона в базе данных.

31

Выводы по главе 1
В первой главе были введены понятия процесса обработки информации рукописных символов, процесса распознавания, дано определение каллиграфии, рассмотрены основные функции систем распознавания, введены математические обозначения и характеристики, определяющие эффективность распознающих систем.
Проведено исследование методов визуализации, трансформации и анализа графических образов в реальном времени. Составлена классификация методов распознавания графических образов. Все системы распознавания образов можно классифицировать по трем основным группам:

по методам распознавания;

с учетом аппаратной обработки данных;

с учетом характеристик процесса распознавания.
Основными методами, применяемыми для распознавания образов, являются:

предметно-ориентированные экспертно-аналитические системы

статистические пакеты

системы рассуждения на основе аналогичных случаев

деревья решений

генетические алгоритмы

нейронные сети
Так же были определены основные противоречия процессов обучения письму и восстановления нарушенных навыков письма, что позволило поставить задачу обработки рукописных текстов в аспекте формирования навыков каллиграфии и указать основной путь разрешения вскрытых противоречий.

32



Поделитесь с Вашими друзьями:
  1   2   3   4   5   6   7


База данных защищена авторским правом ©nethash.ru 2017
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал