Распознавание образов Проектирование системы распознавания Лингвистическое обеспечение асоиу



Скачать 391.6 Kb.
Pdf просмотр
Дата07.04.2017
Размер391.6 Kb.
Просмотров353
Скачиваний0
ТипАнализ

Распознавание образов
Проектирование системы
распознавания
Лингвистическое обеспечение АСОИУ
Зеленцов И.А.

Содержание

Анализ предметной области: распознавание скорописных текстов;

Разработка метода распознавания;

Проектирование системы:

Структура системы;

Представление знаний;

Схема функционирования.

Распознавание скорописных
текстов

В настоящее время существуют системы, осуществляющие распознавание машинопечатных текстов (например, ABBYY
FineReader, Cunei Form).

Распознавание рукописного текста является более сложной задачей и в достаточно полной мере на сегодняшний день не решена.

В применении к распознаванию текста можно говорить о двух принципиально разных подходах:

онлайн-распознавание — процесс распознавания ведётся параллельно с процессом синтеза изображения;

оффлайн-распознавание — распознавание производится на уже сформированном изображении.

Онлайн-задача является более простой в решении, и сегодня реализовано достаточное количество приложений, осуществляющих онлайн-распознавание рукописного текста.

Оффлайн-распознавание рукописи реализовано лишь отчасти, в виде специальных приложений.


На вход подаётся растровое изображение текста.

Требуется определить его кодированное электронное представление, т.е. произвести его перевод из растрового графического представления в текстовое.

Каждый фрагмент исходного изображения, соответствующий букве, должен быть отнесён к одному из классов букв, набор которых задаётся известным алфавитом.

Выходное текстовое представление рукописи должно содержать весь набор букв, представленный в исходном изображении, в соответствующем порядке их следования.

Задача распознавания текста является задачей множественного распознавания изображений букв текста.
Задача распознавания текста


В текстах, полученных типографским способом:

буквы располагаются в ровных строках, имеют одинаковое начертание в пределах всего документа, имеют достаточно четко различимые промежутки между собой.

эта информация позволяет использовать допущения, снижающие сложность алгоритмов и методов распознавания.
Машинопечатные и скорописные тексты буквы располагаются в ровных строках


В рукописных текстах, и особенно в скорописных, присутствует множество особенностей, связанных с процессом синтеза текста.

Назначением скорописи является быстрое нанесение текста на бумагу.

Велика вариативность начертания букв и они часто связываются соединительными линиями, строки не располагаются на ровных горизонталях, могут встречаться помарки и кляксы.

Поскольку буквы часто имеют соединительные линии и могут иметь случайные пересечения, задача распознавания расширяется необходимостью выделения отдельных букв в изображении перед их распознаванием.
Машинопечатные и скорописные тексты

Особенности скорописи

Вариативность начертания символов элемент выведен не точно, с отклонениями;
отсутствует предполагаемое пересечение элементов;
присутствует лишнее пересечение (например, с другой буквой);
элемент дополнен декоративным сегментом;
добавлен декоративный элемент;
добавлен соединительный штрих;
дефект начертания (пробельный участок);
изменены относительные размеры и положение элементов.

Разработка метода распознавания

Анализ существующих методов распознавания применительно к рассматриваемой предметной области;

Выработка проектных решений.

Анализ методов распознавания
Вид правил классификации

параллельные — проведение ряда тестов над всей совокупностью выявленных данных об объекте и принятие решения на основе их результатов;

последовательные
— проведение последовательности тестов над подмножествами выявленных данных; выбор очередного теста определяется результатами предыдущих тестов.

Параллельные процедуры требуют выделения распознаваемого символа из общего изображения;

В случае скорописи это представляет собой проблему;

Вывод: выбор в пользу последовательной процедуры.

Анализ методов распознавания
Способ описания объектов
Евклидово пространство объекты представляются в виде набора измерений;
списки
признаков
— выявление качественных характеристик объектов;
структурное описание — выявление структурных элементов объектов и определение их взаимосвязи.
Методы, использующие Евклидово пространство и списки признаков, в основном предполагают параллельную процедуру классификации;
Структурные методы позволяют целенаправленно перемещаться по изображению символа, попутно выявляя его границы.
Вывод: выбор в пользу структурного подхода.

Анализ методов распознавания
Предъявление обучающих выборок

фиксированная выборка – построение правил классификации по единственному обучающему множеству;

последовательная выборка – коррекция правила классификации с каждой новой предъявляемой выборкой (самообучение, автоподстройка).

В скорописи множество распознаваемых объектов в общем известно — это набор символов алфавита.

Набор слов также в принципе известен (при использовании словаря).

Однако, сложно полностью предусмотреть все возможные вариации .

Вывод: возможно использование фиксированной выборки с возможностью оффлайн-коррекции.

Выработка проектных решений

Структурный подход:

Использование трассировки линий для выявления структурных элементов символов;

Сопоставление получаемой информации со структурными описаниями объектов в памяти системы;

Использование нечёткости в описании структурных элементов и их взаимоотношений:

Преодоление вариативности и неточности начертания символов;

Принцип распознавание под управлением гипотез:

Выдвижение гипотез о наблюдаемом фрагменте изображения;

Их проверка на основе имеющихся описаний предполагаемых символов;

Обход случайных и декоративных элементов.

Использование словника для упрощения задачи;

Экспертный подход.

Проектирование системы
Структура системы
Распознаватель
Распознаватель букв
Распознаватель слов
Буква
Гипотеза
Трасси- ровщик
База знаний
Структура букв
Структура слов и словник
Обучающий модуль
Эксперт
Слово
Гипотеза
Элемент
Данные
Данные
Данные
Знания
Вопрос
Ответ
Входное изображение
Выходной документ

Представление знаний

В качестве метода представления знаний целесообразен выбор фреймовых сетей:

Позволяют описывать сложные структурные взаимоотношения элементов распознаваемых объектов;

Хорошо согласуются с методом проверки гипотез.

Структура базы знаний

Узел
Детализируемый
Узел
Элемент
Вхождение
Свойства
Вхождение
Отношения
Вхождение
Элемента
Слово строка
Буква код детализирует включает вхождение индицирует
Общая терминология

Элемент
Точка
Линия
Принадлежность
Точки
Соответствие
Точек соответствующая точка точка принадлежит линии индицирует точку
Вхождение элемента
Вхождение точки
Вхождение линии
Вхождение отношения индицирует линию
Описание букв

Вхождение элемента
Вхождение отношения
Пространственное
Отношение
Больше-
Меньше-Гор
Слева-Справа
Выше-Ниже
Больше-
Меньше-Верт больший меньший слева справа выше ниже больший меньший
Пространственные отношения

γ
1
y x
γ
2
|Δγ|,
o
0
К
Н0
μ
Н
К
Н1 1
Путь линии

W
H
α
=
arctg
H
W

|Δα|,
o
0
К
Ф0
μ
Ф
K
Ф1 1
Форма линии

W
dw
H
dh
N =
dh
H
M =
dw
W
|ΔN|,
o
0
К
ВП0
μ
ВП
K
ВП1 1
|ΔM|,
o
0
К
ГП0
μ
ГП
K
ГП1 1
Положение точки пересечения

Вхождения для буквы
Вхождения для буквы
Элементы букв
Пример структурного описания букв

<
owl:Class rdf:ID
=
"Word"
>
<
rdfs:subClassOf rdf:resource
=
"#DetalizedFrameNode"
/>
owl:Class
>
<
owl:DatatypeProperty rdf:ID
=
"word"
>
<
rdfs:domain rdf:resource
=
"#Word"
/>
<
rdfs:range rdf:resource
=
"&xsd;string"
/>
owl:DatatypeProperty
>
Пример описания фрейма на языке
OWL

<
owl:Class rdf:ID
=
"LineEntry"
>
<
rdfs:subClassOf rdf:resource
=
"#FeatureEntry"
/>
owl:Class
>
<
owl:ObjectProperty rdf:ID
=
"indicatesLine"
>
<
rdfs:domain rdf:resource
=
"#LineEntry"
/>
<
rdfs:range rdf:resource
=
"#Line"
/>
<
rdfs:subPropertyOf rdf:resource
=
"&dfrm;indicatesElement"
/>
<
owl:inverseOf rdf:resource
=
"#indicatedByLineEntry"
/>
owl:ObjectProperty
>
Пример описания фрейма на языке
OWL

Библиотека Jena

Позволяет манипулировать онтологиями на языке OWL;

Онтологии представляются объектами класса OntModel;

Создание экземпляра в онтологии:

OntModel ont = ...;

Individual i = ont.createIndividual (
ont.createResource ("<имя_класса>");

Задание значения свойства:

i.setPropertyValue (
ontology.getProperty ("<имя_свойства>"), j);

Получение значения свойства:

Individual j = (Individual) i.getPropertyValue (
ont.getProperty ("<имя_свойства>")).
as(Individual.class);


Процедура предобработки — истончение изображения;

Внутренняя модель — граф точек пересечения и тонких сегментов.
Трассировка линий
Вертикальная линия

Формат запроса:

Прямоугольная область поиска;

Точка начала поиска;

Направление поиска;

Форма линии;

Путь линии.
Формат ответа:

Признак результата;

Набор точек, составляющих найденную линию;

Форма найденной линии;

Путь найденной линии;

Список точек, в которых данная линия пересекается другими.
Трассировка линий
a
б в
V
База знаний
Динамическая память
Фреймы букв
Вхождения свойств
Элементы
Найденные вхождения свойств
Виртуальный фрейм
Виртуальный фрейм
a
б в
V
Выдвижение гипотез
a
б
V
H1
H2
Представление гипотез


Мински М. Фреймы для представления знаний. Пер. с англ. 1979.

Павлидис Т. Алгоритмы машинной графики и обработки изображений --- М.:Мир, 1982.

Крылов А.Б. Способ выбора растровых объектов на монохромном изображении с автоматическим вычислением геометрических параметров // Интеллектуальные технологии и системы: сборник статей аспирантов и студентов / Под ред. Ю.Н.Филипповича —
М.:МГУП, 2001. — Вып. 3.

http://www.w3.org/standards/techs/owl - стандарт языка OWL.

http://jena.sourceforge.net/ - библиотека Jena.

http://owlapi.sourceforge.net/ - библиотека OWL API.

http://protege.stanford.edu/ - редактор онтологий Protégé.

http://www.semantictools.ru/ - сайт, посвящённый технологиям
Semantic Web.
Материалы

Каталог: Education -> Course -> Lingvistika -> Lecture
Education -> Xen. Но в недрах системы скрыта другая, столь же продви- нутая технология, о которой вы наверняка уже слышали
Lecture -> Лекция №6 Лингвистическое обеспечение асоиу к т. н., доцент Филиппович Анна Юрьевна Системы оптического
Course -> Лекции по дисциплине "искусство шрифта" Для студентов
Course -> Лекции по дисциплине "искусство шрифта" Для студентов
Course -> Лекции по дисциплине "интегрированные системы и технологии в медиаиндустрии" Для студентов


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©nethash.ru 2019
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал