Математические модели, вычислительные методы



Скачать 106.52 Kb.
Pdf просмотр
Дата24.02.2017
Размер106.52 Kb.
Просмотров297
Скачиваний0

Информационные процессы, Том 15, № 2, 2015, стр. 207–214
c
⃝ 2015 Диаз-Эскобар, Кобер, Карнаухов.
МАТЕМАТИЧЕСКИЕ МОДЕЛИ, ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ
Распознавание символов на искаженных изображениях с использованием морфологической и фазовой фильтраций
Х. Диаз-Эскобар

, В.И. Кобер
∗∗
, В.Н. Карнаухов
∗∗

Департамент Компьютерных наук, Центр Научных исследований и высшего образования,
Энсенада, 22860
∗∗
Институт проблем передачи информации, Российская академия наук, Москва, 127051, Россия
Поступила в редколлегию 22.5.2015
Аннотация—В настоящее время активно разрабатываются новые алгоритмы для оптиче- ского распознавания символов для мобильных устройств. Большинство этих алгоритмов работают хорошо с документами, оцифрованными в идеальных условиях. При исполь- зовании мобильных устройств изображения документов подвержены различным искаже- ниям, таким как неравномерное и плохое освещение, геометрические искажения, плохое разрешение, сенсорные шумы. В данной работе мы предлагаем надежный метод распозна- вания контекстуально-несвязанных символов на искаженных изображениях документов с использованием банка адаптивных морфологических и фазовых фильтров. С помощью компьютерного моделирования проведено сравнение результатов работы традиционных и предлагаемого подходов для обнаружения и классификации символов латинского алфа- вита на искаженных изображениях.
КЛЮЧЕВЫЕ СЛОВА: распознавание символов, фазовая фильтрация, морфологическая корреляция.
ВВЕДЕНИЕ
В последние годы популярность мобильных устройств (гаджетов) стремительно растет.
Бурный рост количества мобильных устройств вызвал большой рост количества различных приложений для них, в том числе тех, которые использует оптическое распознавание симво- лов. В настоящее время многие алгоритмы распознавания, предлагаемые и используемые в таких популярных коммерческих системах, как ABBYY (http://www.abbyy.com), Tesseract [1],
OCRopus [2], и др., обычно работают с “идеальными” и специально отформатированными дан- ными, обеспечивающими высокую производительность. Изображения, получаемые в реальных мобильных устройствах, обычно регистрируются в реальных, а не в идеальных условиях съем- ки. По этой причине качество изображений часто оказывается низким из-за наличия геометри- ческих искажений, неоднородности освещения, низкого разрешения, шума регистратора и т.д.
Эти эффекты существенно влияют на производительность систем оптического распознавания символов [3]–[5].
Одной из основных проблем в системах распознавания является неоднородность освеще- ния. Большинство систем распознавания символов используют бинарные изображения, теряя важную информацию в процессе бинаризации. Кроме того, корректная сегментация символов становится практически невозможной. Системы, основанные на выделении признаков, такие как метод K-средних, метод главных компонент, метод опорных векторов, нейронные сети, ме- тод глубокого обучения и т.д., часто используются для распознавания символов. Тем не менее,
такие системы зачастую упускают из анализа некоторую важную информацию при расчете признаков символов и, следовательно, дают ошибки классификации. Кроме того, нейронные

208
ДИАЗ-ЭСКОБАР, КОБЕР, КАРНАУХОВ
сети и метод глубокого обучения требуют сложной многоуровневой структуры и нуждаются в длительном обучении с использованием наборов образцов [6]–[14].
В этой работе мы используем банк адаптивных нелинейных композитных фильтров и фа- зовых фильтров для обнаружения и классификации символов. Предлагаемый подход основан на пороговой декомпозиции, инвариантной к освещению, морфологической корреляции и мо- дификации фазового фильтра. Адаптивные композитные фильтры синтезируются, используя информацию из набора обучающих изображений. Заданный уровень дискриминации для этих фильтров обычно достигается на стадии итерационного обучения. В статье также представле- ны результаты компьютерного моделирования, полученные с помощью предлагаемой системы.
Статья организована следующим образом: в разделе 1 описана предлагаемая система опти- ческого распознавания символов, в разделе 2 представлены полученные результаты компью- терного моделирования и раздел 3 суммирует наши выводы.
1. ПРЕДЛАГАЕМАЯ СИСТЕМА ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ
Предлагаемая система работает в два этапа: предобработка и распознавание.
Предобработка
Вначале мы используем нерезкое маскирование для повышения локального контраста меж- ду передним планом и фоном. Затем, для подавления смеси аддитивного и импульсного шума во входной сцене используется ранговая фильтрация [15]–[19]. Наконец, для коррекции осве- щенности входная сцена локально нормализуется в пределах скользящего окна W малого раз- мера, тогда сигнал в окне можно считать равномерно освещенным. Обозначим исходную сцену
– S(⃗
x), эталонный объект – T (⃗
x), тогда откорректированная сцена ˆ
S(⃗
x) вычисляется как
ˆ
S(⃗
x) = a(⃗
x)S(⃗
x) + b(⃗
x),
(1)
где ⃗
x = (x
1
, x
2
) – координаты во входной сцене, a(⃗
x) и b(⃗
x) – локальные коэффициенты норма- лизации, учитывающие локальную освещенность и смещение сигнала в точке с координатами

x. Коэффициенты, оптимальные относительно средней квадратичной ошибки, задаются сле- дующими выражениями [20]:
a(⃗
x) =


n
∈W
T (⃗
n)
· ˆ
S(⃗
n + ⃗
x)
− |W | · ¯
T
· ¯
S(⃗
x)


n
∈W
[ ˆ
S(⃗
n + ⃗
x)]
2
− |W | · [ ¯
S(⃗
x)]
2
,
(2)
b(⃗
x) = ¯
T
− a(⃗x) ¯
S(⃗
x),
(3)
где ¯
T и ¯
S(⃗
x) – средние значения сигнала объекта и сигнала сцены в локальном окне W в точке с координатами ⃗
x, соответственно.
Распознавание
Второй этап обработки – распознавание. Цель этого этапа состоит в том, чтобы распо- знать символы и вычислить координаты каждого символа на изображении документа. Чтобы добиться этого, мы предлагаем использовать нелинейный фильтр синтетических дискрими- нантных функций (NSDF) и морфологическую корреляцию.
В соответствии с концепцией пороговой декомпозиции [21] полутоновое изображение S(⃗
x),
имеющее Q уровней квантования, можно представить в виде суммы бинарных срезов
{S
q
(⃗
x), q =
ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
ТОМ 15
№ 2 2015

РАСПОЗНАВАНИЕ СИМВОЛОВ НА ИСКАЖЕННЫХ ИЗОБРАЖЕНИЯХ
209 1, . . . , Q
− 1} следующим образом:
S(⃗
x) =
Q
−1

q=1
S
q
(⃗
x).
(4)
Пусть
{T
i
(⃗
x), i = 1, . . . , N
} – N полутоновых обучающих изображений, принадлежащих к истинному классу объектов распознавания. NSDF фильтр может быть записан следующим образом [20],[22]:
H
N SDF
(⃗
x) =
Q
−1

q=1
N

i=1
T
q i
(⃗
x),
(5)
где
N

i=1
– пересечение между N бинарными плоскостями, а
{T
q i
(⃗
x), q = 1, . . . , Q
−1; i = 1, . . . , N}
– бинарные изображения, полученные с помощью пороговой декомпозиции из соответствую- щих обучающих изображений
{T
i
(⃗
x), i = 1, . . . , N
}.
С другой стороны, известно, что при определенных условиях минимизация средней абсо- лютной ошибки E(⃗
x) между входным изображением S(⃗
x) и сдвинутой версией объекта T (⃗
x) в точке с координатами ⃗
x:
E(⃗
x) =


n
∈W
|S(⃗x + ⃗n) − T (⃗x)| =


n
∈W
S(⃗
x + ⃗
n) +


n
∈W
T (⃗
x)
− 2


n
∈W
min (S(⃗
x + ⃗
n), T (⃗
n)),
(6)
эквивалентна максимизации последнего члена уравнения (6) – нелинейной корреляции между ними [23] и, в соответствии с пороговой декомпозицией, нелинейная корреляция может быть вычислена как
C(⃗
x) =


n
∈W
Q
−1

q=1
[S
q
(⃗
x + ⃗
n)
∩ T
q
(⃗
n)],
(7)
где
{S
q
(⃗
x), q = 1, . . . , Q
− 1} и {T
q
(⃗
x), q = 1, . . . , Q
− 1} являются бинарными изображениями,
полученными из полутоновых изображений входной сцены и объекта, соответственно, и
∩ –
пересечение между двумя бинарными плоскостями.
Наконец, выполняется нелинейная корреляция и нормализуется коэффициентом u
¯
t
. Здесь u
– предварительно определенное значение выхода коррелятора для каждого обучающего изоб- ражения и ¯
t =


n
∈W
H
N SDF
(⃗
n)), где H
N SDF
(⃗
n) - синтезированный фильтр синтетических дис- криминантных функций из N полутоновых обучающих изображений объекта. Окрестность W
берется как пересечение между областями определения всех обучающих изображений [20], [22].
Существует компромисс между количеством обучающих изображений, используемых для синтеза фильтра, и качеством работы фильтра. Для решения этой задачи, предлагается ис- пользовать многоуровневый банк фильтров. На каждом уровне символы делятся на k классов,
и для каждого класса синтезируется нелинейный дискриминантный фильтр. Фильтры синте- зируются таким образом, чтобы в местах локализации символов на выходе системы получались резкие корреляционные пики, при этом в фоновой области выходные значения системы долж- ны быть близкими к нулю. Для синтеза фильтров использовался адаптивный итерационный алгоритм [24]. Этот алгоритм позволяет подавить ложные корреляционные пики для данного класса фонов.
ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
ТОМ 15
№ 2 2015

210
ДИАЗ-ЭСКОБАР, КОБЕР, КАРНАУХОВ
Дискриминационная способность (DC) используется для оценки способности фильтра к распознаванию заданного объекта среди других объектов. DC формально определяется сле- дующим образом [25]
DC = 1

|C
b max
|
2
|C
t max
|
2
,
(8)
где C
b max и C
t max
– максимальные значения в корреляционной плоскости по области фона и цели, соответственно.
Для повышения эффективности распознавания будем использовать также дуальный объ- ект [26]. Пусть
{T
i
(⃗
x), i = 1, . . . , N
} – набор N полутоновых обучающих изображений, исполь- зуемых для синтеза фильтра H
N SDF
(⃗
n). Вычислим дуальный фильтр H
N SDF dual
(⃗
n), исполь- зуя пороговую декомпозицию,
H
N SDF dual
(⃗
n) =
Q
−1

q=1
N

i=1
T
q duali
(⃗
n) при T
q duali
(⃗
n) = 1
− T
q i
(⃗
n), ⃗
n
∈ W, q = 1, . . . , Q − 1. (9)
Зададим дуальный объект следующим образом:
H
2Ldual
(⃗
n) =
{
255,

n
∈ RS
0,
в противном случае,
где RS – область определения H
N SDF
. Далее, вычислим нелинейные корреляции, используя уравнение (7) для H
2L
(⃗
n) и H
2Ldual
(⃗
n). Известно, что при некоторых предположениях [26],
максимизация разницы между двумя морфологическими корреляциями эквивалентна мини- мизации E(⃗
x) в уравнении (6).
Так как некоторые символы алфавита очень похожи, то эффективность их распознавания с помощью нелинейных дискриминантных фильтров невысока. В этих случаях предлагает- ся использовать другой подход, основанный на маскировании нулем спектральных компонент фазовых фильтров [27]. Предположим, что входная сцена является вещественной и содержит объект распознавания t(⃗
x) и ложный объект b(⃗
x). Уравнение (8) может быть записано в сле- дующем виде:
DC = 1

2
+


−∞
+


0
|B(⃗u)| cos[∆φ(⃗u)]d⃗u
2 2
+


−∞
+


0
|T (⃗u)|d⃗u
2
,
(10)
где B(⃗
u) и T (⃗
u) – преобразования Фурье b(⃗
x) и t(⃗
x), соответственно. Подставляя предвари- тельно заданное значение DC, например, (1
− ε
2
) в уравнение (10) и, используя формулу
(
|a|
2
− |b|
2
) = (a
− b)(a + b), мы приходим к следующему результату:
(
+


−∞
+


0
|B(⃗u)| cos[∆φ(⃗u)] − ε|T (⃗u)|d⃗u
)
×
(
+


−∞
+


0
|B(⃗u)| cos[∆φ(⃗u)] + ε|T (⃗u)|d⃗u
)
= 0.
(11)
Теперь, задача состоит в достижении равенства нулю произведения двух выражений. Алго- ритм состоит из двух шагов: на первом шаге отсчеты первого сомножителя уравнения (11)
упорядочиваются в вариационный ряд; затем, выбирается минимальное количество отсчетов в вариационном ряду, которые будут блокированы нулями так, чтобы удовлетворить условию
ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
ТОМ 15
№ 2 2015

РАСПОЗНАВАНИЕ СИМВОЛОВ НА ИСКАЖЕННЫХ ИЗОБРАЖЕНИЯХ
211
равенства в уравнении (11). Если, например, результат вычислений выражения в первых скоб- ках больше нуля, то обнуляем элементы вариационного ряда, начиная с наибольшего значе- ния. На втором шаге, описанная процедура, повторяется для элементов второго сомножителя уравнения (11).
Наконец, для того чтобы учесть геометрические искажения объектов распознавания, син- тезируется банк нелинейных дискриминационных фильтров для каждого класса объектов, ис- пользуя множество известных представлений символов. Обнаружение может быть выполнено путем вычисления корреляции входной сцены и каждого фильтра из банка фильтров. Да- лее, вычисляется дискриминационная способность DC в каждой корреляционной плоскости,
и плоскость с наивысшим значением DC выбирается, как выход всей системы. Координаты корреляционного пика в выбранной плоскости используются в качестве оценки положения объекта на сцене [28].
2. КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ
Тестовые изображения содержали символы, искаженные с помощью таких преобразований как поворот в диапазоне [
−20, 20] градусов с шагом 1 градус, растяжение с коэффициентом 0.8,
горизонтальный сдвиг в диапазоне [
−0.6, 0.6] с шагом 0.05 и изменение масштаба в диапазоне
[0.8, 1.3] с шагом 0.1. Средний размер символов – 31
× 31 пикселей. Обучающие изображения объектов, использованные для синтеза каждого фильтра в банке фильтров, были повергнуты повороту в диапазоне [
−15, 15] градусов с шагом 3 градуса, растянуты с коэффициентом 0.8
(вдоль осей x и y), сдвинуты в направлении оси x в диапазоне [
−0.6, 0.6] с шагом 0.05 и подвергались масштабированию в диапазоне [0.8, 1.1] с шагом 0.1.
Были проведены эксперименты с различными параметрами шума и освещенности при од- новременном изменении положения символов на входной сцене. Тестовые сцены были одновре- менно искажены и аддитивным шумом со среднеквадратичным отклонением σ, равным 5, 10,
15, и импульсным шумом с вероятностью p = 5%. Неравномерное освещение моделировалось с помощью Ламбертовой модели [29]
d(⃗
x) = cos
{
π
2
− arctan
[
ρ
cos(Θ)
[(ρ tan(Θ) cos(φ)
− x
1
)
2
+ (ρ tan(Θ) cos(φ)
− x
2
)
2
]

1 2
]}
,
(12)
где параметры имели следующие значения: Θ = 65, φ = 60, а ρ = 70, ρ = 50, ρ = 40 и ρ = 30.
Рис. 1. Распознавания двух схожих искаженных объектов: a) DC с достоверностью 95%, b) ошибки пропуска.
Минимальное значение DC ровно 0.36. На Рис. 1(a) показаны результаты распознавания двух схожих объектов с помощью предложенной фазовой фильтрации: Class1 =
{p}, Class2 =
{b}. Процент ложных обнаружений – не более 5%, ошибки пропуска показаны на Рис.1(б).
ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
ТОМ 15
№ 2 2015

212
ДИАЗ-ЭСКОБАР, КОБЕР, КАРНАУХОВ
Максимальное значение DC равно 0.73. На Рис. 2(a) показана эффективность распознавания с помощью фильтра H
N SDF
, использованного для распознавания и классификации следующих классов символов:
Class1 =
{b, p, d, g, q, o, e, c, s, a, m, h, n, r, u}, Class2 = {r, t, f, z, k, x, y, w, v, l, j, i},
ошибки пропуска показаны на Рис. 2(б). На Рис. 3(a) представлена сравнительная характери- стика работы по распознаванию предлагаемой системы и коммерческой системы ABBYY на реальном изображении, представленном на Рис. 3(b).
Рис. 2. Распознавания двух классов символов: a) DC с достоверностью 95%, b) ошибки пропуска.
Рис. 3. Сравнительная характеристика работы по распознаванию предлагаемой системы и коммерческой системы ABBYY – (a) на реальном изображении – (b).
ЗАКЛЮЧЕНИЕ
В данной статье предложена система распознавания символов латинского алфавита с ис- пользованием банка адаптивных нелинейных дискриминационных фильтров на искаженных изображениях документов. Предлагаемые методы дают хорошие результаты с точки зрения распознавания и скорости обработки при наличии шума и неравномерного освещения на сценах с геометрическими искажениями. Как и ожидалось, коммерческая система ABBYY показыва- ет высокую эффективность распознавания в тех случаях, когда изображение имеет хорошее качество, однако при низкой или неравномерной освещенности сцены ее эффективность резко уменьшается. В дальнейшей работе предлагается использовать адаптивные методы сегмента- ции и контекстуальное распознавание полных слов. Для увеличения скорости обработки пред-
ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
ТОМ 15
№ 2 2015

РАСПОЗНАВАНИЕ СИМВОЛОВ НА ИСКАЖЕННЫХ ИЗОБРАЖЕНИЯХ
213
полагается реализовать предложенную систему с использованием графических процессоров и технологий параллельного программирования.
СПИСОК ЛИТЕРАТУРЫ
1. Breuel T.M. Exact solutions to total variation regularization problem. In IS&T/SPIE Elec. Imag., Int.
Soc. Opt. and Phot., 68150-68150, 2008.
2. Patel C., Patel A. and Patel D. Optical character recognition by open source OCR tool tesseract: A case study. IJCA, 2012, vol. 55, No. 10, pp. 50-56.
3. Holley R. How good can it get? Analyzing and improving OCR accuracy in large scale historic newspaper digitization programs. D-Lib Magazine, 2009, vol. 15, pp. 3–4.
4. Ozarslan S., and Eren P. E. Text recognition and correction for automated data collection by mobile devices. In IS&T/SPIE Elec. Imag., Int. Soc. Opt. and Phot., 2014, pp. 902706-902706.
5. Esser D., Muthmann K. and Schuster D. Information extraction efficiency of business documents cap- tured with smartphones and tablets. In Proc. of ACM symp. on Doc. Eng., 2013, pp. 111–114.
6. Lund W. B., Kennard D. J. and Ringger E. K. Combining multiple thresholding binarization values to improve OCR output. In IS&T/SPIE Elec. Imag., Int. Soc. for Opt. and Phot., 2013, pp. 6580-86580 .
7. Gatos B., Pratikakis I. and Perantonis S. J. Adaptive degraded document image binarization. Patt. Rec.,
2006, vol. 39, No. 3, pp. 317–327.
8. Ulges A., Lampert C. H. and Breuel T. M. Document image dewarping using robust estimation of curled text lines. In DAR, Proc. 8th Int. Conf. on IEEE, 2005, pp. 1001–1005.
9. Zhang H., Zhao K., Song Y. Z. and Guo J. Text extraction from natural scene image: A survey. Neuro- computing, 2013, vol. 122, pp. 310–323.
10. Ma D. and Agam G. A super resolution framework for low resolution document image OCR. In
IS&T/SPIE Elec. Imag., Int. Soc. for Opt. and Phot., 2006, pp. 86580–86580.
11. Matei O., Pop P. C. and Valean H. Optical character recognition in real environments using neural networks and k-nearest neighbor. Applied intelligence, Springer, 2013, vol. 39, No. 4, pp. 739–748.
12. Salehpour M. and Behrad A. Cluster based weighted SVM for the recognition of Farsi handwritten digits. In NNA, Elec. Eng., 10th Symp., IEEE, 2010, pp. 219–239.
13. Kir B., Oz C. and Gulbag A. The Application of optical character recognition for mobile device via artificial neural networks with negative correlation learning algorithm. In ICECCO, Int. Conf. on IEEE,
2013, pp. 220–223.
14. LeCun Y., Bottou L., Bengio Y. and Haffner P. Gradient-based learning applied to document recognition.
In Proc. of the IEEE, 1998, vol. 86, No. 11, pp. 2278–2324.
15. Kober V., Mozerov M., Alvarez-Borrego J. and Ovseyevich I.A. Adaptive rank-order correlations. Pattern
Recognition and Image Analysis, 2009, vol. 14, No. 1, pp. 33–39.
16. Kober V. Robust and Efficient Algorithm of Image Enhancement. IEEE Trans. on Cons. Elec, 2009,
vol. 52, No. 2, pp. 655–659 .
17. Kober V., Mozerov M., Alvarez-Borrego J. Nonlinear filters with spatially connected neighborhoods.
Opt. Eng., 2001, vol. 40, No. 6, pp. 971–983 .
18. Kober V., Mozerov M., Alvarez-Borrego J. and Ovseyevich I.A. Rank image processing using spatially adaptive neighborhoods. Pattern Recognition and Image Analysis, 2001, vol. 11, No. 3, pp. 542–552 .
19. Kober V., Mozerov M., Alvarez-Borrego J. and Ovseyevich I.A.. Unsharp masking using rank-order
filters with spatially adaptive neighborhoods. Pattern Recognition and Image Analysis, 2002, vol. 12,
No. 1, pp. 46–56.
ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
ТОМ 15
№ 2 2015

214
ДИАЗ-ЭСКОБАР, КОБЕР, КАРНАУХОВ
20. Martinez-Diaz S., and Kober V. Nonlinear synthetic discriminant function filters for illumination- invariant pattern recognition. Opt. Eng., 2008, vol. 47, No. 6, pp. 067201–067201 .
21. Fitch J., Coyle E.J. and Gallagher Jr. N.C. Median filtering by threshold decomposition. ASSP, Int.
Conf. on. IEEE Trans., 1984, vol. 32, No. 6, pp. 1183–1188.
22. Kober V., Diaz-Martinez S., Karnaukhov V and Ovseyevich I.A. Distortion invariant pattern recognition with local correlations. Pattern Recognition and Image Analysis, 2011, vol. 21, No. 2, pp. 188–191 .
23. Maragos P. Morphological correlation and mean absolute error criteria. ASSP, Int. Conf. on. IEEE,
1568–15721.
24. Gonzalez-Fraga J. A., Kober V. and Alvarez-Borrego J. Adaptive synthetic discriminant function filters for pattern recognition. Opt. Eng., 2006, vol. 45, No. 5, pp. 057005–057005.
25. Yaroslavsky L.P. The theory of optimal methods for localization of objects in pictures. In Proc. In Opt.,
Elsevier, 1993, vol. 32, No. 1, pp. 145–201.
26. Maragos P. Optimal morphological approaches to image matching and object detection. In Proc. Int.
Conf. on CV., 1998, pp. 695–699 .
27. Aguilar-Gonzalez P.M., Kober V. and Diaz-Ramirez V. H.. Adaptive composite filters for pattern recog- nition in nonoverlapping scenes using noisy training images. Pattern Recognition Letters, 2014, vol. 41,
No. 1, pp. 83–92 .
28. Kober V. I. and Ovseyevich I.A. Phase-Only filter with improved filter efficiency and correlation dis- crimination. Pattern Recognition and Image Analysis, 2000, vol. 10, No. 4, pp. 514–519 .
29. Diaz-Ramirez, V. H., Picos, K. and Kober, V. Target tracking in nonuniform illumination conditions using locally adaptive correlation filters. Optics Communications, 2014, vol. 32, No. 1, pp. 32–43.
Character recognition in degraded document images using morphological and phase-only filtering
Diaz-Escobar J., Kober V., Karnaukhov V.
Nowadays applications of optical character recognition (OCR) for mobile devices have been actively developing. Most of these algorithms work well with clean and well-formed data, but images of mobile devices usually are captured in unfavorable conditions. Therefore, the quality of document images often is poor owing to various distortions such as nonhomogeneous illumination, perspective distortions, low resolution, sensor noise, etc. In this work we propose a method for reliable recognition of characters in degraded document images using a bank of adaptive morphological and phase-only filters. With the help of computer simulation the performance of the proposed method is presented and compared with that of common approaches for detection and classification of characters of the Latin alphabet in distorted document images.
KEYWORDS: variational functional, total variation, exact solution, regularization, signal restora- tion.
ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
ТОМ 15
№ 2 2015

Каталог: 2015
2015 -> Методические рекомендации Элиста 2015 Составитель
2015 -> Правила закаливания… Выпуск №1. Чтоб улыбка сияла. Мама первый стоматолог
2015 -> Справка о наличии печатных и электронных образовательных и информационных ресурсов муниципального казенного дошкольного образовательного учреждения «Детский сад «Колокольчик»
2015 -> Рабочая программа практического обучения по специальности 51. 02. 02 «Социально-культурная деятельность» 2014 г
2015 -> Муниципальное бюджетное
2015 -> Занятие №18 Здравствуйте, участники программ личностного развития для детей!
2015 -> Информации и коммуникации на подрастающее поколение. Научно исследовательская
2015 -> Шелакина А. А. Студентка 2 курса атп 921 ппк сгту имени Гагарина Ю. А
2015 -> 1. Название темы Проект по молодёжной политике города Таганрога


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©nethash.ru 2019
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал