Обработка изображений, распознавание образов



Скачать 302.07 Kb.
Pdf просмотр
Дата07.04.2017
Размер302.07 Kb.
Просмотров171
Скачиваний0

2010 Компьютерная оптика, том 34, №4 545
ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ
АЛГОРИТМЫ ДВУМЕРНОГО АНАЛИЗА ГЛАВНЫХ КОМПОНЕНТ
ДЛЯ ЗАДАЧ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ЛИЦ
Кухарев ГА, Щеголева Н.Л.
Санкт-Петербургский государственный электротехнический университет
Аннотация

Представлены алгоритмы двумерного анализа главных компонент (Two-dimensional
Principal Component Analysis – 2D PCA), ориентированные на обработку цифровых изображений больших размеров в условиях малой выборки. Алгоритмы основаны на прямом вычислении двух матриц ковариации по всем исходным изображениям без их преобразования в векторы. Результат анализа – нахождение главных компонент для строки столбцов исходных изображений и построение соответствующих им матриц двумерной проекции. Обсуждаются два способа выполнения 2D PCA, соответствующие параллельной и каскадной формам его реализации. Оценены характеристики представленных алгоритмов.
Ключевые слова: анализ главных компонент, распознавание изображений лиц.
Введение

В задачах обработки изображений методами РСА исходными являются три базовых параметра
{M,
N,
K}, где M и N – число строки столбцов исходных изображений, а K – количество изображений
[1-4]. Первые два параметра определяют размерность исходного пространства признаков
DIM

=

MN. При этом обработке изображений лиц методами РСА сопутствует проблема малой выборки
(Small Sample Size – SSS [1-3]), когда DIM

>>

K. Размерность исходного пространства признаков
DIM определяет вычислительную сложность реализуемых алгоритмов. Анализ главных компонент
(РСА [1-5]) является одним из методов, на котором основаны процедуры редукции размерности исходного пространства признаков, и при этом достигается условие
DIM
new
<< DIM,
(1) где DIM
new
– размерность нового пространства признаков. Результат редукции используется в задачах компактного представления изображений (их компрессии, выявлении их существенных характеристики или в распознавании изображений в новом пространстве признаков. Однако эффективное применение в этих задачах возможно только в случае выполнения условия
DIM
new
<< K.
(2) Методология использования PCA в приложении к обработке изображений связана, с одной стороны, с необходимостью использования базового метода
PCA [1,
2], изначально ориентированного на обработку векторных данных, ас другой стороны, с уч- том условия (2). Первый подход («Eigenfaces» [2]) основан на уменьшении каждого исходного изображения до размера m

<

M и n

<

N, конкатенации его столбцов в общий вектор и вычислении матрицы ковариации порядка mn



K) по всем полученным векторным данным. Матрица проекции в новое пространство признаков определяется далее на основе решения задачи на собственные значения для этой матрицы ковариации. Строки матрицы проекции являются собственными векторами матрицы ковариации, а обратное формирование их в двумерную матрицу размера m

×

n образует соответствующие им матрицы, называемые «Eigenfaces». При этом проекция в новое пространство признаков реализуется как одномерное преобразование Карунена-Лоэва (1D KLT) векторизованных исходных данных. Во втором подходе [3] вычисляются две матрицы ковариации, которые определяются отдельно по столбцами строкам исходных изображений без их конкатенации в общий вектор. Далее вычисляются две матрицы проекции, определяемые собственными векторами этих матриц ковариации. Проекция исходных изображений в новое пространство признаков реализуется как двумерное (по строками столбцам) преобразование Карунена-Лоэва (2D KLT), что и отличает подход [3] от [1-2]. В [3] было показано, что в приложении к задачам распознавания изображений лиц такой подход является более робастным по отношению к качеству исходных изображений, в том числе их искусственному «зашумлению» и циклическому сдвигу. В работе [4] двумерный анализ главных компонент) был исследован в приложении к распознаванию изображений лиц в условиях малой выборки. Здесь же впервые были представлены вектор- но-матричные процедуры, позволяющие непосредственно реализовать 2D PCA в алгоритмических языках, поддерживающих матричные операции. Дальнейшее развитие подхода [3] было представлено в работах [5,
6] как 2D PCA/2D KLT. При этом следует отметить, что некоторые аналогичные идеи по реализации 2D PCA рассматривались в работе [7], вышедшей в свет после работ
[4, 6]. Однако допущенные в [7] упрощения и ошибки в представлении базовой процедуры 2D PCA и
Алгоритмы двумерного анализа главных компонент …
Кухарев ГА, Щеголева Н.Л.
546 отсутствие её точного описания не позволяют выделить характеристики этого метода, а неполное описание выполненных экспериментов не позволяет использовать результаты этой работы в рамках ме- таанализа. Следует также отметить, что авторы работы, представляя свой подход, отсылают к своей же работе [10] 2004 года как первоисточнику, представляющему реализацию 2D PCA». Однако в работе [10] представлен подход, реализующий РСА только по одному направлению, а именно по столбцам исходных изображений (!). Естественно, что и
KLT здесь реализуется также только по одному направлению.
Целью настоящей статьи является представление новых алгоритмов 2D PCA/2D KLT и соответствующих им вычислительных структур. Алгоритмы предназначены для обработки изображений больших размеров в условиях малой выборки, а структуры определяют базовые принципы реализации этих алгоритмов. Идея и реализация 2D PCA/2D KLT

Пусть нам задан набор X, состоящий из K центрированных и нормированных к «1» изображений
( )
k
X
(для k

=

1,

2,

…,

K) размером M

×

N каждое и
MN >> K:
(1)
(2)
(
)
[
]
K
X
X
X
X
=
(3) Целью 2D PCA является определение двух матриц проекции, трансформирующих исходные данные в
новое пространство признаков так, чтобы выполнялось условие минимума расстояния
( )
( )
1 2
(
)
,
k
T
k
distance X
W X
W
min


(4)


k

=

1,

2,

…,

K, где 2
,
W
W ортогональные матрицы порядков M и
N
соответственно
Параллельный
алгоритм. Здесь двумерный анализ главных компонент выполняется независимо по строками столбцам исходных данных, и
при этом определяются
два

независимых

собственных

бази
-
са
Модель вычислений в 2D PCA/2D KLT можно представить следующим образом
R
1
PCAr
1
PCAr
1 2
( )
( )
1 2
1.0.
;
1.1.
;
1.2.
;
2.
,
1, 2,...,
k
T
k
X
X
X
W
X
W
Y
W X
W
k
K
→




=
∀ =
(5) На этапе 1.0 выполняется реорганизация структуры исходных данных (3). Это реализуется как транспонирование всех матриц размером M

×

N в
наборе
X и
составление нового набора данных X
1
На этапе 1.1 выполняется базовая процедура PCA относительно строк исходных данных (PCAr). На этапе 1.2 выполняется относительно строк (P
СА
r) данных, входящих в
набор
X
1
,
или
, что тоже самое, относительно столбцов исходных данных
Результат этапов 1.1 и 1.2 – вычисление двух матриц проекции W
1 и W
2
Этапы
1.1 и 1.2 могут быть выполнены параллельно, поскольку процедура
Р
CAr применяется для независимых наборов данных X
и
X
1
Наконец
, этап 2 – это трансформация всех исходных изображений из набора X в
новое пространство признаков Y.
С
учётом этого на рис. 1 представлена схема параллельного способа (5) реализации 2D
PCA. Блок “R” реализует транспонирование всех матриц размером M

×

N в
наборе
X. Блоки, обозначенные как “

”, реализуют процедуру проекции исходных данных
Пунктиром выделен блок, определяющий двумерное преобразование
Карунена
-
Лоэва
(2D KLT).

Рис. 1. Структура параллельного алгоритма 2D PCA
Заметим
, что в
представленном методе двумерное реализуется покаскадной схеме сначала исходное изображение обрабатывается по строкам, а
затем полученный результат обрабатывается по столбцам (или наоборот. Это аналогично тому, как могут выполняться многие
двумерные
дискретные ортогональные преобразования изображений [1,
4], что, однако, противоречит способу получения собственных базисов в (5).
Каскадный
алгоритм
Здесь в
первом каскаде выполняется

анализ главных компонент
по

строкам
исходных изображений, а
во втором – по

столбцам
результата первого каскада (или наоборот – сначала по столбцам, а
потом по строкам результата. При этом определяются два
взаимосвязанных

собствен
-
ных

базиса
, и 2D KLT реализуется также покаскадной схеме во взаимосвязанных базисах
Модель каскадного алгоритма запишем следующим образом
PCAr
R
PCAr
1 1
1
R
2
{
;
}
{
; }
X
W X
X
W Y
Y


→




→
ɶ
ɶ
(6) Здесь
1
X
ɶ
– данные
1
X
после их реорганизации блоком “R”; выражения в фигурных скобках представляют результаты PCA/KLT по строками столбцам исходных изображений. Схема вычислений, соответствующая модели (6), представлена на рис. 2. Здесь в явной форме отражён каскадный способ реализации 2D PCA/2D KLT.

2010 Компьютерная оптика, том 34, №4 547

Рис. 2. Структура каскадного алгоритма 2D PCA
2. Формальное описание алгоритмов
Версия параллельного алгоритма
Вычислим две матрицы ковариации, определив их относительно строки столбцов («c» – column) для исходных изображений (3):
( )
( )
( )
1
( )
( )
( )
1
(
) ;
(
)
,
K
r
k
k
T
k
K
c
k
T
k
k
C
X
X
C
X
X
=
=
=
=


(7) где
( )
r
C
и
( )
c
C
– матрицы порядков
M
и
N
соответ- ственно. С учётом (7) определим собственные значения и соответствующие им собственные векторы, решив следующие две задачи на собственные значения
( )
( )
1 1
1 2
2 2
;
T
r
T
c
W C W
W C W
= Λ
= Λ
(8) При этом 1
1
T
W W
I
=
и
2 2
2
T
W W
I
=
, аи единичные матрицы порядков M
и
N соответственно и
– диагональные матрицы порядков M и N
соответственно

Трансформация исходных данных в
новое пространство признаков реализуется как двумерное преобразование на основе собственных базисов, определяемых по (8) в
следующей форме
( )
( )
1 2
(
)
,
1, 2,
, ,
k
T
k
Y
W X
W
k
K
=

=

(9) где )
k
Y
– матрицы размера M

×

N, представляющие исходные изображения в
новом пространстве признаков Версия

каскадного

алгоритма

Выполним проекцию исходных данных так, что
( )
( )
1 1
,
1,2,
, ,
k
T
k
X
W X
k
K
=

=

(10) где )
1
k
X
– матрицы размера M

×

N, представляющие исходные изображения (3) в
новом
(промежуточном) пространстве признаков матрица W
1 была определена в (8). Далее вычислим матрицу ковариации
, определив её
относительно столбцов («
с
» – column) результата
( )
( )
( )
1 1
1
(
)
K
c
k
T
k
k
C
X
X
=
=

,
(11) где матрица C
имеет порядок, равный N. Вычислим для (11) собственные значения и
со
- ответствующие им собственные векторы, решив следующую задачу на собственные значения
( )
2 2
2
T
c
W C W
= Λ
,
(12) где W
2
и
Λ
2
– матрицы порядка N. Трансформация исходных данных (3) в
новое пространство признаков реализуется теперь как двумерное преобразование
Карунена
-
Лоэва
(9) на основе собственных базисов, определяемых ортогональными матрицами проекции (8) и (12).
Редукция

размерности

пространства

признаков

Изменим
(9) так, чтобы в
дальнейших преобразованиях участвовали только те собственные векторы, которые соответствуют «d» главным компонентам
(d

<

min
{M,
N
}). Для этого из выбранных собственных векторов формируются две прямоугольные матрицы из матрицы
1
T
W
выбираем
«d»
строк
, а
из матриц W
2
выбираем
«d» столбцов, соответствующих
«d» наибольшим собственным числами на их основе формируются две матрицы редукции F
1 и F
2
Верхние границы параметра «d» выбираются исходя из критерия энергетической значимости собственных значений [1-6]. Нижние границы параметра «d» выбираются экспериментально с
учётом критерия. При этом d

<

min
{M,
N
} или d
1

<

M
; d
2

<

N,
если
d
1



d
2
Теперь выполним «
усечённое
» двумерное преобразование
( )
( )
1 2
=
,
( )
(1,1) ...
( ,1)
(2,1) ... ( , 2)
( где
( ,1)... ( , )
k
k
Y
F X
F
k
y
y d
y
y d
k
Y
y d
y d d






=







(13)
Матрицы F
1 и F
2 имеют размеры d

×

M и N

×

d соответственно (или d
1
×
M ив общем случае знак «^» определяет отличие результата (13) от (9). Результирующие матрицы в (13) имеют в общем случае размеры d
1
×
d
2
и представляют исходные изображения в новом пространстве признаков.
3. Характеристики разработанных алгоритмов
3.1. На реализацию полного 2D KLT (9) потребуется) операций, а на реализацию «усечён- ного» 2D KLT по схеме (13) потребуется
(Md
2
+

MNd) операций. При этом
сокращение вы-
числений
на этапе редукции размерности пространства признаков (РПП) можно приблизительно оценить как величину (M

+

N)

/

d, поскольку
Алгоритмы двумерного анализа главных компонент …
Кухарев ГА, Щеголева Н.Л.
548 2
2 для
NM
MN
MN M
N
M
N
M d
N d
d
Md
MNd
d
N
+
+
+
=

+
+
<<
(14)
Например, для M

=

112 и
N

=

92 (база лиц ORL
[7]) и
d

=

10 сокращение вычислений составит примерно раз) на каждое изображение. С учётом параметра «K» – числа изображений, ускорение вычислений составит величину, равную примерно
K

(
M

+

N)

/

d на все исходные данные.
3.2. Результат в (13) содержит
d
2 или
d
1

×

d
2
) элементов, поэтому степень редукции РПП определяется соотношением MN

/

d
2
или
MN

/

(
d
1

d
2
), если
d
1



d
2
Например, для M

=

112,
N

=

92 и
d

=

10 редукция размерности пространства признаков составит более чем 100 раз) на каждое изображение.
3.3. Наибольший порядок матриц ковариации в
(7), (12) составляет величину
DIM

=

max{
M,

N}. Это предопределяет практическую возможность решения задачи на собственные значения и стабильность этого решения даже для изображений больших размеров. При представлении исходных изображений как совокупности строки столбцов общее число получаемых векторов составляет величину K

(
M

+

N), а размерность исходного пространства признаков определяется как DIM

=

max{
M,

N}. Поэтому при
любых значениях M и N соотношение размерность число векторов всегда будет отвечать условию, обходя таким образом проблему SSS. Совокупность представленных выше характеристик не была представлена в работах [4-6] в столь полном объёме.
4. Распознавание изображений лиц
Цель первого эксперимента – сравнение представленных алгоритмов реализации 2D PCA при решении задачи поиска изображений лиц по заданному тестовому образу. Эксперименты выполнены на базе ORL [9], некоторые изображения которой показаны на рис. 3.

Рис.3. Примеры исходных данных
База ORL охватывает 40 различных классов образов (изображений лиц людей различных наций) по
10 образов в каждом классе. Все изображения базы
ORL относятся к типу „indoor”, имеют размер 112 на
92 пикселя и представлены в шкале „GRAY” (256 уровней яркости. Для лиц базы ORL характерно изменение контраста изображений и яркости фона вокруг области лица размера лиц, в том числе непропорционально по осями поворота головы в пространстве 3D в пределах не менее о по оси
X, о по оси
Y и не менее о по оси
Z; мимики, прорисовки деталей лиц (их сглаживание. Эксперимент был выполнен для всех 40 классов с выбором только одного образа из каждого класса для эталона и девяти других образов в каждом классе для теста. Таким образом, в формулировке задачи поиска, база системы поиска содержала 40 образов- эталонов (по одному на класса в качестве тестовых были использованы 360 образов (по девять образов на каждый из 40 классов. В эксперименте дважды использована процедура кросс-валидации: в каждом эксперименте изменялся номер выбранного образа- эталона, а внутри каждого эксперимента изменялся параметр редукции «d» (d

=

3,

4,

…,

10). Всего, таким образом, выполнено 10

×

8

=

80 экспериментов. Модель выполненного эксперимента имеет следующий вид [8]:
ORL(40/1/9/CV){2DPCA:112×92

d×d/КМР/L1/rank=1}, где определены
ORL(40/1/9/CV) база лиц, структура данных и процедура кросс-валидации (CV);
2DPCA:112×92

d×d – использованный метод и размеры данных дои после редукции размерности пространства признаков
КМР/L1/rank=1 – тип классификатора, метрика и ранг результата. Текущие результаты в каждом эксперименте оценивались как отношение количества правильно классифицированных тестовых образов к общему их числу 360. Общее число тестовых образов составило
3600 для каждого значения параметра «
d». Результат считался правильным, если на первом месте
(
rank

=
1) в группе результатов находился образ из того же класса, что и тестовый образ. В эксперименте использован классификатор по минимуму расстояния (КМР) в метрике L1. На рис. 4 показаны 20 наибольших собственных значений (собственные значения, вычисленные по строкам для обоих способов, одинаковы по определению. При этом главные компоненты ограничены величиной d



6, поскольку далее собственные значения практически равны «0». На рис. 5 представлена динамика распознавания тестовых образов в эксперименте № 9 для всех 360- ти тестовых образов при значении d

=

6. На рис. 6 показаны результаты решения поставленной задачи поиска для различных значений параметра редукции «d». Как видно, наилучший результат поиска получен при значении d

=

6. Степень редукции размерности пространства признаков составила при этом значение, равное 286 (поскольку
112

×

92

/

36

=

286).

2010 Компьютерная оптика, том 34, №4 549

Рис. 4. Собственные значения для метода 2D PCA

Рис. 5. Динамика распознавания тестовых образов

Рис. 6. К выбору параметра редукции «d»
Подводя итог эксперимента, отметим следующее при выполнении поставленного эксперимента дважды решалась задача на собственные значения. Порядки матриц ковариации составили соответственно и 92. Общее число изображений составило, поэтому матрицы ковариации были хорошо обусловлены и не потребовалось никаких процедур их регуляризации ярко выраженное наличие главных компонент в составе собственных значений гарантирует репрезентативное представление исходных данных в новом пространстве признаков при малом значении параметра «d»; решение поставленной задачи поиска выполнено успешно, особенно если учитывать специфику исходных данных – изображений лиц базы ORL, и малое число образов-эталонов в системе поиска по одному на каждый класс. Результаты, представленные входе экспериментов, выше результатов, показанных в [4, 5], при решении аналогичной задачи.
Цель второго эксперимента – решение задачи распознавания изображений лиц при различном числе эталонов в базе системы распознавания (Face
Recognition System – FaReS [6]). Модель выполненного эксперимента имеет следующий вид:
ORL(40/L/10-L/R+CV){2DPCA:12×92

8×8}
[КМР/L1/rank=1]. Здесь в базу FaReS выбирается L тренировочных изображений в каждом из 40 классов выбор организован случайным образом (random – R) и использована процедура кросс-валидации (R+CV). Число тестовых образов составляет 10

L для L
=
1,
2,
3,
4,
5. Результаты выполненных экспериментов представлены в табл. 1.
Таблица 1. Результаты экспериментов
1/40/360 2/80/320 3/120/280 4/160/240 5/200/200
Э П К П К П К П К П К
1 68 68 78 79
93
93
94 94
97
97
2 68 68 78 78 88 89 90 90 95 96 3
70 70 82 82 90 90 94 94 95 94 4
66 68 83 84 91 90 93 93 95 93 5
71
71
83 83 90 90 91 90 92 91 6
71
71
83 83 90 90 91 92 95 95 7
70 70 87 87 91 92 93 93 96 97 8
64 64
90 90
91 91
94
95
95 95 9
67 67 82 81 89 88 90 89 94 95 10 66 68 82 82 89 89 92 92 96 96 ср
68
69
83 83
90
90
92
92
95
95
Здесь: Э
– номер эксперимента
1/40/360…5/200/200 – значение L и общее число изображений-эталонов и тестовых изображений в каждом эксперименте Пи К – способы параллельный и каскадный. Из представленных результатов видно, что существенный скачок результативности распознавания возникает уже при L
=
2, а при значении L
=
5 результат распознавания составляет (при округлении до наименьшего целого) в среднем 95% ив максимуме
97%. При этом результативность для двух алгоритмов реализации 2D PCA/2D KLT практически одинакова.
Заключение

В статье представлены новые алгоритмы реализации, ориентированные на обработку изображений. Представлены схемы вычислений, соответствующие этим алгоритмам, а также эксперименты при решении задач поиска и распознавания изображений лиц. Для выполненных экспериментов представлены соответствующие модели. Идею алгоритмов 2D PCA/2D KLT можно представить в компактной форме
1 2
1 2
2D PCA/2D KLT
,
{
,
}
{ ,
}
X
Y
W W
F F



(15) что можно интерпретировать как преобразование набора исходных изображений X в пространство переменных Y. При этом выполняется этап 2D PCA с определением х матриц проекции
1 2
{
,
}
W W
Алгоритмы двумерного анализа главных компонент …
Кухарев ГА, Щеголева Н.Л.
550 и отдельный этап 2D KLT с матрицами проекции
1 2
{ ,
}
F F
Сравнения с
решениями
[7] не проводилось, поскольку в [7] отсутствуют необходимые модели и, как следствие этого, данные о
деталях выполненных экспериментов
А
в таких условиях сравнение будет необъективным или бессмысленным
Литература

1.
Прэтт, У. Цифровая обработка изображений / У. Прэтт – М Мир, 1982. – 312 с.
2.
Turk, ММ. 71-86. – ISSN 0898-929X.
3.
Tsapatsoulis, N. Vector Based Approximation of KLT and Its Application to Face Recognition / N. Tsapatsoulis,
V. Alexopoulos, S.A. Kollias // Proceedings of the IX
European Signal Processing Conference EUSIPCO-98,
September 8-11. Rodos Palace, Island of Rhodes, Greece,
– 1998. – Vol. III. – P. 1581-1584.
4.
Кухарев, Г.А. Биометрические системы методы и средства идентификации личности человека / ГАКу- харев – СПб.: Политехника, 2001. – 240 с.
5.
Kukharev, G. Data Dimensionality Reduction for Face
Recognition / G. Kukharev, P. Forczmański //Journal ma- chine graphics & vision. – 2004. – Vol. 13, No. 1/2. –
P. 99-121. – ISSN 1230-0535.
6.
Кухарев, ГА. Системы распознавания человека по изображению лица / Г.А. Кухарев, Н.Л. Щеголева –
СПб.: Изд-во СПбГЭТУ «ЛЭТИ», 2006. – 176 с.
7.
Zuo, W. Subspace Methods for Face Recognition: Singu- larity, Regularization, and Robustness / W. Zuo, K. Wang,
H. Zhang // State of the Art in Face Recognition, edited by:
Dr. Mario I. Chacon M., January 2009, I-Tech, Vienna,
Austria. – 250 p. – ISBN -3-902613-42-4.
8.
Кухарев, Г.А. Поиск изображений лиц в больших базах данных / ГА. Кухарев // Мир измерений. – 2009.
– № 4(98). – С. 22-30.
9.
The ORL database – www.uk.research.att.com/pub/data/att_faces.zip.
10.
Yang, J. Two-dimensional PCA: a new approach to ap- pearance-based face representation and recognition /
J. Yang [et al.] // IEEE Trans. on PAMI. – 2004. – No. 26.
– P. 131-137.
References
1.
Pratt, W. Digital image processing / W. Pratt, – Moscow:
“Mir” Publisher, 1982. – 312 p. – (in Russian).
2.
Turk, ММ. 71-86. – ISSN 0898-929X.
3.
Tsapatsoulis, N. Vector Based Approximation of KLT and Its Application to Face Recognition/ N. Tsapatsoulis,
V. Alexopoulos, S.A. Kollias // Proceedings of the IX
European Signal Processing Conference EUSIPCO-98,
September 8-11. Rodos Palace, Island of Rhodes, Greece,
– 1998. – Vol. III. – P. 1581-1584.
4.
Kukharev, G.A. Biometric Systems: Methods and means of identification of a person's identity / G.A. Kukharev –
Saint-Petersburg: “Polytechnics” Publisher, 2001. – 240 p.
– (in Russian).
5.
Kukharev, G. Data Dimensionality Reduction for Face
Recognition / G. Kukharev, P. Forczmański //Journal ma- chine graphics & vision. – 2004. – Vol. 13, No. 1/2. –
P. 99-121. – ISSN 1230-0535.
6.
Kukharev, G.A. Systems of recognition of human facial image / G.A. Kukharev , N.L. Schegoleva – Saint-Peters- burg, Acad ETU “LETI” Publisher, 2006. – 176 p. – (in
Russian).
7.
Zuo, W. Subspace Methods for Face Recognition: Singu- larity, Regularization, and Robustness / W. Zuo, K. Wang,
H. Zhang // State of the Art in Face Recognition, edited by:
Dr. Mario I. Chacon M., January 2009, I-Tech, Vienna,
Austria. – 250 p. – ISBN -3-902613-42-4.
8.
Kukharev, G.A. Find pictures of persons in large data- bases / G.A. Kukharev // World measurement. – 2009. –
Vol. 4(98). – P. 22-30. – (in Russian).
9.
The ORL database –
www.uk.research.att.com/pub/data/att_faces.zip.
10.
Yang, J. Two-dimensional PCA: a new approach to ap- pearance-based face representation and recognition/
J. Yang [et al.] // IEEE Trans. on PAMI. – 2004. – Vol. 26.
– P. 131-137.
ALGORITHMS OF TWO-DIMENSIONAL PRINCIPAL COMPONENT ANALYSIS
FOR FACE RECOGNITION
G.A. Kukharev, N.L. Shchegoleva
St. Petersburg State Electrotechnical University
Abstract
In article presents algorithms for two-dimensional principal component analysis (Two- dimensional Principal Component Analysis – 2D PCA)-oriented processing of digital images of large sizes in a small sample. Algorithms based on direct calculation of two covariance matrices for all source images without converting them into vectors. Result analysis – finding the principal components for the rows and columns of the source images and the construction of the correspond- ing matrices of two-dimensional projection. We discuss two ways to do 2D PCA, corresponding to parallel and cascade forms of its realization. Evaluated the presented algorithms.
Key words
: principal component analysis, image recognition.

2010 Компьютерная оптика, том 34, №4 551
Сведения
об авторах
Кухарев Георгий Александрович родился в 1941 году в Ленинграде. Кандидатскую диссертацию защитил в 1979 году в Ленинградском институте точной механики и оптики
(ЛИТМО), докторскую – в 1986 году в институте автоматики и вычислительной техники Рига, Латвия. В настоящее время профессор кафедры математического обеспечения ЭВМ СПбГЭТУ
(ЛЭТИ) и профессор на факультете информатики Щецинского технологического университета в Польше (Szczecin, West Pomeranian University of Technology, Poland). В 2001–
2003 годах был визитинг-профессор на кафедре информатики и математики в Ecole
Centrale de Lyon во Франции. В 2005–2006 годах был визитинг-профессор в Ханойском университете (Вьетнам. Является автором и соавтором боле 100 научных работ, в том числе 40 авторских свидетельств на изобретения и 10 монографий, посвящённых методами техническим средствам цифровой обработки сигналов и изображений. Последние исследования связаны с биометрией – областью знаний, представляющей методы измерения физических характеристик (или персональных поведенческих черт) человека и методы их сравнения с аналогичными характеристиками в базе данных для целей идентификации или аутентификации человека.
E-mail: kuga41@mail.ru
Georgy Alexsandrovich Kukharev Born in 1941 in Leningrad. PhD thesis defended in 1979 at the Leningrad Insti- tute of Precision Mechanics and Optics (LITMO), PhD – in 1986 at the Institute of Automation and Computer Engineer- ing (Riga, Latvia).
At present Professor of Computer Software ETU (LETI), and Professor of Computer Science Faculty at the Szczecin
University of Technology in Poland (Szczecin, West Pomeranian University of Technology, Poland). In 2001–2003, a
Visiting Professor at the Department of Informatics and Mathematics at the Ecole Centrale de Lyon in France. In 2005–
2006. a Visiting Professor at the Hanoi University Scoma (Vietnam). Н is an author and co-authored more than 100 scientific papers, including 40 inventor's certificates and 10 mono- graphs on methods and technical means of digital signal processing and image. Recent research related to biometrics – the area of knowledge, representing the methods of measuring physical characteristics (or personal behavioral traits) of a person and how they compare with similar characteristics in the database for the purpose of identification or authentica- tion rights.
Щеголева Надежда Львовна, 1973 года рождения. В 2000 году в Санкт-Петербург- ском государственном электротехническом университете (ЛЭТИ) защитила диссертацию на соискание ученой степени кандидата технических наук. В 2001–2006 работала старшим научный сотрудником ОАО Концерн «Океанприбор». В настоящее время работает доцентом кафедры МО ЭВМ СПБГЭТУ и старшим научным сотрудником ОАО НИЦ
СПб ЭТУ. В настоящее время её интересы лежат в области биометрии, в том числе обнаружение и распознавание лиц в больших базах данных, идентификация и контроль доступа, поиск лиц, построение систем распознавания лиц. Является автором 20 научных работ, соавтором монографии и двух учебных пособий.
E-mail: stil_hope@mail.ru.
Nadegda Lvovna Schegoleva Born in 1973. He received his Ph.D. degree (2000) in Saint Petersburg Electrotech- nical University (LETI). From 2001–2006 she is Senior Researcher in JSC "Concern" OKEANPRIBOR ". From 2007 she is a docent in the Department of Computer Software Environment (Saint Petersburg Electrotechnical University
LETI, St.-Petersburg, Russia) and Senior Researcher in Scientific-Engineering Center of Saint-Petersburg Electrotechni- cal University ( JSC "SIC St. EGS").
Her current interests are in the areas of biometrics, including: face detection and face recognition, “Visitor Identifica- tion” and “Access Control” Systems, task ”Name-It” and face retrieval, system of face recognition. She is the author of one monograph, 20 scientific papers.

Поступила в редакцию 10.08.2010 г.


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©nethash.ru 2017
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал