Дипломная работа



Pdf просмотр
страница2/3
Дата24.04.2017
Размер0.66 Mb.
Просмотров205
Скачиваний1
ТипДипломная работа
1   2   3
может быть разложено на две основные составляющие: постоянное смещение, возни- кающее из-за технических особенностей передачи данных, и смещение, возникающее из-за взаимодействия электрической цепи с потенциалом тела.
2

. Полосовая фильтрация
Как было упомянуто выше, в электроэнцефалограмме здорового человека выде- ляют несколько характерных составляющих электрических колебаний, называемых ритмами, различающихся частотным диапазоном. С целью выявления компонент,
отвечающих соответствующим ритмам, применяются методы фильтрации в задан- ном диапазоне частот. Диапазон частот выбирается с учетом априорной информации о ритмах.
Фильтрами нижних частот (англ. low-pass filter, LPF) называется тип филь- тров, эффективно пропускающих частотный спектр сигнала ниже некоторой частоты
(т.н. частоты среза) и уменьшающих (подавляющих) частоты сигнала выше этой частоты. Степень подавления каждой частоты зависит от вида фильтра. Фильтр верхних частот (англ. high-pass filter, HPF), напротив, пропускает частоты выше частоты среза и подавляет низкие частоты.
3

. Робастное преобразование
Одним из эффективных методов снижения влияния артефактов, имеющих место в данных ЭЭГ, является робастное преобразование данных для каждого сенсора.
Для каждого электрода вычисляются значения перцентилей среза (см. рис. 6), затем значения, лежащие ниже или выше полученных значений, замещаются соответству- ющими значениями.
17

Рис. 6. Принцип работы робастного преобразования данных.
4

. Отбор электродов
Современные электроэнцефалографы оснащены десятками электродов, однако информация, получаемая при помощи такого количества сенсоров, является избы- точной. Кроме того, увеличение числа электродов ведёт к повышению стоимости устройства и времени на подготовку к использованию, что является недопустимым для электроэнцефалографов, разработанных для коммерческого использования.
В связи с этим в современных исследованиях по тематике нейрокомпьютерных интерфейсов наиболее распространены два подхода к решению данной проблемы:
1) выбор электродов с учётом априорных знаний о локализации компонент сигнала на скальпе;
2) использование методов отбора признаков.
4.2
Построение признакового пространства
Применение классических методов распознавания в классе задач нейрокомпью- терных интерфейсов малоэффективно в силу множества причин, среди которых высокая степень зашумлённости данных, высокая размерность пространства, а также многомерность самих сигналов и т. п. В связи с этим этап построения признакового пространства является самым важным в процессе решения задачи.
Проблема заключается в том, что не существует единого метода поиска нового признакового пространства. Каждый исследователь сталкивается с необходимостью поиска признакового пространства для эффективного решения конкретной постав- ленной задачи с использованием конкретного оборудования.
18

1

. Слепое разделение источников
Методы слепого разделения источников (англ. blind source separation) основаны на предположении о том, что регистрируемые сигналы для мультиканального устройства являются смесью сигналов из различных источников, и предпринима- ют попытку выделить исходные источники с учётом некоторых предположений об их природе. Классическим примером задачи, иллюстрирующей функциональность данных методов, является «задача коктейльной вечеринки» (англ. cocktail party problem). Предполагается, что фиксируемые сигналы X(t) = [x
1
(t), . . . , x
N
e
(t)] с ис- пользованием N
e сенсоров являются линейными комбинациями p исходных сигналов
S(t) = [s
1
(t), . . . , s p
(t)]:
X(t) = AS(t),
где A ∈ R
N
e
×p
– неизвестная смешивающая матрица. Отметим, что для успешного решения задачи необходимо выполнения условия N
e p. Метод слепого разделения источников производит поиск соответствующей разделяющей матрицы W , наилуч- шим образом оценивающей исходные сигналы:
S(t) = W X(t),
где S(t) — оценка компонент источников S(t). Кроме того, есть возможность оценки смешивающей матрицы A и последующей реконструции исходных данных.
Метод главных компонент.
Метод главных компонент (англ. principal component analysis, PCA) — метод поиска линейного преобразования данных путём максимиза- ции дисперсии преобразованных данных. Задача может быть решена с использова- нием собственных векторов эмпирической матрицы ковариаций X
T
X:
X
T
Xα = λα,
где α — собственный вектор матрицы, отвечающий собственному значению λ. Набор собственных векторов образует ортогональный базис, в котором представляются исходные данные. В случае отсортированных в порядке убывания собственных зна- чений большая часть вариации данных будет сосредоточена в первых координатах,
что позволяет перейти к пространству меньшей размерности.
19

Метод независимых компонент.
Метод независимых компонент (англ. independent component analysis, ICA) — метод, который может быть применен к произвольному набору случайных величин с целью нахождения линейного преобразования, мак- симизирующего статистическую независимость результирующих компонент. В то время как метод главных компонент опирается лишь на статистические моменты второго порядка, метод независимых компонент может быть назван его обобщением.
В [3] данный метод определяется как оптимизационная задача минимизации сов- местной информации компонент источников. В упомянутом исследовании был пред- ставлен эффективный алгоритм вычисления негауссовости, напрямую связанной со статистической независимостью.
При использовании в задачах классификации волн P300 метод независимых компонент показал способность изолировать данный тип волн в качестве компонент источников, упомянутых выше.
Существует множество различных реализаций метода независимых компонент,
отличающихся в том числе используемым определением независимости компонент источников. По результатам сравнения нескольких ICA алгоритмов [3], используе- мых в исследованиях нейрокомпьютерных интерфейсов, для применения в данной работе был выбран алгоритм FastICA [5], продемонстрировавший хорошие результа- ты и использующий коэффициент эксцесса в качестве меры негауссовости.
Коэффициент эксцесса является мерой остроты пика распределения случайной величины и определяется формулой
γ
2
=
E[(X − EX)
4
]
(DX)
2
− 3.
Значение данного коэффициента позволяет проводить сравнение распределения некоторой случайной величины и нормального распределения, поскольку коэффици- ент эксцесса нормального распределения равняется нулю. Положительное значение коэффициента эксцесса означает, что большая часть дисперсии сигнала является результатом значимых, однако редко имеющих место отклонений, тем самым по- рождая распределение с «тяжелыми» хвостами. Алгоритм FastICA проводит поиск источников, отвечающих экстремуму коэффициента эксцесса.
20

2

. Морфологические признаки
Морфологические признаки описывают изменения амплитуд нейрофизиологи- ческих сигналов, происходящие в течение определённого временного промежутка.
Часто используемая стратегия разделения фоновой активности и волн P300 состоит в применении фильтра низких частот или фильтра с некоторой полосой пропускания с последующим возможным прореживанием сигнала, поскольку большая часть компоненты волны P300 сконцентрирована именно в области низких частот, а потому описанная процедура позволяет нейтрализовать влияние избыточной информации.
Помимо прочего, это также ведёт к снижению размерности сигнала.
Пусть имеется сигнал x = [x
1
, . . . , x
T
]. Для описания формы сигнала могут быть вычислены морфологические признаки, используемые отдельно или совместно с другими признаками. Некоторые из них перечислены ниже.
• Амплитуда — максимальное значение сигнала: x max
= max t=1,...,T
{x t
}.
• Латентность — момент регистрации максимального значения сигнала для вызванных потенциалов: t max
= arg max t=1,...,T
{x t
}, где x регистрируется в течение фиксированного промежутка после выделения стимула.
• Отношение латентность/амплитуда: LAR =
t max x
max
• Абсолютная амплитуда: AAM P = max t=1,...,T
|x t
|.
• Абсолютное отношение латентность/амплитуда: ALAR =
arg max t=1,...,T
|x t
|
max t=1,...,T
|x t
|
• Положительная область — сумма положительных значений сигнала:
P AR =
T
t=1
x t
+ |x t
|
2
• Отрицательная область — сумма отрицательных значений сигнала:
N AR =
T
t=1
x t
− |x t
|
2
• Межпиковая разность: P P = x max
− x min
, где x max и x min
— максимальное и минимальное значения сигнала соответственно.
• Межпиковое расстояние: P P T = t max
− t min
21

3

. Преобразование Фурье
Зачастую анализ сигналов проводится при помощи разложения на «базисные»
функции, каждая из которых отвечает некоторой частоте. Таким образом можно проанализировать степень выраженности колебаний некой частоты. В частности,
преобразование Фурье использует в качестве базисных функций синусоиды. Для дискретных сигналов, имеющих место в задаче построения нейрокомпьютерного интерфейса, применяется дискретное преобразование Фурье (ДПФ).
Пусть имеется дискретный сигнал x = [ x
0
, . . . , x
N −1
]. Тогда его можно предста- вить в виде линейной комбинации дискретных синусоид следующего вида:
x n
=
N
2
k=0
C
k cos
2πk(n + φ
k
)
N
=
N
2
k=0
A
k cos
2πkn
N
+
N
2
k=0
B
k sin
2πkn
N
,
n = 0, N − 1.
Для каждого сигнала можно однозначно определить коэффициенты A
k
, B
k
, на- зываемые спектром сигнала. Получение коэффициентов при имеющемся сигнале называется прямым преобразованием Фурье, в то время как обратный процесс,
синтез сигнала по имеющимся коэффициентам, называется обратным преобразова- нием Фурье. Наиболее часто используется быстрое преобразование Фурье (БПФ),
позволяющее выполнять преобразования значительно быстрее за счёт наличия повторяющихся значений при вычислениях в силу периодичности функции синуса.
По аналогии можно произвести подобное разложение и для двумерного сигнала,
при этом непосредственное вычисление двумерного ДПФ по полученным формулам требует огромных вычислительных затрат. Однако можно показать, что двумерное
ДПФ обладает свойством сепарабельности, то есть его можно вычислить последова- тельно по двум измерениям.
Отметим также, что преобразование Фурье является чувствительным к шуму.
4

. Вейвлет-преобразование
Вейвлет-преобразование — интегральное преобразование, которое представля- ет собой свертку вейвлет-функции, обладающей рядом характерных свойств,
с сигналом. По аналогии с преобразованием Фурье происходит некое разло-
22
жение исходного сигнала. Для дискретных сигналов используется дискретное вейвлет-преобразование.
Дискретное вейвлет-преобразование осуществляется путём применения набора фильтров. Сигнал подвергается действию фильтра низких частот с импульсным откликом g и фильтра высоких частот с импульсным откликом h, в результате чего могут быть получены т.н. коэффициенты аппроксимации и детализирующие коэффициенты соответственно. После этого каждый из наборов коэффициентов прореживается в два раза. Кроме того, данное разложение может быть повторено с дальнейшим прореживанием коэффициентов после низкочастотной и высокоча- стотной фильтрации. Данный процесс может быть представлен в виде двоичного дерева. Схема действия одно- и трёхуровнего дискретного вейвлет-преобразования приведена на рис. 7.
а)
б)
Рис.
7.
Схема действия одно-
(а)
и трёхуровнего
(б)
дискретного вейвлет-преобразования.
5

. Общий пространственный фильтр
Общий пространственный фильтр (англ. common spatial pattern filter, CSP) реа- лизует метод декомпозиции многоканального ЭЭГ сигнала, основанный на обучении по прецедентам.
23

Рассматривается задача классификации многомерных сигналов на два класса.
Целью метода является разложение исходного сигнала на аддитивные составляющие таким образом, чтобы максимизировать дисперсию первых компонент и миними- зировать дисперсию последних для объектов первого класса и добиться обратной ситуации для объектов второго класса. Матрица декомпозиции может быть найдена в результате одновременной диагонализации выборочных матриц ковариации для каждого из классов. В результате может быть сформирован вектор характерных признаков путём соединения значений некоторого количества первых и последних компонент разложенного сигнала.
Метод также может быть обобщён для применения к задачам с количеством классов, большим двух, путём разбиения исходной задачи на бинарные подзадачи с использованием схем «один против одного» или «один против всех».
4.3
Классификация
После построения искомого признакового пространства алгоритм, используемый для классификации преобразованных объектов, играет не столь значительную роль.
После предобработки и преобразования исходных данных проводится обучение классификатора, после чего обученный классификатор может принимать решение о наличии либо отсутствии волн P300 и, как следствие, о необходимости выполнять действие, предписанное стимулом. Наиболее часто в исследованиях по тематике BCI
используются описанные ниже типы классификаторов. Более подробное описание данных алгоритмов может быть найдено в [11].
1

. Байесовский классификатор
Байесовский классификатор — широкий класс алгоритмов классификации, осно- ванный на принципе максимума апостериорной вероятности. Для классифицируе- мого объекта вычисляются функции правдоподобия каждого из классов, по ним вычисляются апостериорные вероятности классов. Объект относится к тому классу,
для которого апостериорная вероятность максимальна.
Байесовский подход к классификации основан на теореме, утверждающей, что если плотности распределения каждого из классов известны, то искомый алгоритм
24
можно выписать в явном аналитическом виде. Более того, этот алгоритм оптимален,
то есть обладает минимальной вероятностью ошибок.
На практике плотности распределения классов, как правило, не известны. Их приходится оценивать (восстанавливать) по обучающей выборке. В результате байесовский алгоритм перестаёт быть оптимальным, так как восстановить плотность по выборке можно только с некоторой погрешностью. Зачастую в исследованиях по тематике создания нейрокомпьютерного интерфейса в качестве функции правдопо- добия для объекта используется смесь нормальных распределений.
2

. Линейный дискриминант Фишера
Линейный дискриминант Фишера (ЛДФ) — особый вариант байесовского класси- фикатора. Рассмотрим задачу классификации на два класса. Предполагается, что обучающая выборка составлена таким образом, что классы распределены по нор- мальному закону, а матрицы ковариаций классов равны. Простота классификации линейным дискриминантом Фишера — одно из достоинств алгоритма: в случае с двумя классами в двумерном признаковом пространстве разделяющей поверхностью будет прямая. Если классов больше двух, то разделяющая поверхность будет кусочно-линейной.
Данный метод классификации не требует больших вычислительных затрат, а потому является распространённым в приложениях, функционирующих в режиме реального времени.
3

. Нейронные сети
Нейронные сети широко используются во многих приложениях, решающих задачу классификации, поскольку обладают гибкостью. Классическая модель нейронной сети состоит из узлов, называемых нейронами, и связей между ними, называемых синапсами, при этом узлы организованы в т.н. слои. Входной слой получает век- тор описания объекта, подвергаемого классификации, выходной слой принимает итоговое решение о классификации данного объекта. Помимо двух упомянутых слоёв в нейронной сети также может присутствовать некоторое количество скрытых слоёв. Каждому из синапсов ставится в соответствие некоторое вещественное число,
25
называемое весом, используемое при вычислении входных данных для следующего слоя нейронов. Каждому из нейронов ставится в соответствие некоторая функция активации, применяемая к сумме данных всех синапсов, оканчивающихся в данном нейроне, с целью получения выхода данного нейрона.
Задача обучения нейронной сети состоит в настройке весов синапсов, имеющих место в используемой модели. Одной из широко применяемых моделей нейронных сетей в задачах построения нейрокомпьютерных интерфейсов является сеть прямого распространения, обучаемая при помощи метода обратного распространения ошибки
(англ. backpropagation).
4

. Метод опорных векторов
Метод опорных векторов (англ. support vector machine, SVM) — набор схожих алгоритмов обучения с учителем, принадлежащий к семейству линейных клас- сификаторов. Особым свойством метода опорных векторов является непрерывное уменьшение эмпирической ошибки классификации и увеличение зазора, поэтому метод также известен как метод классификатора с максимальным зазором. Кроме того, на положение разделяющей гиперплоскости в действительности оказывает влияние небольшая часть объектов обучающей выборки. Метод также обобщается на случай нелинейной разделяющей поверхности.
Зачастую используется в исследованиях по тематике BCI в силу сводимости к за- даче квадратичного программирования и последующей эффективности вычислений.
5

. Метод k ближайших соседей
Метод k ближайших соседей (англ. k-nearest neighbor algorithm, kNN) — метод автоматической классификации объектов. Основным принципом метода ближайших соседей является тот факт, что объекту приписывается метка класса, наиболее рас- пространённого среди k наиболее близких в некотором смысле объектов обучающей выборки, где k — параметр алгоритма.
Таким образом, если в процессе формирования признакового пространства уда- лось некоторым образом локализовать объекты каждого из классов в некоторой области пространства, данный метод может быть использован для классификации
26
преобразованных объектов. Кроме того, среди достоинств данного метода следует упомянуть вычислительную простоту, что делает его простым для использования в приложениях, функционирующих в режиме реального времени.
4.4
Критерий качества
Важным аспектом всякой системы BCI является достигаемая скорость коммуни- кации. В системах, основанных на распознавании волн P300, данная характеристика зависит от межстимульного интервала, количества различных стимулов, качества работы классификаторов. Чтобы проследить зависимость от перечисленных факто- ров, будем использовать в качестве метрики для оценивания скорости коммуникации скорость передачи информации (битрейт). Битрейт оценивает количество бит, пере- даваемых испытуемым системе в единицу времени. Данная характеристика широко используется для оценки работы нейрокомпьютерных интерфейсов, в том числе и не основанных на волнах P300.
Определим матрицу ошибок для задачи классификации на два класса, разделив эпохи для целевых и нецелевых стимулов на верно и неверно классифицированные:
• a — количество верно классифицированных нецелевых эпох;
• b — количество неверно классифицированных нецелевых эпох;
• c — количество неверно классифицированных целевых эпох;
• d — количество верно классифицированных целевых эпох.
Предсказанный тип стимула
Нецелевой
Целевой
Реальный тип стимула
Нецелевой a
b
Целевой c
d
Таблица 2. Матрица ошибок для задачи распознавания волн P300.
Таким образом, можно составить таблицу 2. Чувствительностью (англ. true positive rate, TPR) называется доля верно классифицированных целевых эпох,
специфичностью (англ. false positive rate, FPR) — доля неверно классифицированных
27
нецелевых эпох. Данные величины могут быть вычислены по следующим формулам:
T P R =
d c + d
,
F P R =
b a + b
Положим n
1
= c + d — количество целевых эпох, n
2
= a + b — количество нецелевых эпох. Тогда битрейт может быть вычислен по следующей формуле:
BR =
d n
1
+ n
2
×
60
ISI
× log
2
(N
st
),
где ISI — межстимульный интервал (сек), т.е. промежуток времени между демон- страцией двух последовательных стимулов, N
st
— количество различных визуальных стимулов, используемых в эксперименте.
Кроме указанных величин, точность системы может быть вычислена по форму- ле:
Accuracy% =
a + d a + b + c + d
× 100%.
Указанные величины широко используются в литературе по исследуемой те- матике для оценки качества функционирования системы. В связи с этим будем использовать совокупность указанных характеристик для оценки эффективности интерфейса.
28

5
Проведение эксперимента
5.1
Парадигма эксперимента
Как правило, в исследованиях на основе визуальных стимулов используется следующая схема получения данных:
• Испытуемому в течение t
1
секунд демонстрируется визуальный стимул либо ментальное задание, которое предстоит выполнить. Значение t
1
варьируется для различных типов исследований.
• В течение t
2
секунд испытуемый сосредотачивает внимание на визуальном стимуле либо выполняет указанное ментальное задание. Кроме того, в про- цессе этого действия происходит запись данных. Значение t
2
варьируется для различных типов исследований.
• Визуальный стимул перестаёт демонстрироваться испытуемому, проводится краткая пауза для восстановления расслабленного состояния и подготовки к следующей итерации.
После изучения материалов по исследуемой тематике и различных видов пара- дигм, используемых для тестирования применимости разработанных систем управ- ления, было принято решение провести две серии эксериментов, использующих различные виды визуальных стимулов.
Получение данных для каждого из двух испытуемых производилось следующим образом. Испытуемый располагался лицом к монитору компьютера с устройством
Emotiv EPOC, расположенным на голове. На экране монитора было изображено квадратное поле, разбитое на 100 равных квадратов прямыми, параллельными его сторонам, путём деления каждой стороны на 10 равных отрезков. Каждый из квад- ратов является возможным положением курсора на экране компьютера. Целью ис- пытуемого являлось управление курсором в виде голубого квадрата, расположенного на экране компьютера, от начального до обозначенного конечного положения путем перемещения сначала по горизонтали, а затем — по вертикали. Четыре визуальных стимула выделялись на экране последовательно случайным образом, в каждый момент времени было выделено не более одного визуального стимула. В первой
29
серии экспериментов в качестве визуальных стимулов выступали изображения стрелок, отвечающих четырём возможным направлениям движения курсора (вверх,
вниз, влево, вправо); во второй серии экспериментов использовались текстовые надписи, описывающие одно из указанных направлений движения. Внешний вид используемого поля и визуальных стимулов в двух сериях экспериментов изобра- жен на рис. 8. Испытуемому требовалось сконцентрировать внимание на стимуле,
отвечающем желаемому направлению движения (целевом стимуле с вероятностью появления 25%), и игнорировать остальные стимулы, отвечающие нежелательным направлениям движения курсора (нецелевые стимулы с вероятностью появления
75%).
а)
б)
Рис. 8. Поле и визуальные стимулы, изображённые на экране компьютера в процессе проведения серий экспериментов с различными видами стимулов.
Пробой назовем последовательность из выделения некоторого визуального сти- мула в течение 250 мс, а также последующие 1250 мс, необходимые для обработки,
классификации данных, генерации команды и выполнения перемещения курсора.
Межстимульный интервал при проведении эксперимента равнялся 2500 мс, включая время, необходимое на обработку и классификацию данных. Назовём сессией после- довательность проб, предпринятых для достижения курсором целевого положения.


Поделитесь с Вашими друзьями:
1   2   3


База данных защищена авторским правом ©nethash.ru 2017
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал