Методы прогнозирования оптимальных доз инсулина для больных сахарным диабетом I типа. Обзор # 04, апрель 2009



Скачать 320.48 Kb.
страница2/3
Дата17.02.2017
Размер320.48 Kb.
Просмотров181
Скачиваний0
1   2   3

1.2.2. Модель 1 Беннета и Гоурли (D.L.Bennet, S.A. Gourley) [2] для описания динамики глюкозы и инсулина использует систему ОДУ с запаздывающим аргументом (см. (2))

http://technomag.edu.ru/data/247/686/1234/image067.gif                                (7)

            З

 

 

десь http://technomag.edu.ru/data/245/686/1234/image068.gif - временная задержка выработки инсулина, величина http://technomag.edu.ru/data/251/686/1234/image069.gif - определяет скорость расщепления глюкозы инсулином в крови.



1.2.3. Модель 2 Беннета и Гоурли [2] представляет собой упрощенную модель (7). Модель также учитывает временную задержку в выработке инсулина по отношению ко времени поступления глюкозы в кровь и имеет вид

http://technomag.edu.ru/data/249/686/1234/image070.gif

 

где http://technomag.edu.ru/data/255/686/1234/image071.gif, http://technomag.edu.ru/data/253/686/1234/image072.gif, http://technomag.edu.ru/data/699/687/1234/image073.gif для любых http://technomag.edu.ru/data/697/687/1234/image074.gif из промежутка http://technomag.edu.ru/data/703/687/1234/image075.gif, http://technomag.edu.ru/data/701/687/1234/image076.gif для любых http://technomag.edu.ru/data/697/687/1234/image074.gif из промежутка http://technomag.edu.ru/data/707/687/1234/image077.gif, http://technomag.edu.ru/data/241/686/1234/image066.gif – время задержки выработки инсулина, http://technomag.edu.ru/data/267/686/1234/image061.gif – время задержки расщепления глюкозы, http://technomag.edu.ru/data/705/687/1234/image078.gif – скорость уменьшения количества инсулина в крови.



1.3.   Модели на основе интегро-дифференциальных уравнений

1.3.1. Модель де Гаетано и Арино (A.De Gaetano, O.Arino) [2] разработана на основе модели Бергмана (1). Выполнив формальный математический анализ этой модели, де Гаетано и Арино предложили ее улучшенный вариант, названной ими динамической моделью (dynamic model):

http://technomag.edu.ru/data/711/687/1234/image079.gif

          

 

Здесь http://technomag.edu.ru/data/709/687/1234/image080.gif, http://technomag.edu.ru/data/683/687/1234/image081.gif, http://technomag.edu.ru/data/681/687/1234/image082.gif, http://technomag.edu.ru/data/687/687/1234/image083.gif; значение параметра http://technomag.edu.ru/data/685/687/1234/image084.gif определяется базальным уровнем глюкозы http://technomag.edu.ru/data/377/686/1234/image006.gif, ib – базальный уровень инсулина.



1.4.   Модели на основе дифференциальных уравнений в частных производных

1.4.1. В работе [2] рассмотрена модель динамики инсулина и глюкозы на основе дифференциальных уравнений в частных производных (ДУЧП), полученная при допущении, что вводимый раствор инсулина распространяется в подкожной ткани только в виде гексамерных и димерных молекул, причем проникать в капилляры могут только димерные молекулы. Модель представляет собой систему двух дифференциальных уравнений в частных производных

http://technomag.edu.ru/data/691/687/1234/image085.gif

 

где http://technomag.edu.ru/data/689/687/1234/image086.gif и http://technomag.edu.ru/data/233/686/1234/image046.gif – концентрация димерного и гексамерного инсулина, соответственно, http://technomag.edu.ru/data/695/687/1234/image087.gif – постоянная скорости, http://technomag.edu.ru/data/693/687/1234/image088.gif – химическая постоянная равновесия, http://technomag.edu.ru/data/233/686/1234/image046.gif – диффузионная постоянная, http://technomag.edu.ru/data/731/687/1234/image089.gif – постоянная скорости поглощения инсулина.



 

2. Нейросетевые алгоритмы прогнозирования значений уровня глюкозы в крови

2.1. Алгоритмы на основе нейронных сетей прямого распространения

            2.1.1. Сеть с функциями активации в виде обратной квадратичной функции [3] является трехслойной и содержит во входном слое http://technomag.edu.ru/data/729/687/1234/image090.gif нейронов, http://technomag.edu.ru/data/735/687/1234/image091.gif нейронов - в скрытом слое и один нейрон - в выходном слое.

Входами сети являются значения уровней BG и инсулина http://technomag.edu.ru/data/733/687/1234/image092.gif, http://technomag.edu.ru/data/739/687/1234/image093.gif, соответственно, в моменты времени: http://technomag.edu.ru/data/737/687/1234/image094.gif Значение на выходе нейронной сети интерпретируется как уровень подкожного содержания глюкозы в следующий момент времени.

                В качестве функции активации нейронов используется обратная квадратичная функция (reciprocal multiquadric function). Обучение сети реализовано на основе модифицированного алгоритма метода наименьших квадратов.

                2.1.2. Опережающая (feed-forward) нейронная сеть (далее FFNN) [5] является полносвязной, трехслойной (типы используемых нейронов в публикации не указаны). На вход сети подаются следующие величины (см. п. 1.1.5):

·               последнее измеренное значение BG;

·               выходная величина модели http://technomag.edu.ru/data/219/686/1234/image053.gif в моменты времени http://technomag.edu.ru/data/743/687/1234/image095.gif, http://technomag.edu.ru/data/741/687/1234/image096.gif, http://technomag.edu.ru/data/715/687/1234/image097.gif, http://technomag.edu.ru/data/713/687/1234/image098.gif;

·               выходная величина модели http://technomag.edu.ru/data/217/686/1234/image054.gif в моменты времени http://technomag.edu.ru/data/743/687/1234/image095.gif, http://technomag.edu.ru/data/719/687/1234/image099.gif;

·               выходная величина модели http://technomag.edu.ru/data/223/686/1234/image055.gif в момент времени http://technomag.edu.ru/data/743/687/1234/image095.gif;

·               выходная величина модели http://technomag.edu.ru/data/221/686/1234/image056.gif в момент времени http://technomag.edu.ru/data/743/687/1234/image095.gif;

·               выходная величина модели http://technomag.edu.ru/data/259/686/1234/image057.gif в моменты времени http://technomag.edu.ru/data/743/687/1234/image095.gif, http://technomag.edu.ru/data/741/687/1234/image096.gif, http://technomag.edu.ru/data/715/687/1234/image097.gif, http://technomag.edu.ru/data/713/687/1234/image098.gif.

            Выходом сети является прогнозируемое значение уровня BG. Для обучения сети используется алгоритм обратного распространения ошибки.

2.2. Алгоритмы на основе реккурентных нейронных сетей

2.2.1. Реккурентная сеть Элмана [6] состоит из входного, скрытого, контекстного и выходного слоев (Рис. 1).

Входной слой сети содержит два нейрона, на входы которых поступают значения уровня инсулина и уровня BG. Скрытый слой может содержать от 1 до 10 нейронов - единственным условием является равенство количества нейронов скрытого и контекстного слоев. Контекстный слой обеспечивает обратную связь. Аксоны скрытого слоя связаны с входами выходного слоя и, одновременно, с входами контекстного слоя. Выходные сигналы контекстного слоя поступают на входы скрытого слоя и с задержкой - на входы контекстного слоя. Выходом сети является прогнозируемое следующее значение уровня BG.

 

http://technomag.edu.ru/data/717/687/1234/image100.jpg

Рис. 1. Схема нейронной сети Элмана: http://technomag.edu.ru/data/723/687/1234/image101.gif - задержка на один временной шаг

 

                В качестве функции активации нейронов используются следующие функции: для нейронов скрытого слоя – гиперболический тангенс; для нейронов выходного слоя – линейная функция. Веса связей скрытого и контекстного слоев равны единице, остальные веса подбираются в процессе обучения сети.

Для обучения нейронной сети используется алгоритм обратного распространения ошибки. При этом рекуррентная сеть разворачивается в сеть с прямыми связями, у которой входы соответствуют значениям глюкозы и инсулина в крови в предыдущие моменты времени (количество скрытых и контекстных слоев при этом, очевидно, увеличивается).

2.2.2. В работе [7] для прогноза уровня BG используется нейронная сеть, аналогичная сети, рассмотренной в п. 2.2.1. Сеть не имеет контекстного слоя, и выход каждого из нейронов рекуррентного слоя через задержку на один временной шаг поступает на входы всех нейронов рекуррентного слоя. На вход нейронной сети поступает 5 векторов:

·               вектор, содержащий информацию об инсулине, включая его тип, время и место инъекции;

·               вектор, определяющий количество потребленных углеводов;

·               вектор, содержащий информацию о физической нагрузке, включая информацию о длительности, интенсивности и подвижности нагрузки;

·               уровень BG;

·               вектор, включающий в себя информацию о стрессах, болезнях пациента и т.д.

Выходом сети является прогнозируемое значение уровня глюкозы в крови пациента. Для обучения сети использовались две модификации рекуррентного алгоритма обучения в реальном времени (real time recurrent learning – RTRL) – с учителем (RTRL-TF) и без учителя (RTRL-FR).

2.2.3. Трехслойная рекуррентная сеть [4] также состоит из входного, рекуррентного и выходного слоев. Выход каждого из нейронов рекуррентного слоя через задержку на один временной шаг поступает на входы всех этих нейронов (Рис. 2). Число нейронов скрытого слоя выбирается равным 5 – 15. Функция активации нейронов скрытого слоя – сигмоидальные функции, нейронов выходного слоя – линейная функция.

 

http://technomag.edu.ru/data/721/687/1234/image102.jpg



Рис 2. Схема трехслойной рекуррентной нейронной сети

 

На вход нейронной сети поступает три выходных значения математической модели пациента (см. п. 1.1.4), а также текущий уровень BG. Выходом сети является прогнозируемое значение уровня BG. Для обучения сети использовались алгоритм RTRL-TF и алгоритм RTRL-FR.   



 

3. Нейросетевые алгоритмы прогнозирования требуемых доз инсулина

3.1. Алгоритмы на основе нейронных сетей прямого распространения

3.1.1. Персептронная сеть с линейными функциями активации [8] является трехслойной. В первом слое сети содержится 12 нейронов (по одному на каждый вход), в промежуточном слое – 4 нейрона, в выходном слое – 1 нейрон.

Выход нейронной сети соответствует рекомендуемой дозе инсулина в данный интервал времени. На входы нейронной сети подаются следующие 12 величин:

·               уровень глюкозы в крови в данном временном интервале http://technomag.edu.ru/data/727/687/1234/image103.gif;

·               уровни глюкозы в крови в два предыдущих момента времени http://technomag.edu.ru/data/725/687/1234/image104.gif, http://technomag.edu.ru/data/635/687/1234/image105.gif;

·               уровни глюкозы в крови в данный и следующий момент времени прошлого дня http://technomag.edu.ru/data/633/687/1234/image106.gif, http://technomag.edu.ru/data/639/687/1234/image107.gif;

·               бинарная величина, единичное значение которой означает, что имел место дополнительный прием пищи в данном временном интервале http://technomag.edu.ru/data/637/687/1234/image108.gif;

·               количество инсулина введенного для купирования гипергликемий в данном временном интервале http://technomag.edu.ru/data/643/687/1234/image109.gif;

·               bolus за два предыдущих интервала времени http://technomag.edu.ru/data/641/687/1234/image110.gif, http://technomag.edu.ru/data/647/687/1234/image111.gif;

·               basal с начала дня http://technomag.edu.ru/data/645/687/1234/image112.gif;

·               bolus в данный момент прошлого дня http://technomag.edu.ru/data/619/687/1234/image113.gif;

·               нормализованный bolus в данный момент прошлого дня http://technomag.edu.ru/data/617/687/1234/image114.gif (нормализация учитывает отклонение bolus от стандартных значений, которые определяются диабетологами).

                Для обучения сетей используется метод обратного распространения ошибки.

            3.1.2. Персептронная сеть с сигмоидальной функцией активации [9] является трехслойной. Первый и скрытый слои сети содержат по 5 нейронов, выходной слой – один нейрон. Выходом сети является рекомендуемая доза инсулина. В качестве входов сеть использует следующие величины:

·               текущий уровень BG;

·               текущая доза каждого из трех типов инсулинов;

·               бинарная переменная http://technomag.edu.ru/data/637/687/1234/image108.gif (см. п. 3.1.1);

·               бинарная переменная, принимающая единичное значение в том случае, если в данном временном периоде имела место физическая нагрузка;

·               разница во времени между текущим и предыдущим значением BG.

Для обучения сети используется известный алгоритм Левернберга-Марквардта.



3.1.3. Сеть с радиальными базисными функциями [9] также является трехслойной. Входной слой содержит 5 нейронов, выходной слой – 1 нейрон. Количество нейронов скрытого слоя рекомендуется подбирать в процессе обучения.

            Выходом сети является рекомендуемая доза инсулина. В качестве входов сеть использует величины, аналогичные таким же величинам для нейронной сети, рассмотренной в п. 3.1.2.

Обучение сети осуществляется методом градиентного спуска.

3.1.4. Сеть с функцией активации в виде гиперболического тангенса [10] служит для кластеризации входных данных и в системе автоматического управления уровнем BG (см. п. 5.1.3). Сеть используется в качестве промежуточной сети - ее выходы интерпретируются другой сетью, которая имеет в качестве выхода уже уровень BG или следующей дозы инсулина. Сеть является трехслойной и содержит 11 нейронов во входном слое, 16 нейронов в скрытом слое (определено опытным путем) и 6 нейронов в выходном слое. Выходы нейронной сети являются бинарными, и в каждый момент времени только один из них принимает значение 1. Номер выходного нейрона с единичным значением соответствует номеру режима второй сети.

Для обучения сети используется алгоритм обратного распространения ошибки.

3.2. Алгоритмы на основе нечетких нейронных сетей

2.3.1. В работе [11] рассматривается семислойная нейронная сеть, структура которой представлена на Рис. 3. Слои сети выполняют следующие функции.

Входной слой (input layer) принимает входные данные.

Слой 1 (input label layer) производит кластеризацию входных данных методами нечеткой логики.

Слой 2 (rule layer). В данном слое из множества входных данных происходит выборка тех данных, которые соответствуют нечетким правилам. Число нейронов в слое равно количеству правил, по которым производится выборка.

Слой 3 (consequent layer). Каждый нейрон этого слоя реализует некоторый логический вывод, определяемый как взвешенная сумма правил предыдущего слоя.

Слой 4 (output possibility layer) производит разделение данных, полученных в предыдущем слое, на группы.

Слой 5 (output label layer) формирует решение задачи, которое интерпретируется следующим слоем.

http://technomag.edu.ru/data/623/687/1234/image115.jpg

 

Рис. 3. Структура нечеткой нейронной сети

 

Выходной слой (output layer) состоит из одного нейрона и формирует значение дозы инсулина, которую рекомендуется ввести в следующий момент времени.



            Для обучения нейронной сети используется двухэтапный алгоритм:

·               на первом этапе с помощью многоступенчатого алгоритма квантования векторов (multistage lattice vector quantization - MLVQ) выполняется кластеризации данных и построение нечеткой функции принадлежности (fuzzy membership functions) входов и выходов;

·               на втором этапе на основе алгоритма однопроходной идентификации правил (novel one-pass rule-identification algorithm) производится идентификации нечетких правил.

 

4. Cистемы прогнозирования следующих значений уровня глюкозы в крови пациента



4.1. Системы на основе рекуррентной сети Элмана

4.1.1. Система прогнозирования следующего уровня BG [6] построена на основе нейронной сети Элмана (см. п. 2.2.1). Выбор сети Элмана обосновывается рядом преимуществ этой сети по сравнению с сетями с прямыми связями. Прогнозируемое значение уровня инсулина зависит от многих факторов в предыдущие моменты времени, поэтому сеть должна хранить некоторую информацию о них. В прямой сети это достигается использованием «скользящего» окна во входном слое, что требует большого количества нейронов во входном слое и влечет за собой высокую сложность обучения сети. В сети Элмана хранение информации о предыдущих моментах времени реализуется с помощью обратных связей, и сеть лишена указанного недостатка сетей с прямыми связями.

4.1.2. В аналогичной системе [4] используется трехслойная нейронная сеть, рассмотренная в п. 2.2.3. Методом проб и ошибок получено оптимальное значение количества нейронов в рекуррентном слое, равное 95.

4.2. Системы, использующие модель в виде ОДУ и рекуррентную нейронную сеть




Поделитесь с Вашими друзьями:
1   2   3


База данных защищена авторским правом ©nethash.ru 2017
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал