MACROBUTTON MTEditEquationSection2 Equation Chapter 1 Section 1 SEQ
MTEqn \r \h \* MERGEFORMAT SEQ MTSec \r 1 \h \* MERGEFORMAT SEQ
MTChap \r 1 \h \* MERGEFORMAT Дніпропетровський національний
університет

Мацуга Ольга Миколаївна

УДК 519.254:519.237.8:61

Інформаційна технологія обробки неоднорідних медичних даних для
підтримки прийняття рішень під час діагностики

05.13.06 – Автоматизовані системи управління

та прогресивні інформаційні технології

Автореферат

дисертації на здобуття наукового ступеня

кандидата технічних наук

Дніпропетровськ – 2007

Дисертацією є рукопис

Робота виконана в Дніпропетровському національному університеті
Міністерства освіти і науки України

Науковий керівник:

доктор технічних наук, професор Приставка Олександр Пилипович,
Дніпропетровський

національний університет, професор кафедри математичного забезпечення
ЕОМ.

Офіційні опоненти:

доктор технічних наук, професор Малайчук Валентин Павлович,
Дніпропетровський

національний університет, професор кафедри радіоелектронної автоматики;

доктор технічних наук, професор Прокопенко Ігор Григорович, Національний
авіаційний університет, завідувач кафедри авіаційних радіоелектронних
комплексів.

Захист відбудеться 28 вересня 2007 р. о 14 годині на засіданні
спеціалізованої

вченої ради К 08.051.01 при Дніпропетровському національному
університеті за адресою:

49044, м. Дніпропетровськ, пр. Карла Маркса, 35, корп. 3.

З дисертацією можна ознайомитись у бібліотеці Дніпропетровського
національного

університету за адресою: 49050, м. Дніпропетровськ, вул. Козакова, 8.

Автореферат розіслано 27 серпня 2007 р.

Вчений секретар

спеціалізованої вченої ради Земляна С.В.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. У сучасних інформаційних технологіях аналізу та
діагностики серцево-судинних захворювань, зокрема артеріальної
гіпертензії (АГ), усе більше уваги приділяється дослідженню ролі
психоемоціональних факторів у механізмах розвитку та перебігу
захворювання. Різноманітність психоемоціональних проявів та
невизначеність із нормативними величинами психологічних показників
значно ускладнюють процес дослідження та діагностики АГ з їх
урахуванням. У даному контексті актуальним є впровадження нових
інформаційних технологій автоматизованої обробки медичних даних,
спрямованих на підвищення адекватності та вірогідності отримуваних
висновків.

Підвищення вірогідності висновків за вхідними даними може бути досягнуте
введенням до складу інформаційної технології моделей та методів на
основі сумішей і сплайн-розподілів. Вагомий внесок у розробку теорії
сплайн-перетворень зробили I.Shoenberg, K.de Boor, М.П. Корнійчук, С.Б.
Стєчкін, Ю.М. Субботін, А.О. Лигун, П.О. Приставка, В.М. Вапник та інші
вчені. У застосування параметричних сплайн-розподілів для аналізу
неоднорідних імовірнісних структур значний внесок зроблений О.П.
Приставкою. Суміші розподілів та методи їх розщеплення досліджені в
роботах G. McLachlan, О.В. Міленького, С.А. Айвазяна, І.Г. Прокопенка та
інших учених. У ході обробки медичних даних застосування моделей сумішей
та сплайн-розподілів обґрунтоване неоднорідністю, яка пов’язана із
наявністю у пацієнтів супутніх діагнозів, різних стадій одного і того
самого захворювання, впливом зовнішніх факторів на стан їх здоров’я. При
цьому практичної реалізації в медичних дослідженнях набули, головним
чином, суміші розподілів, у той час як сплайн-розподілам не була
приділена достатня увага, хоча наявність поділяючих прямих в їх описі
робить пріоритетним їх застосування. Частково це пов’язано з тим, що не
знайшла свого повного розв’язку задача відтворення двовимірних та
багатовимірних сплайн-розподілів. А саме вони є найбільш адекватними для
задач медичної діагностики з урахуванням декількох показників.

Таким чином, постає завдання створення нової інформаційної технології
автоматизованої обробки неоднорідних медичних даних, яка б дозволила
підвищити адекватність і вірогідність діагностики психологічних
особливостей у хворих на АГ. В основу інформаційної технології
пропонується покласти моделі сумішей та сплайн-розподілів, які дозволять
урахувати неоднорідність даних і покращити якість аналізу.

Наукове завдання. Створення інформаційної технології автоматизованої
обробки неоднорідних медичних даних, яка забезпечує підтримку прийняття
рішень медичним фахівцем під час діагностики захворювання.

Зв’язок роботи з науковими програмами, планами, темами. Результати
дисертаційної роботи отримано в період 2004–2007 рр. за тематичними
планами науково-дослідних робіт:

держбюджетної теми № 0104U000961 “Розробка методів обробки даних та
автоматизованої інформаційної технології моніторингу “ViStAMed” (на
прикладі добового моніторингу артеріального тиску серцево-судинної
системи)”, державний обліковий № 0205U006460;

держбюджетної теми № 0199U001556 “Клініко-функціональна, імунологічна
оцінка ефективності нових методів медикаментозної терапії найбільш
поширених серцево-судинних захворювань (АГ, атеросклероз, ІXС)”.

Мета роботи і задачі дослідження. Метою дисертаційної роботи є розробка
інформаційної технології обробки неоднорідних медичних даних на основі
одновимірних і двовимірних моделей сплайн-розподілів та сумішей
розподілів для підтримки прийняття рішень під час діагностики хворих на
артеріальну гіпертензію з урахуванням їх психологічного стану.

Для досягнення поставленої мети передбачається вирішення таких задач:

проаналізувати існуючу інформаційну технологію обробки неоднорідних
медичних даних під час діагностики хворих на артеріальну гіпертензію з
різними психологічними особливостями;

розробити та вивчити імовірнісну модель неоднорідних медичних даних у
вигляді функції двовимірного сплайн-нормального розподілу, визначити на
її основі правила класифікації;

удосконалити метод визначення норм медичних показників, розподіл яких
відмінний від нормального;

розробити метод визначення імовірностей перебування двох медичних
показників у межах їх нормативних величин на основі параметричної і
непараметричної оцінки функції розподілу даних показників;

розробити програмне забезпечення автоматизованої обробки неоднорідних
медичних даних на основі запропонованих методів і моделі для
забезпечення підтримки прийняття рішень під час діагностики хворих на
артеріальну гіпертензію з урахуванням їх психологічних особливостей.

Об’єктом дослідження є процес діагностики хворих на артеріальну
гіпертензію з урахуванням їх психологічних особливостей.

Предметом дослідження є інформаційна технологія автоматизованої обробки
неоднорідних медичних даних для підтримки прийняття рішень під час
діагностики хворих на артеріальну гіпертензію з урахуванням їх
психологічних особливостей.

Методи дослідження, застосовані в ході розв’язання поставлених задач:
методи теорії імовірностей і математичної статистики, розпізнавання
образів, статистичного моделювання, обчислювальної математики,
технології програмування.

Наукова новизна одержаних результатів полягає в такому:

Уперше запропоновано й досліджено модель розподілу неоднорідних медичних
даних у вигляді двовимірного сплайн-нормального розподілу з однією та
двома прямими склеювання, що дозволило алгоритмізувати та автоматизувати
процес обробки таких даних, провести класифікацію, визначати чіткі межі
між різними стадіями захворювання.

Удосконалено метод визначення норм медичних показників, який
відрізняється від існуючого введенням одновимірних моделей
сплайн-розподілів та сумішей розподілів, дозволяє врахувати
неоднорідність даних і підвищити адекватність отримуваних норм
показників.

Уперше запропоновано метод визначення імовірностей перебування двох
медичних показників у межах їх нормативних величин за рахунок поєднання
параметричного (на основі сумішей і сплайн-розподілів) і
непараметричного оцінювання функції щільності розподілу імовірностей
показників, що дозволяє скласти цілісну картину про перебіг захворювання
та виділити групи хворих з різними психосоматичним взаємозв’язками.

Практичне значення одержаних результатів полягає в такому:

Розроблено та реалізовано інформаційну технологію обробки неоднорідних
медичних даних, яка ґрунтується на методах та моделях на основі
сплайн-розподілів і сумішей розподілів, у тому числі запропонованих
автором. Складники інформаційної технології знайшли втілення в
деклараційному патенті № 10032 на корисну модель “Спосіб оцінки перебігу
артеріальної гіпертензії”.

Створено автоматизовану систему “VerMed”, що реалізує зазначену
інформаційну технологію та дозволяє проводити різнопланову обробку та
аналіз неоднорідних медичних даних. У системі реалізовано методи
визначення меж “норми-патології” показників, імовірностей перебування
двох показників у межах їх нормативних величин, первинного
статистичного, кореляційного аналізів, відтворення одновимірних і
багатовимірних розподілів з класу нормальних, кластерного аналізу і
класифікації.

Інформаційну технологію реалізовано до даних клініко-інструментального
та психологічного обстеження хворих на артеріальну гіпертензію, що
дозволило встановити відмінність норм психологічних показників у хворих
від норм здорових осіб і виділити групи хворих з різними
психосоматичними взаємозв’язками. Отримані результати узгоджуються із
літературними даними та дозволяють надати медичному фахівцю підтримку у
прийнятті рішень під час діагностики і подальшого лікування артеріальної
гіпертензії.

Результати дисертаційної роботи впроваджені в Кримському
республіканському НДІ фізичних методів лікування та медичної
кліматології ім. І.М. Сєченова, у науково-дослідний і навчальний процеси
Дніпропетровської державної медичної академії, Харківської медичної
академії післядипломної освіти, у діагностично-лікувальний процес
санаторіїв “Ай-Петрі” та “Україна”.

Інформаційну технологію пропонується використовувати для розв’язання
більш широкого кола медичних, геологічних, технічних задач тощо, де
мають місце структурні зміни процесу дослідження.

Особистий внесок здобувача. Дисертаційна робота є результатом
самостійного дослідження. У роботах, виконаних у співавторстві,
здобувачем виконано: запропоновано й реалізовано обчислювальну
технологію відтворення двовимірного сплайн-нормального розподілу [1; 10]
з подальшою класифікацією на його основі [9; 12]; досліджено властивості
часткових випадків двовимірного сплайн-нормального розподілу з однією та
двома прямими склеювання [20]; запропоновано метод визначення
імовірностей перебування двох медичних показників у межах їх нормативних
величин (зонах контролю) на основі параметричного і непараметричного
оцінювання функції щільності розподілу імовірностей показників [4; 5];
розроблено та апробовано автоматизовану систему обробки неоднорідних
медичних даних [7; 13]; запропоновано інформаційну технологію обробки
неоднорідних медичних даних [15; 19].

Апробація результатів дисертації. Результати дисертаційної роботи
доповідались та обговорювались на VI Міжнародній науково-технічній
конференції “АВІА-2004” (м. Київ, 2004), V Міжнародній науковій
конференції студентів та молодих учених “ПОЛІТ” (м. Київ, 2005), ІІ, ІІІ
та ІV Міжнародних науково-практичних конференціях “Математичне та
програмне забезпечення інтелектуальних систем” (м. Дніпропетровськ,
2004–2006), Міждержавних науково-методичних конференціях “Проблеми
математичного моделювання” (м. Дніпродзержинськ, 2004–2007), VII, VIII
та ІХ Міжнародних молодіжних науково-практичних конференціях “Людина і
космос” (м. Дніпропетровськ, 2005–2007), ХІІІ Міжнародній
науково-технічній конференції з автоматичного управління
“Автоматика-2006” (м. Вінниця, 2006), VIII Міжнародній конференції з
математичного моделювання “МКММ-2006” (м. Херсон, 2006), конференціях за
підсумками науково-дослідної роботи Дніпропетровського національного
університету (м. Дніпропетровськ, 2004–2006).

Публікації. Основні результати дисертації опубліковано у 20 роботах (у
тому числі 8 без співавторів), серед яких 5 робіт опубліковано у
виданнях, затверджених ВАКом України як фахові, 12 у тезах доповідей на
конференціях та 1 робота є деклараційним патентом на корисну модель.

Структура роботи. Дисертаційна робота складається із вступу, чотирьох
розділів, висновків, списку використаних джерел та додатків. Обсяг
роботи складає 122 сторінки основного тексту; робота містить 97 таблиць
(з них 76 – у додатках), 57 рисунків (14 – у додатках), 5 додатків,
список використаних джерел із 131 найменування.

ОСНОВНИЙ ЗМІСТ

У вступі обґрунтовано актуальність теми, сформульовано мету і задачі
досліджень, їх зв’язок з науковими програмами, визначено методи
досліджень, наведено загальну характеристику і структуру дисертації,
визначено її наукову новизну, практичне значення одержаних у роботі
результатів та особистий внесок автора, наведено відомості про
публікації та апробацію роботи.

У першому розділі дисертації наведено характеристику об’єкта дослідження
та висвітлено існуючі інформаційні технології обробки неоднорідних даних
у задачах медичної діагностики.

Розглянуто сучасну технологію діагностики АГ та відзначено наявність
взаємозв’язку АГ із психологічними особливостями людини, що потребує
урахування останніх під час діагностики. Відмічено, що існуюча методика
дослідження психологічних особливостей людини базується на нормах,
установлених для здорових осіб. Для діагностики цих особливостей у
хворих на АГ норми потребують уточнення. На основі аналізу методів
обстеження пацієнтів, що використовуються під час діагностики, визначено
основні показники для автоматизованої обробки.

Показано, що дані обстеження, які підлягають обробці неоднорідні, що
ускладнює застосування більшості статистичних методів, оскільки вони
базуються на нормальному законі розподілу. Обґрунтовано можливість
застосування моделей сумішей розподілів та сплайн-розподілів для обробки
таких даних. Здійснено огляд публікацій із застосування цих моделей для
обробки медичних даних, зокрема в кардіології. Висвітлено основні методи
їх відтворення. Даний огляд засвідчив недолік моделі суміші розподілів
для задачі медичної діагностики. Виходячи з існуючої практики постановки
діагнозу, коли наявність захворювання та його стадії визначаються за
заданою межею, модель суміші розподілів може втрачати свою
інформативність, оскільки заздалегідь не враховує факту часткового
випадку, коли поділ має бути строго по прямих. Доведено, що в такому
разі доцільним є введення моделі сплайн-нормального розподілу, яка
містить в якості параметрів поділяючі прямі.

Проаналізовано існуючі автоматизовані системи обробки неоднорідних
медичних даних і класифікації, у яких реалізовано суміші та
сплайн-розподіли. Проведений аналіз показав, що до складу систем суто
медичного призначення, як правило, не входить реалізація зазначених
розподілів. Універсальні та вузькоспеціалізовані статистичні пакети або
мають зависоку для пересічного користувача вартість, або вимагають
спеціальної статистичної підготовки.

Проведений аналіз методів та засобів обробки неоднорідних медичних даних
у рамках об’єкта дослідження дозволив сформулювати задачу розробки
інформаційної технології обробки неоднорідних медичних даних на основі
сумішей та сплайн-розподілів.

Другий розділ присвячено розробці обчислювальної технології та
алгоритмізації обробки неоднорідних медичних даних на основі
двовимірного сплайн-нормального розподілу. Для задач медичної
діагностики вперше запропоновано модель двовимірного сплайн-нормального
розподілу з однією та двома прямими склеювання, паралельними осям
спостережень. Такі прямі відповідають межам, що розділяють дані, які
характеризують різні стадії захворювання. Проведено дослідження моделей,
за результатами якого розроблено обчислювальні схеми їх відтворення,
алгоритмізований процес обробки даних і класифікації.

Для введення означених моделей припускається, що задано двовимірну
випадкову величину , реалізацію якої є масив . Для вводяться функції
розподілу:

– у вигляді двовимірного сплайн-нормального розподілу з однією прямою
склеювання

(1)

де – вектор параметрів розподілу; – функція розподілу двовимірного
нормального закону з параметрами , ; – пряма склеювання, у точках якої
функція неперервна; C = Const;

– у вигляді двовимірного сплайн-нормального розподілу з двома прямими
склеювання

(2)

де – вектор параметрів розподілу; , ; , – прямі склеювання, у точках
яких функція неперервна; C1, C2 = Const.

Для двовимірного сплайн-нормального розподілу з однією прямою
склеювання, з урахуванням маргінальної властивості функції розподілу,
визначено, що одновимірна випадкова величина , яка є складовою ,
розподілена за сплайн-нормальним законом з одним вузлом С, а – за
нормальним законом. З умови неперервності функції у точках прямої
склеювання, встановлено: , , , . У ході дослідження функції щільності
(рис. 1, а) зазначеного розподілу на модальність, визначено умови, за
яких вона є одно- або двомодальною.

За аналогією визначено, що для сплайн-розподілу з двома прямими
склеювання і , і розподілені за одновимірним сплайн-нормальним законом
з одним вузлом. Як вузли виступають С1 та С2 відповідно. Встановлено, що
неперервність функції у точках прямих склеювання має місце за таких
умов: , , , , , . У процесі дослідження функції щільності (рис. 2, б)
зазначеного розподілу на модальність встановлено, що вона може бути
одно-, дво-, три- або чотиримодальною, і визначено умови, за яких
досягаються дані кількості мод.

а б

Рис. 1. Функція щільності двовимірного сплайн-нормального розподілу:

а – з однією прямою склеювання; б – з двома прямими склеювання

Проведені дослідження двовимірного сплайн-нормального розподілу з однією
та двома прямими склеювання дозволили запропонувати обчислювальні схеми
їх відтворення. Суть останніх полягає у визначенні оцінок параметрів як
оцінок параметрів її складових та . Знаходження оцінок параметрів
одновимірного сплайн-нормального розподілу з одним вузлом проводилось на
основі вирішального правила при фіксованому вузлі (Приставка А.Ф.,
Райко О.В., 1987)

, (3)

де та – емпірична та статистична функції розподілів , ; l визначає
місцезнаходження вузла склеювання.

Зважаючи на те, що реалізації мають неоднорідний характер, оцінювання
коефіцієнта кореляції пропонується проводити за результатами відтворення
сплайн-регресійної залежності з одним вузлом.

Адекватність запропонованих обчислювальних схем підтверджена шляхом
реалізації обчислювального експерименту, який полягав у такому.
Проводилося моделювання масивів обсягу N, розподілених за двовимірним
сплайн-нормальним розподілом з подальшим відтворенням функцій розподілу.
Результати відтворення порівнювались із теоретичними функціями шляхом
перевірки гіпотези про рівність знайдених оцінок параметрів та значень
параметрів на основі t-тесту (, де – значення параметра; – його
оцінка; – середньоквадратичне оцінки). Крім того, для перевірки
вірогідності відтворення було застосовано критерій згоди (2-Пірсона.
Експерименти з моделювання проводилися 100 разів та усереднювались.
Суттєвим в ході реалізації критерію (2-Пірсона є вибір оптимальної
кількості класів по кожній змінній. Відомі співвідношення для їх
визначення передбачають однорідність даних, яка за початковими умовами
не має місця. Використовуючи результати проведеного дослідження функції
щільності двовимірного сплайн-розподілу на модальність, у роботі при
застосуванні критерію кількість класів по змінній, за якою відтворюється
одновимірний сплайн-нормальний розподіл, збільшувалась удвічі. Нижче
(табл. 1) наведено результати одного з експериментів для двовимірного
сплайн-нормального розподілу з двома прямими склеювання з параметрами
m1,1 = 150, m2,1 = 200, (1,1 = 25, (1,3 = 10, (2,1 = 30, (2,2 = 15, r =
0,9, C1 = 160, C2 = 205, ( = 0,05.

Таблиця 1

Результати обчислювального експерименту

m1,1 m2,1 (1,1 (1,3 (2,1 (2,2 r C1 C2 (2

N=50 Оцінка параметра 150,97 200,85 26,82 9,26 32,17 13,33 0,8742 157,77
204,47 0,6964

t-статистика (t?/N=2.01) -0,1716 -0,1581 -0,3106 0,0817 -0,3619 0,207
0,3676 0,1254 0,0214

N=100 Оцінка параметра 149,71 199,00 25,38 8,66 30,91 13,44 0,8839
160,44 205,84 0,439

t-статистика (t?/N=1.98) 0,111 0,002 -0,1147 0,2145 -0,2133 0,2155
0,3415 -0,0483 -0,0704

N=200 Оцінка параметра 149,85 199,80 25,14 9,24 30,36 14,11 0,8912
160,18 205,56 0,2693

t-статистика (t?/N=1.97) 0,0854 0,0836 -0,0647 0,1968 -0,1188 0,2271
0,2741 -0,0415 -0,0986

N=300 Оцінка параметра 149,85 200,04 25,37 9,38 30,52 14,25 0,8913
159,98 205,23 0,6176

t-статистика (t?/N=1.97) 0,0931 -0,0186 -0,1939 0,1913 -0,2007 0,2257
0,3314 0,0084 -0,0602

N=500 Оцінка параметра 150,02 200,12 25,00 9,63 30,13 14,76 0,8929
160,06 205,02 0,5238

t-статистика (t?/N=1.96) -0,0164 -0,0654 -0,0002 0,1391 -0,0594 0,0906
0,3518 -0,039 -0,0099

З метою автоматизації обробки неоднорідних медичних даних запропоновано
загальний алгоритм відтворення двовимірного сплайн-нормального
розподілу, який передбачає ідентифікацію одновимірного нормального
розподілу по кожній змінній за коефіцієнтами ексцесу та асиметрії.
Залежно від результатів ідентифікації відтворюється двовимірний
нормальний розподіл або двовимірний сплайн-нормальний розподіл з однією
чи двома прямими склеювання.

Перевагою двовимірного сплайн-нормального розподілу, як зазначалось, є
те, що його прямі склеювання можна трактувати як поділяючі, і
використовувати в задачі класифікації. Для двовимірного
сплайн-нормального розподілу з однією прямою склеювання має місце одна
лінійна поділяюча функція x1 (x2) = C. Вирішальне правило класифікації
має вигляд: об’єкт, заданий точкою M (x1, x2), належить класу

(4)

де I (x1, x2) – індикатор класу.

Для двовимірного сплайн-нормального розподілу з двома прямими склеювання
мають місце дві лінійні поділяючі функції x1 (x2) = C1, x2 (x1) = C2. І
вирішальне правило має вигляд: об’єкт, заданий точкою M (x1, x2),
належить класу

(5)

Розроблені обчислювальні схеми реалізовано в інформаційній технології,
поданій у розд. 3.

У третьому розділі наведено опис запропонованої інформаційної технології
обробки неоднорідних медичних даних, яка ґрунтується на моделях
введеного двовимірного сплайн-нормального розподілу та відомих
одновимірних і двовимірних розподілів з класу нормальних та забезпечує
підтримку прийняття лікарських рішень під час діагностики хворих на АГ з
урахуванням психологічних показників.

Технологія складається з трьох етапів. На першому етапі здійснюється
попередня статистична обробка результатів замірів показників, яка
включає підрахунок кількісних характеристик показників; ідентифікацію
нормального розподілу, тобто однорідності даних; вилучення аномальних
значень у випадку їх наявності. На другому етапі проводиться визначення
меж “норми-патології” психологічних показників для хворих на АГ з
перевіркою їх рівності прийнятим у медичній практиці нормам здорових
осіб. На останньому етапі, використовуючи визначені межі
“норми-патології”, виконується кластеризація хворих та визначаються
імовірності перебування показників у межах їх нормативних величин, які
будемо називати зонами контролю станів здоров’я.

Для підтримки прийняття рішень медичним фахівцем під час діагностики
психологічних особливостей у хворих на АГ удосконалено метод визначення
меж “норми-патології” показників, який враховує неоднорідність
результатів замірів.

Нехай задано заміри L показників у вигляді , де xq,i – значення

q-го показника для i-го пацієнта; N – кількість пацієнтів. Подамо у
вигляді , де . Позначимо через та нижню та верхню межі
“норми-патології” q-го показника, а через та – їх оцінки, визначені за
.

Традиційно в медичній практиці визначення меж “норми-патології”
проводиться у припущенні, що результати замірів показника нормально
розподілені: , де – оцінки середнього, середньоквадратичного значень
показника; – квантиль розподілу Стьюдента з кількістю степенів
вільності ( = N – 1; ( – похибка. У випадку неоднорідності результатів
замірів показника такі межі неадекватні. Пропонується їх визначення на
основі одновимірних моделей сумішей нормальних та сплайн-нормальних
розподілів. Запропонована процедура передбачає:

A ?

?

?

o

d

?

?

?

’ ” A ?

?

?

– вектор параметрів розподілу).

Вибір найбільш вірогідного розподілу за критеріями згоди (2-Мізеса,
уточненим критерієм Колмогорова або (2-Пірсона.

– оцінка вектора параметрів.

.

.

можуть бути визначені за допомогою методу ділення відрізка навпіл (або
іншим чисельним методом).

про рівність визначених меж та медичних норм на основі t-тесту

.

, головна гіпотеза Н0 приймається.

Разом із вищенаведеним, запропоновано метод визначення імовірностей
перебування двох показників у зонах контролю за рахунок поєднання
параметричного і непараметричного оцінювання функції розподілу
імовірностей показників. Оцінка імовірностей у зонах контролю на основі
непараметричного оцінювання функції розподілу показників із
застосуванням двовимірних локальних поліноміальних сплайнів на основі
В-сплайнів, близьких до інтерполяційних у середньому (Приставка П.О.,
2004), застосована в отриманому автором деклараційному патенті № 10032
на корисну модель “Спосіб оцінки перебігу артеріальної гіпертензії”.
Потреба в параметричних методах, які б дозволили отримати модель даних
із можливістю подальшого аналізу їх структури, зумовила введення сумішей
та сплайн-розподілів для оцінювання імовірностей у зонах контролю.

:

,

– межі зон контролю.

, проводиться згідно з виразом:

, t = 1,2,3, (6)

– непараметрична оцінка функції щільності розподілу показників.

Якщо t = 1,2, то вираз (6) матиме вигляд

.

. Остання може бути обчислена так (Переверзев Е.С., 1987):

,

.

, за виразом (6) здійснюється чисельними методами.

. Даний факт пояснюється тим, що критерій (2-Пірсона базується на
зіставленні результатів гістограмної оцінки з теоретичними, а
непараметрична оцінка функції щільності являє собою згладжування
гістограмних оцінок. Перевагою оцінювання імовірностей у зонах контролю
на основі параметричного відтворення функції розподілу є отримання
імовірнісної моделі, що дає додаткові можливості аналізу структури даних
і, відповідно, дозволяє медичному фахівцю скласти більш повну картину
про перебіг захворювання.

Подальша обробка пов’язана з перевіркою вірогідних імовірностей у зонах
контролю на значущість та перевіркою гіпотези про їх рівність між собою.
Для перевірки останньої гіпотези реалізується статистична характеристика
(Ван дер Варден Б.Л., 1960)

. (7)

Якщо оцінки імовірностей, знайдені різними способами, між собою не
різняться, рекомендується для аналізу використовувати найбільш вірогідні
оцінки або здійснювати їх усереднення. Зони контролю, де виявлено
розбіжності, потребують додаткових досліджень із залученням
лікаря-клініциста.

Подальший аналіз спрямовано на порівняння імовірностей у зонах контролю
для різних груп пацієнтів, наприклад хворих на АГ 1-ї та 2-ї стадій. Для
цього реалізується аналог статистичної характеристики (7). Це дозволяє
встановлювати, чи різняться між собою функції розподілу показників у цих
групах і чи потрібні різні тактики лікування.

На базі запропонованого математичного забезпечення створено
автоматизовану систему “VerMed” обробки неоднорідних медичних даних для
підтримки прийняття рішень під час діагностики захворювань. Вона
дозволяє визначати межі “норми-патології” показників, знаходити
імовірності перебування двох показників у зонах контролю, проводити
первинний статистичний аналіз, параметричне та непараметричне
відтворення одновимірних і багатовимірних розподілів із класу нормальних
та класифікацію. Додатково реалізовано процедури кореляційного та
кластерного аналізу, забезпечено можливість візуалізації та збереження
результатів обробки даних. Проектування системи виконано на уніфікованій
мові моделювання (UML). Специфікацію особливостей функціонування системи
наведено на діаграмі варіантів використання (рис. 2). Роботу системи в
цілому представлено за допомогою діаграми діяльності (рис. 3).
Реалізацію системи “VerMed” здійснено на мові програмування високого
рівня Object Pascal у середовищі Borland Delphi 7.0. Для розробки
додатка в області тривимірної графіки використано програмний інтерфейс
OpenGL.

Рис. 2. Діаграма варіантів використання системи “VerMed”

Рис. 3. Діаграма діяльності системи “VerMed”

У четвертому розділі подано практичну реалізацію розробленої
інформаційної технології у системі “VerMed” до даних
клініко-інструментального та психологічного обстеження хворих на АГ,
зібраних на базі Кримського республіканського науково-дослідного
інституту фізичних методів лікування та медичної кліматології ім. І.М.
Сєченова. Контрольна вибірка складалась із N = 280 пацієнтів, кожен із
яких кардіологом віднесений до одного з двох класів: К1 – наявність АГ
1-ї стадії, К2 – 2-ї стадії; а психологом – до одного з трьох класів:
П1– відсутність психічних і поведінкових розладів (норма), П2 –
наявність афективних та тривожно-фобічних розладів, П3 – наявність
соматоформних розладів. Стан кожного пацієнта описується чотиривимірним
вектором, компонентами якого є цілочисельні показники систолічного
артеріального тиску (САТ, мм рт.ст.), іпохондрії (Hs, Т-бали), депресії
(D, Т-бали) та істерії (Hy, Т-бали). Рівень САТ визначався шляхом
“офісного вимірювання” тиску, а значення психологічних показників Hs, D,
Hy – на основі Міннесотського багатофазного особистісного тесту (ММРІ).
Їх визначення проводилось одночасно.

Для всіх психологічних показників за тестом ММРІ нормою вважається
діапазон 30(70. Застосовуючи розроблену інформаційну технологію,
здійснено його уточнення для Hs, D, Hy у хворих на АГ. За умовну норму
при АГ прийняті межі “норми-патології” показників, визначені за даними
пацієнтів із класу П1. Межі, знайдені за даними пацієнтів із класів П2
та П3, є межами внутрішньонозологічної “норми-патології”. З похибкою ( =
0,1 встановлено межі “норми-патології” психологічних показників для
хворих на АГ без психічних і поведінкових розладів (Нs 38(65,

D 38(62, Ну 38(61), із афективними та тривожно-фобічними розладами (Нs
41(70, D 41(79,

Ну 39(75), осіб із соматоформними розладами (Нs 50(87, D 39(78, Ну
50(80). Показана їх відмінність від норм здорових осіб (30(70), що
свідчить про психологічну дезадаптацію хворих на АГ та зумовлює
необхідність оцінки стану кожного окремого хворого саме із використанням
встановлених норм, а не норм здорових осіб.

З метою підтримки прийняття рішень медичним фахівцем під час діагностики
психологічних особливостей у хворих на АГ також проведено кластеризацію
хворих за показниками САТ, Hs, D. Результати замірів показника Hy
виявились нормально розподіленими, що засвідчило їх однорідність, тому
надалі цей показник не розглядався. Кластеризація проводилась окремо для
показників САТ і Hs та САТ і D (рис. 4) з використанням двовимірного
сплайн-нормального розподілу та встановленої для психологічних
показників умовної норми при АГ. Такий підхід дозволив відмежувати
хворих на АГ 1-ї стадії від хворих на АГ 2-ї стадії, провести їх
градацію за величинами психологічних показників і отримати такі
нормативні величини показників Hs, D: норма (для Hs 38(58, для D 38(45),
перехідний стан (Hs 59(65, D 46(62), виразна патологія (Hs >65, D >62).

а б

Рис. 4. Результати кластеризації хворих на АГ за показниками:

а – САТ і Hs; б – САТ і D

Отримані результати є основою для диференційованого підходу під час
діагностики психологічних особливостей у хворих на АГ, але не враховують
стадію соматичного захворювання. З метою виявлення відмінностей у
психологічній сфері хворих на різних стадіях АГ перевірена гіпотеза про
рівність імовірностей перебування показників САТ і Hs (САТ і D) у межах
їх нормативних величин для хворих на АГ 1-ї та 2-ї стадій. Встановлено,
що в ряді зон контролю імовірності різняться. Аналіз таких зон дозволив
виділити наявність психосоматичних взаємозв’язків при різних значеннях
показників, що забезпечує диференційоване психотерапевтичне втручання –
як медикаментозне, так і не медикаментозне – на різних стадіях АГ.

Тим самим підтверджено ефективність застосування розробленої
інформаційної технології.

У висновках сформульовано основні результати досліджень.

У додатках містяться результати обчислювального експерименту з
моделювання та відтворення двовимірного сплайн-нормального розподілу,
опис властивостей та методів класів системи “VerMed”, опис інтерфейсу
системи, результати імовірнісної оцінки САТ та психологічних показників
(іпохондрії, депресії, істерії) у зонах контролю, а також документи про
впровадження результатів дисертаційної роботи.

ВИСНОВКИ

У результаті дисертаційних досліджень, виконаних автором, розв’язана
актуальна задача, що полягає в розробці інформаційної технології обробки
неоднорідних медичних даних, заснованої на моделях розподілу даних, для
підтримки прийняття рішень у задачах медичної діагностики.

Основні результати дисертаційної роботи полягають у такому:

Вперше запропоновано та проведено дослідження моделей двовимірного
сплайн-нормального розподілу з однією та двома прямими склеювання,
паралельними осям спостережень, на основі яких реалізовано обчислювальні
схеми відтворення розподілу та сформульовано правила класифікації.
Встановлено адекватність та вірогідність запропонованих обчислювальних
схем шляхом реалізації обчислювального експерименту.

Удосконалено метод визначення меж “норми-патології” медичних показників
на основі одновимірних моделей сплайн-нормальних та сумішей нормальних
розподілів, що забезпечує врахування неоднорідності вхідних даних та
адекватність отримуваних норм показників.

Розроблено метод оцінювання імовірностей перебування двох медичних
показників у зонах контролю, який передбачає параметричне та
непараметричне оцінювання функції розподілу показників, дозволяє скласти
цілісну картину про перебіг захворювання та виділити групи хворих із
різними психосоматичними взаємозв’язками. Для врахування неоднорідності
даних параметричну оцінку запропоновано здійснювати у вигляді
двовимірного сплайн-нормального або суміші нормальних розподілів.

Створено інформаційну технологію обробки неоднорідних медичних даних,
яка надала змогу реалізувати підтримку прийняття рішень медичним
фахівцем за рахунок визначення меж “норми-патології” психологічних
показників для хворих на артеріальну гіпертензію; кластеризації хворих
із визначенням чітких меж, що визначають різні стадії захворювання;
виділення груп хворих із різними психосоматичними взаємозв’язками.
Розроблена інформаційна технологія може бути застосована для обробки
неоднорідних статистичних даних в інших галузях науки і техніки, зокрема
економіці, геології, енергетиці, аерокосмічній галузі тощо із
відповідними пристосовуваннями до обраної предметної галузі.

Розроблено програмне забезпечення “VerMed” автоматизованої обробки
неоднорідних медичних даних, у якому реалізовано запропоновані методи та
модель. Система дозволяє визначати межі “норми-патології” показників,
імовірності перебування двох показників у зонах контролю, проводити
кластеризацію та класифікацію даних із використанням сплайн-нормального
або суміші нормальних розподілів, а також проводити первинний
статистичний та кореляційний аналіз кількісних та якісних медичних
даних, параметричну (для розподілів з класу нормальних) та
непараметричну оцінку функції розподілу імовірностей показників в
одновимірному та двовимірному випадках.

Отримано деклараційний патент № 10032 на корисну модель “Спосіб оцінки
перебігу артеріальної гіпертензії”, яка реалізована в розробленій
інформаційній технології. Інформаційна технологія застосовується
Кримським республіканським науково-дослідним інститутом фізичних методів
лікування та медичної кліматології ім. І.М. Сєченова, у
науково-дослідному й навчальному процесах Дніпропетровської державної
медичної академії, Харківської медичної академії післядипломної освіти,
діагностично-лікувальному процесі санаторіїв “Ай-Петрі” та “Україна”.

СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ

Приставка А.Ф. Информационная технология восстановления неоднородных
двумерных нормальных распределений / А.Ф. Приставка, О.Н. Мацуга //
Актуальні проблеми автоматизації та інформаційних технологій. – Д.:
Вид-во Дніпропетр. ун-ту, 2004. – Т.8. – С. 20–31.

Мацуга О.М. Практична реалізація системи DROZD у системі медичного
моніторингу // Актуальні проблеми автоматизації та інформаційних
технологій. – Д.: Вид-во Дніпропетр. ун-ту, 2005. – Т.9. – С. 22–33.

Мацуга О.М. Статистичні методи класифікації при обробці медичних даних
// Вісн. ХНТУ. – 2006. – №2(25). – С.313–318.

Мацуга О.М. Реалізація сумішей розподілів в автоматизованій системі
ViStAMed / О.М. Мацуга, А.Ю. Дереза // Актуальні проблеми автоматизації
та інформаційних технологій. – Д.: Вид-во Дніпропетр. ун-ту, 2006. –
Т.10. – С. 15–25.

Мацуга О.М. Технологія оцінки впливу психологічних особливостей хворих
на артеріальну гіпертензію на рівень артеріального тиску / О.М. Мацуга,
І.В. Дроздова // Укр. журн. мед. техніки і технології. – 2006. – №4. –
С. 46–69.

Пат. 10032 UA, МПК 7 А61В10/00. Спосіб оцінки перебігу артеріальної
гіпертензії: Пат. 10032 UA, МПК 7 А61В10/00 / І.В. Дроздова, О.М. Мацуга
– Заявл.06.06.2005; Опубл.17.10.2005. – 12с.

Щудро С.А. Імовірнісна оцінка взаємозв’язку фізичного розвитку та якості
життя підлітків / С.А. Щудро, О.М. Мацуга // Мед. перспективи. – 2006. –
№3. – С. 141–152.

Мацуга О.М. Імітаційне моделювання завад в неоднорідних структурах //
Наука і молодь. Прикл. сер. – К.: НАУ, 2005. – Вип. 5. – С. 79–82.

Приставка О.П. Класифікація двовимірних неоднорідних нормально
розподілених даних /

О.П. Приставка, О.М. Мацуга // Матеріали VI Міжнарод. наук.-техн. конф.
“АВІА-2004”,

26–28 квітня 2004 р. – К., 2004. – Т.2. – С. 23.25–23.28.

Приставка А.Ф. Имитационное моделирование и восстановление двухмерных
сплайн-нормального и смеси нормальных распределений / А.Ф. Приставка,
О.Н. Мацуга // Тези доп. Міждерж. наук.-метод. конф. “Проблеми
математичного моделювання”, 26–28 травня 2004 р. – Дніпродзержинськ,
2004. – С.111–112.

Мацуга О.М. Моніторування серцево-судинної системи на основі сумішей і
сплайн-розподілів // Тези доп. ІІ Міжнарод. наук.-практ. конф.
“Математичне та програмне забезпечення інтелектуальних систем”, 17–19
листопада 2004 р. – Д., 2004. – С. 89–90.

Мацуга О.М. Дискримінантний аналіз неоднорідних статистичних даних в
системах моніторингу / О.М. Мацуга, О.П. Приставка // Тези VII Міжнарод.
молодіжної наук.-практ. конф. “Людина і космос”, 13–15 квітня 2005 р. –
Д.: НЦАОМУ, 2005. – С.237.

Приставка О.П. Обчислювальні технології в автоматизованих системах
медичної діагностики / О.П. Приставка, О.М. Мацуга // Тези доп. Міждерж.
наук.-метод. конф. “Проблеми математичного моделювання”, 25–27 травня
2005 р. – Дніпродзержинськ., 2005 – С.166.

Мацуга О.М. Інформаційне наповнення системи обробки медичної інформації
“Drozd” // Тези доп. ІІІ Міжнарод. наук.-практ. конф. “Математичне та
програмне забезпечення інтелектуальних систем”, 16–18 листопада 2005 р.
– Д., 2005. – С. 112.

Мацуга О.М. Інформаційні технології при опрацюванні даних медичного
обстеження пацієнтів / О.М. Мацуга, О.П. Приставка // Зб. тез VIII
Міжнарод. молодіжної наук.-практ. конф. “Людина і космос”, 13–14 квітня
2006 р. – Д.: НЦАОМУ, 2006. – С.209.

Мацуга О.М. Імовірнісна модель оцінки взаємозв’язку артеріальної
гіпертензії з психологічними факторами // Тези доп. Міждерж.
наук.-метод. конф. “Проблеми математичного моделювання”, 24–26 травня
2006 р. – Дніпродзержинськ, 2006. – С.182.

Мацуга О.М. Система VerMed для автоматизації робочого місця кардіолога
// Тези доп. ІІІ Міжнарод. наук.-техн. конф. з автоматичного управління
(Автоматика-2006), м. Вінниця, 25–28 вересня 2006 р. – Вінниця:
УНІВЕРСУМ-Вінниця, 2006. – С. 331.

Мацуга О.М. Двовимірні сплайн-нормальні розподіли при обробці медичних
даних // Тези доп. ІV Міжнарод. наук.-практ. конф. “Математичне та
програмне забезпечення інтелектуальних систем”, 15–17 листопада 2006р. –
Д., 2006. – С. 105–106.

Мацуга О.М. Застосування сплайн-нормального розподілу в інформаційному
забезпеченні діагностування артеріальної гіпертензії / О.М. Мацуга, О.П.
Приставка // Зб. тез IХ Міжнарод. молодіжної наук.-практ. конф. “Людина
і космос”, 18–20 квітня 2007 р. – Д.:НЦАОМУ, 2007.– С.236.

Приставка О.П. Властивості двомірного сплайн-нормального розподілу /
О.П. Приставка,

О.М. Мацуга // Тези доп. Міждерж. наук.-метод. конф. “Проблеми
математичного моделювання”, 23–25 травня 2007 р. – Дніпродзержинськ,
2007. – С.38–39.

АНОТАЦІЯ

Мацуга О.М. Інформаційна технологія обробки неоднорідних медичних даних
для підтримки прийняття рішень під час діагностики. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за
спеціальністю 05.13.06 – автоматизовані системи управління та
прогресивні інформаційні технології. – Дніпропетровський національний
університет МОН України, 2007.

Дисертацію присвячено розробці інформаційної технології обробки
неоднорідних медичних даних на основі одновимірних і двовимірних моделей
сплайн-розподілів та сумішей розподілів для підтримки прийняття рішень
під час діагностики хворих на артеріальну гіпертензію з урахуванням їх
психологічного стану. Уперше запропоновано й досліджено модель розподілу
неоднорідних медичних даних у вигляді двовимірного сплайн-нормального
розподілу з однією та двома прямими склеювання, яка може бути
застосована в задачі класифікації. Удосконалено метод визначення норм
медичних показників за рахунок одновимірних моделей сплайн-розподілів та
сумішей розподілів. Запропоновано метод визначення імовірностей
перебування двох медичних показників у межах їх нормативних величин за
рахунок поєднання параметричного і непараметричного оцінювання функції
щільності розподілу імовірностей показників.

Ключові слова: неоднорідні медичні дані, сплайн-розподіл, суміш
розподілів, автоматизована система, артеріальна гіпертензія,
психологічні особливості.

SUMMARY

Matsuga O.N. Information technology of processing of non-uniform medical
data for support of decision-making during diagnostics. – Manuscript.

Thesis for a Candidate of Technical Sciences Degree of specialty
05.13.06 – Automated Control Systems and Progressive Information
Technologies. – Dnipropetrovsk National University, Ministry of
Education and Sciences of Ukraine, 2007.

The dissertation is devoted to development of information technology of
processing of non-uniform medical data on the basis of one-dimensional
and bidimentional models a spline-distributions and mixture of
distributions for support of decision-making during diagnostics of
psychological features patients with arterial hypertension. For the
first time the model of non-uniform medical data distribution in the
form of bidimentional spline-normal distribution with one and two
straight lines of pasting is offered and investigated. It can be used
for classification. The method of definition of norms of medical
parameters due to one-dimensional models of spline-distributions and
mixture of distributions is advanced. The method of definition of
probabilities of stay of two medical parameters in borders of normative
sizes which assumes association parametrical and nonparametric
estimation of density functions of parameters is offered.

Key words: non-uniform medical data, spline-distribution, mixture of
distributions, computer-aided system, arterial hypertension,
psychological features.

АННОТАЦИЯ

Мацуга О.Н. Информационная технология обработки неоднородных медицинских
данных для поддержки принятия решений во время диагностики. – Рукопись.

Диссертация на соискание ученой степени кандидата технических наук по
специальности 05.13.06 – автоматизированные системы управления и
прогрессивные информационные технологии. – Днепропетровский национальный
университет МОН Украины, 2007.

Диссертация посвящена разработке информационной технологии обработки
неоднородных медицинских данных на основе одномерных и двумерных моделей
сплайн-распределений и смесей распределений для поддержки принятия
решений во время диагностики больных артериальной гипертензией c учетом
их психологического состояния. Впервые предложена и исследована модель
распределения неоднородных медицинских данных в виде двумерного
сплайн-нормального распределения с одним и двумя узлами, которая может
быть применена в задаче классификации. Разработана вычислительная схема
восстановления данного распределения и классификации на его основе.
Адекватность и достоверность восстановления подтверждена путем
реализации вычислительного эксперимента. Усовершенствован метод
определения норм медицинских показателей за счет введения одномерных
смесей и сплайн-распределений, что позволяет учесть неоднородность
данных и обеспечить адекватность получаемых норм. Предложен метод
определения вероятностей пребывания двух медицинских показателей в
границах нормативных величин путем объединение параметрического и
непараметрического оценивание функции плотности распределения
показателей. Это позволяет получить полную картину о течении заболевания
и выделить группы больных с разными психосоматическими связями. При этом
параметрическая оценка проводится с использованием двумерного
сплайн-нормального и смеси нормальных распределений, что дает
дополнительные возможности анализа структуры неоднородных данных.

На основе разработанных методов и модели создана информационная
технология обработки неоднородных медицинских данных. Составляющие
информационной технологии реализованы в полезной модели “Способ оценки
течения артериальной гипертензии”, на которую получен декларационный
патент. Составной частью технологии является система “VerMed”
автоматизированной обработки данных, которая обеспечивает поддержку
принятия решений во время диагностики. Система позволяет определять
границы “нормы-патологии” медицинских показателей, вероятности
пребывания двух показателей в границах нормы, строить модели
распределения неоднородных медицинских данных, проводить первичный
статистический, корреляционный, кластерный анализы и классификацию.
Информационная технология апробирована и внедрена на базе Крымского
республиканского НДИ физических методов лечения и климатологии им. И.М.
Сеченова.

Ключевые слова: неоднородные медицинские данные, сплайн-распределение,
смесь распределений, автоматизированная система, артериальная
гипертензия, психологические особенности.

Підписано до друку 22.08.07. Формат 60х90/16. Папір друкарський. Друк
плоский.

Гарнітура Times New Roman Cyr. Ум. друк. арк. 1,0. Тираж 100 пр. Зам. №
834

Друкарня ДНУ, вул. Наукова, 5, м. Дніпропетровськ, 49050

PAGE 21

Похожие записи