Київський національний університет імені Тараса Шевченка

Романов Андрій Вікторович

УДК 519.21+535.378+616.3

Статистичні методи, алгоритми та програмні засоби розпізнавання у
медичних дослідженнях

01.05.04 – системний аналіз і теорія оптимальних рішень

АВТОРЕФЕРАТ

дисертації на здобуття наукового ступеня

кандидата технічних наук

Київ – 2006

Дисертацією є рукопис

Робота виконана на кафедрі обчислювальної математики Київського
національного університету імені Тараса Шевченка

Наукові керівники: доктор фізико-математичних наук, професор

Петунін Юрій Іванович,

професор кафедри обчислювальної математики Київського національного
університету імені Тараса Шевченка

доктор біологічних наук, професор

Орел Валерій Еммануїлович,

завідувач відділом медичної фізики та біоінженерії
Інституту онкології АМН України (м. Київ)

Офіційні опоненти: доктор технічних наук, професор

Волошин Олексій Федорович,

професор кафедри математичних методів еколого-економічних досліджень
Київського національного університету імені Тараса Шевченка,

доктор фізико-математичних наук, старший науковий співробітник

Соляник Галина Іванівна,

завідувач відділом механізмів протипухлинної резистентності Інституту
експериментальної онкології, патології і радіобіології ім.
Р.Є. Кавецького НАН України (м. Київ)

Провідна установа: Інститут кібернетики ім. В.М. Глушкова НАН України,

відділ інтелектуальних систем управління динамічними об’єктами, м. Київ

Захист відбудеться „31” травня 2006 р. о 15 год. 30 хв. на засіданні
спеціалізованої вченої ради Д 26.001.35 в Київському національному
університеті імені Тараса Шевченка за адресою:

03127, Київ, просп. Глушкова, 2 корпус. 6, факультет кібернетики, ауд.
40.

(Тел. 259-04-24, факс 259-70-44, Е-mail: [email protected])

З дисертацією можна ознайомитися у науковій бібліотеці Київського
національного університету імені Тараса Шевченка за адресою: 01033,
Київ, вул. Володимирська, 58.

Автореферат розісланий „14” квітня 2006 р.

Вчений секретар

спеціалізованої вченої ради,

кандидат фізико-математичних наук, доцент П.М. Зінько

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Останнім часом велику роль відіграє доказова
медицина, яка науково обґрунтовує різні методи профілактики, діагностики
та лікування хвороб. Застосовуються статистичні методи обробки та
аналізу експериментальних даних з метою одержання об’єктивних висновків
відносно процесів, що протікають в різних біологічних та медичних
системах. Усе це вимагає розробки математичних критеріїв перевірки
гіпотез, використовуючи сучасний апарат теорії розпізнавання,
математичної статистики, теорії ймовірності, а також нових методів
нелінійної динаміки, теорії хаотичних процесів. Значний внесок у
розвиток теорії розпізнавання та нелінійної динаміки внесли вітчизняні
та іноземні вчені В.М. Глушков, А.А. Харкевич, Н.П. Бусленко,
Я.З. Ципкін, В.С. Міхалевич, А.Г. Івахненко, Ю.І. Журавльов,
Н.Г. Загоруйко, В.А. Ковалевський, М.А. Айзерман, Э.М. Браверман,
Л.І. Розоноер, М.М. Бонгард, В.Н. Вапник, А.Я. Червоненкіс,
Л.А. Растригін, Ф. Розеблатт, І. Прігожин, Г. Ніколіс, Б. Мандельброт,
А. Голдбергер, М. Седіві, Г. Лоза, Г. Ахаммер, Ж.В. Бейш, Ф. Мун,
Є. Лоренц, С. Гастелло, А.Ю. Лоскутов, Г.Г. Малинецький, С.П. Курдюмов,
А.А. Самарський, М.І. Шлєзінгер, Ю.П. Питьєв, Ю.А. Бєлов, В.О. Яценко,
М.Ф. Кириченко, Д.Я. Хусаїнов, П.С. Кнопов та ін.

Однією з найбільш актуальних проблем сьогодення є своєчасна діагностика
онкологічних захворювань. За даними національного канцер-реєстру України
кількість зареєстрованих смертей від онкологічних захворювань в 2004 р.
становила 87313 осіб. Також значну небезпеку для здоров’я людини
становлять внутрішні хвороби – холецистити, панкреатити, виразка шлунку
та дванадцятипалої кишки тощо. Однак, незважаючи на істотні досягнення
у сучасній медицині, клінічна діагностика не завжди надійна. Відомі
методи медичної діагностики мають не завжди достатню точність та
чутливість. Інвазивність та висока вартість обстежень обмежують їх
широке застосування. Одним з проблемних є питання ефективності клінічної
діагностики. Відомо, що діагностика проводиться фахівцем деколи на
основі знання типових ознак, власного досвіду та психоемоціонального
стану самого лікаря. Тому особливо актуальною є розробка нових
статистично обґрунтованих критеріїв розпізнавання, що ґрунтуються на
дослідженні нелінійної динаміки медико-біологічних процесів, необхідних
для діагностики ряду онкологічних та неонкологічних захворювань, зокрема
раку прямої кишки, шлунку, стравоходу і кардії, холецистопанкреатиту,
виразки дванадцятипалої кишки, постхолецистоектомічного синдрому.

Зв’язок роботи з науковими програмами, планами, темами. Роботу виконано
у рамках НДР „Розробка та застосування математичних методів у
медико-біологічних дослідженнях” (№ держреєстрації 0112U005258) спільної
науково-дослідної лабораторії комп’ютерної цитогененетичної діагностики
онкологічних захворювань Київського національного університету імені
Тараса Шевченка, а також в рамках досліджень, що проводяться на кафедрі
обчислювальної математики факультету кібернетики університету.
Дослідження, що присвячені статистичному аналізу кривих механоемісії
(МЕ) крові пацієнтів для розпізнавання раку прямої кишки, шлунку,
стравоходу та кардії були виконані спільно з відділом медичної фізики та
біоінженерії Інституту онкології АМН України в рамках НДР №0104U003213
„Вивчити особливості візуалізуючих даних медичного зображення при
злоякісних процесах з застосуванням алгоритмів нелінійної динаміки”.
Дослідження, що присвячені розробці алгоритмів та програм комп’ютерної
діагностики внутрішніх захворювань на підставі методу дуоденального
зондування були виконані разом з Інститутом хірургії та трансплантології
АМН України.

Мета і задачі дослідження. Метою роботи є розробка статистично
обґрунтованих математичних методів оцінки біологічних і медичних даних
для розпізнавання ряду онкологічних (рак прямої кишки, шлунку,
стравоходу та кардії) та неонкологічних (холецистопанкреатит, виразка
дванадцятипалої кишки, постхолецистоектомічний синдром) захворювань
внутрішніх органів.

Відповідно до сформульованої мети були визначені 6 основних задач
роботи.

1) Дослідження математичних моделей сплайнової регресії, що
використовуються для побудови алгоритмів розпізнавання онкологічних та
внутрішніх захворювань.

2) Розробка статистичних показників тестових механоемісійних кривих
розчину хлориду натрію та кривих МЕ крові хворих на рак травного тракту.

3) Статистичний аналіз нелінійної динаміки тестових кривих МЕ розчину
хлориду натрію та кривих МЕ крові хворих на рак травного тракту.

4) Розробка алгоритмів та програмного забезпечення для розпізнавання
онкологічних захворювань травного тракту на підставі механоемісійних
кривих.

5) Розробка чисельних показників дуоденального зондування пацієнтів з
внутрішніми хворобами.

6) Розробка алгоритмів та програмного забезпечення статистичного аналізу
показників дуоденального зондування для розпізнавання внутрішніх хвороб
пацієнтів.

Наукова новизна одержаних результатів. В дисертаційній роботі створено
нові алгоритми розпізнавання ряду онкологічних та неонкологічних
захворювань травного тракту на підставі статистичного аналізу нелінійної
динаміки кривих МЕ крові хворих на рак травного тракту та показників
дуоденального зондування пацієнтів з внутрішніми захворюваннями,
наведено математичне обґрунтування цих методів. Зокрема:

1) доведено теореми про строгу слушність оцінок кусково-лінійної
сплайнової регресії з однією точкою переходу, що отримані методом
залишкової суми квадратів, асимптотичну незміщеність точки переходу,
а також те, що оцінки усіх параметрів за формулою Бокса, крім точки
переходу, є незміщеними;

2) математично обґрунтовано доцільність використання методу
кусково-лінійної сплайнової регресії для аналізу біологічної та медичної
інформації;

3) вперше досліджено характер тестових кривих МЕ розчину хлориду натрію
та кривих МЕ крові хворих на рак травного тракту за допомогою методів
математичної статистики та нелінійної динаміки;

4) побудовано функцію щільності концентрації точок фазової діаграми
тестових кривих МЕ розчину хлориду натрію та кривих МЕ крові хворих на
рак травного тракту, що дозволило вирішити проблему застосування методів
математичної статистики для аналізу нелінійної динаміки механоемісійних
процесів;

5) одержано нові критерії, створено алгоритми та розроблено програмне
забезпечення для розпізнавання ряду онкологічних (рак прямої кишки,
шлунку, стравоходу та кардії) та внутрішніх (холецистопанкреатит,
виразка дванадцятипалої кишки, постхолецистоектомічний синдром)
захворювань травного тракту на підставі статистичного аналізу
нелінійної динаміки кривих МЕ крові онкологічних хворих та даних
дуоденального зондування пацієнтів з внутрішніми захворюваннями.

Практичне значення одержаних результатів. Результати, що одержані в
дисертаційній роботі, використано у клінічних дослідженнях для
діагностики онкологічних та внутрішніх захворювань, а саме: раку прямої
кишки, шлунку, стравоходу та кардії, холецистопанкреатиту, виразки
дванадцятипалої кишки, постхолецистоектомічного синдрому. Розроблене
програмне забезпечення використане у комп’ютерному експрес-аналізаторі
для аналізу спектрального складу механоемісійних біопроб.

Отримані у роботі результати використовувались в лекціях з теорії
розпізнавання образів та математичної статистики, що читаються на
факультеті кібернетики Київського національного університету імені
Тараса Шевченка для студентів бакалаврів та магістрів.

Розроблені автором алгоритми діагностики онкологічних й внутрішніх
захворювань впроваджені в Інституті онкології АМН України та Інституті
хірургії і трансплантології АМН України, що підтверджується відповідним
актами впровадження.

Особистий внесок здобувача. Науковим керівникам професору Петуніну Ю.І.
в роботах [41, 77, 78, 85, 134, 144] та професору В.Е. Орлу в роботах
[68, 69, 72, 77, 85, 129, 130, 132–145] належать постановка задачі,
пропозиції щодо методів їх розв’язання та участь в обговоренні
результатів. Біологічні та медичні дані були надані співробітниками
Інституту онкології АМН України та Інституту хірургії та
трансплантології АМН України. Доведення, статистичний аналіз всіх
результатів дисертаційної роботи, розробка алгоритмів та реалізація їх у
конкретному програмному продукті проведена автором самостійно.

Апробація результатів дисертації. Результати роботи доповідалися на
X з’їзді онкологів України (Крим, жовтень 2001р.), Міжнародній
конференції “Medical Technologies for the 21st Century” (Київ, жовтень,
2001р.), Міжнародній конференції “IX Mediterranean Conference on Medical
and Biological Engineering and Computing MEDICON 2001” (Пула, Хорватія,
червень, 2001р.), Міжнародному симпозіумі “Micro/nanoscale energy
conversion and transport” (Анталія, Туреччина, квітень, 2002р.),
Міжнародній конференції “International Conference on Mathematics and
Engineering Techniques in Medicine and Biological Sciences METMBS’02”
(Лас-Вегас, США, червень, 2002р.) та METMBS’04 (Лас-Вегас, США, червень,
2004р.), Міжнародній конференції “13th Conference of the European
Society of Biomechanics” (Вроцлав, Польща, вересень, 2002р.),
Міжнародній конференції „Обчислювальна та прикладна математика” (Київ,
вересень, 2002р.), Міжнародній конференції “2nd European Medical &
Biological Engineering Conference” (Відень, Австрія, грудень, 2002р.),
Міжнародній конференції “INSC 2003, International Nonlinear Sciences
Conference, Research and Applications in the Life Sciences” (Відень,
Австрія, лютий, 2003р.), Міжнародному симпозіумі “16th International
Symposium on Plasma Chemistry” (Таорміна, Італія, червень, 2003р.),
Міжнародній конференції “The IASTED International Conference on
Biomechanics (BioMECH 2003)” (Родос, Греція, червень-липень, 2003р.),
Міжнародній конференції “The American Society for Microbiology
Conference on Bio-, Micro-, and Nanosystems” (Нью-Йорк, США, липень,
2003р.), Світовому конгресі “World Congress on Medical Physics and
Biomedical Engineering” (Сідней, Австралія, серпень, 2003р.),
Українському конгресі радіологів Укр’2003 (Київ, жовтень, 2003р.),
наукових семінарах факультету кібернетики Київського національного
університету імені Тараса Шевченка. Проект „Експрес-метод діагностики та
прогнозу протікання онкологічних захворювань”, розроблений за
матеріалами дисертації, посів III місце на конкурсі Головного управління
освіти і науки м. Києва за підтримки Наукової ради при Київському
міському голові „Інтелект молодих – на службу столиці”.

Публікації. За темою дисертації опубліковано 16 наукових праць. З них –
4 статті, надрукованих у наукових фахових періодичних виданнях, які
затверджено ВАК України, 3 статті у іноземних журналах, 6 праць
міжнародних наукових конференцій, 3 тези доповідей на міжнародних та
вітчизняних наукових конференціях.

Структура та обсяг дисертації. Дисертація складається з вступу, чотирьох
розділів, висновків та списку використаних джерел (151 найменування).
Робота містить 21 ілюстрацію та 10 таблиць. Загальний обсяг дисертації
становить 184 сторінок, з них – 139 сторінок основного змісту.

Автор висловлює щиру подяку науковим керівникам доктору
фізико-математичних наук професору Юрію Івановичу Петуніну та доктору
біологічних наук професору Валерію Еммануїловичу Орлу за допомогу при
роботі над дисертацією.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтовано актуальність обраної теми, визначено мету та
задачі, предмет та об’єкт дослідження, викладено наукову новизну,
практичну та теоретичну цінність одержаних результатів.

У першому розділі “Математичні та статистичні методи у теорії
розпізнавання та діагностики” розглянуто загальну постановку задачі
розпізнавання образів та відомі методи статистичної теорії
розпізнавання. Так, висвітлюються методи параметричного та
непараметричного оцінювання (зокрема гістограмний метод та методи
локального оцінювання), методи теорії статистичних розв’язків
(байєсовський, мінімаксний критерії, критерій Неймана-Пірсона), методи
побудови довірчих інтервалів для основної розподіленої маси значень
генеральної сукупності (правило „3(” та його емпіричний варіант правило
„3s”), непараметричні критерії еквівалентності генеральних сукупностей
(зокрема метод, заснований на застосування міри близькості
p-статистики). Наводяться формули для рівня значущості та імовірностей
похибок першого та другого роду. Також розглядаються методи нелінійної
динаміки для аналізу хаотичних процесів, зокрема метод фазового
простору, спектр Фур’є, відображення Пуанкаре, показники Ляпунова та
фрактальна розмірність.

Важливою математичною проблемою є статистична оцінка динаміки хаотичних
процесів. Відзначається, що для хаотичних кривих, притаманна відсутність
стійкості їх імовірнісних характеристик, зокрема математичного
сподівання, дисперсії, кореляційної функції тощо. Тому для аналізу
хаотичних медико-біологічних процесів не завжди можливо безпосередньо
застосовувати відомі методи статистики випадкових процесів. Можливим
виходом з цієї ситуації є дослідження певних числових характеристик
хаотичних медико-біологічних процесів, що є стохастичними процесами та
використовувати статистичні методи для аналізу цих характеристик.

Другий розділ “Розробка статистичних методів розпізнавання нелінійних
процесів у медичних дослідженнях” присвячений розробці статистичних
показників хаотичних процесів у медичних застосуваннях та алгоритмів їх
статистичної обробки. При дослідженні різних патологій травного тракту
вивчають медико-біологічні дані, представлених у вигляді часових рядів.
Зокрема, до них відносяться криві МЕ крові онкологічних хворих, криві
базальної секреції, секреції підшлункового залози та жовчного міхура
тощо. Вони відображають нелінійну динаміку медико-біологічних процесів у
організмі людини. Одним з методів оцінки нелінійних параметрів таких
кривих є методи нелінійної регресії, зокрема, методи сплайнової регресії
та метод кусково-лінійної сплайнової регресії. Останній найбільш
доцільно використовувати у випадках, коли закон протікання
досліджуваного процесу змінюється стрибкоподібно протягом часу
спостереження. Наведемо короткий опис моделі кусково-лінійної сплайнової
регресії з однією точкою переходу.

Розглянемо випадковий процес x(t), визначений на відрізку [0, T]. Будемо
вважати, що тренд m(t) ? m(x(t)) (змінна детермінована компонента) є
кусково-лінійним сплайном, що має вигляд:

де t* – точка переходу (рис. 1). Необхідно за спостереженням траєкторії
x(tk) процесу x(t) у точках tk (t0 ? 0, (, tn ? T) оцінити значення
точки переходу t* та параметри a1, b1, a2, b2 сплайну m(t).

Рис. 1. Модель кусково-лінійної сплайнової регресії

для невідомих параметрів a1, b1, a2, b2 та залишкову суму квадратів.
(2)

найменшу суму та знаходячи її порядковий номер i*, знайдемо оцінку
для значення точки переходу ti* ( t* та оцінки, невідомих параметрів
a1, b1, a2, b2 для сплайну m(t). Будемо називати ці оцінки ti*, , , ,
оцінками, що одержані методом мінімізації залишкових сум квадратів
(оцінки методу МЗСК). Доведено такі теореми.

Теорема 1. Якщо у моделі сплайнової регресії

одержані методом МЗСК є строго слушними.

Теорема 3. Основні частини зміщення оцінок параметрів a1, b1, a2, b2
у моделі сплайнової регресії (3) згідно формули Бокса дорівнюють нулеві.

Теорема 4. Оцінка t* значення точки переходу у моделі сплайнової
регресії (3) є асимптотично незміщеною.

В підрозділі 2.2 розглядаються методи нелінійної динаміки аналізу
хаотичних кривих МЕ. Досліджуються статистичні показники траєкторії
хаотичного процесу на фазовій площині: функція щільності концентрації
точок фазової діаграми та параметр розходження фазової діаграми. Дамо
означення щільності концентрації точок фазової діаграми хаотичного
процесу x(t). Розглянемо на площині (X, Y) множину точок

де xk ? x(tk), k ? 1, (, n, – значення хаотичної кривої x(t), що
спостерігаються в точках t1 ? 0, t2, (, tn; множина ( називається
фазовою діаграмою кривої x(t). Насамперед, знайдемо точку (x0, y0)
максимальної концентрації точок фазової діаграми, потім побудуємо
послідовність квадратів з центром у точці (x0, y0) максимальної
концентрації й зі сторонами довжини (k, k ? 1, 2, (, й обчислимо
показник

де N((k) – число точок фазової діаграми, що належать квадрату зі
стороною (k (рис. 2). Далі, для аналізу залежності показника K((k) від
(k зручно використовувати логарифмічну шкалу: по осі абсцис відкладемо
значення ln((k), а по осі ординат – значення ln(K((k)+1); отриману при
цьому функцію дискретного аргументу назвемо щільністю концентрації точок
фазової діаграми досліджуваної кривої або, коротше, щільність
концентрації (рис. 3).

В усіх подальших обчисленнях щільність концентрації апроксимується
кусково-лінійним сплайном вигляду (1) з однією точкою переходу

де a1, b1, a2, b2 – невідомі коефіцієнти регресії, x0 – невідома точка
переходу.

Рис. 2. Псевдофазова діаграма механоемісійної кривої

Рис. 3. Щільність концентрації точок фазової діаграми:

1 – функція щільності концентрації;

2 – кусково-лінійний сплайн

Точність моделі сплайнової регресії (3) визначається за допомогою
залишкової суми квадратів Q, що задається формулою

де yk ? ln(K((k)+1), xk ? ln((k) , k ? 1, (, s, – значення сплайна (6) у
точці xk. Статистика Q показує наскільки добре теоретична модель (3)
узгоджується з експериментальними даними. Невідомі коефіцієнти
сплайнової регресії a1, b1, a2, b2 і точка переходу x0, а також точність
моделі Q визначається за допомогою методу МЗСК. Таким чином, дослідження
щільності концентрації точок фазової діаграми хаотичних кривих зводиться
до аналізу п’ятивимірних векторів, які однозначно визначаються рівнянням
кусково-лінійної сплайнової регресії (3).

Ще один підхід, що спирається на дослідження фазового портрету хаотичних
процесів є параметр розходження фазової діаграми. Параметр розходження
наближено дорівнює площі фігури, утвореної кривою, що огинає фазову
траєкторію.

якого найменше відрізняється від норми елемента z:

не приймається.

У третьому розділі “Комп’ютерна статистична діагностика онкологічних
захворювань на підставі хаотичних кривих механоемісії” досліджуються
тестові механоемісійні криві розчину хлориду натрію та криві МЕ крові
хворих на рак травного тракту. МЕ – це ефект, що спостерігається при
дисипації механічної енергії в результаті механохімічних реакцій та
електрофізичних процесів при напрузі, деформації або терті біооб’єктів і
супроводжується емісією електронів та електромагнітного випромінювання,
зокрема в оптичному й радіодіапазоні.

У підрозділі 3.1 описано комп’ютерний експрес-аналізатор для дослідження
МЕ біопроб. Показано структурну схему, зовнішній вигляд та описано
принцип роботи пристрою реєстрації МЕ, що заснований на
трібоелектрізації, механічній деформації біопроби за допомогою зонду та
одночасній реєстрації кінетики оптичного й радіовипромінювання.

У підрозділі 3.2 проведено апробацію алгоритму розрахунку параметра
розходження фазової діаграми на тестових прикладах: вільні гармонійні
коливання без тертя і зовнішніх сил, згасаючі коливання, квазіперіодичні
коливання, квазіперіодичні коливання із загасанням, хаотичні коливання.

У підрозділі 3.3 описуються тестові дослідження МЕ хлориду натрію
(8 вибірок) та хлориду натрію, опроміненого електромагнітним
випромінюванням вельми високої частоти (6 вибірок) та бідистильованої
деіонізованої води (3 вибірки) з метою попередньої розробки методів
розпізнавання для подальшого аналізу МЕ крові онкологічних хворих.

h x ” ®

a

i

h

¤

????P

.2 та були побудовані довірчі межі на підставі правила „3s”, правила
„3s1”, а також довірчі інтервали, утворені мінімальною та максимальною
порядковими статистиками. Аналіз довірчих інтервалів для води та хлориду
натрію дозволив правильно розпізнати 1 вибірку кривої МЕ для H2O з 3 та
5 вибірок NaCl з 7; для інших пар “H2O – опромінений (ОП) NaCl” та “NaCl
– ОП NaCl” такого точного розпізнавання зробити неможливо.

Другий метод розпізнавання заснований на використанні p-статистик.
Проведений аналіз свідчить, що середнє значення p-статистики для пари
“H2O – H2O” статистично значимо відрізняється від усіх інших відповідних
середніх значень. Це дало можливість, незважаючи на значну
варіабельність p-статистик, практично точно розпізнавати тип речовини
при наявності тестових речовин H2O, NaCl та ОП NaCl. Слід відзначити, що
міра близькості між вибірками з однієї досліджуваної групи суттєво менша
за 1, що засвідчує хаотичний характер кривої МЕ. Виходячи з цього у
третьому методі розпізнавання типу речовини був використаний апарат
нелінійної динаміки, а саме – щільність концентрації точок фазової
діаграми кривої МЕ.

Аналіз показників сплайнової регресії функції щільності концентрації
показав, що розпізнати тип речовини, використовуючи довірчі інтервали,
які побудовані за правилом „3s” неможливо, оскільки ці інтервали мають
дуже значний перетин. Але, якщо скористатися довірчими інтервалами для
вибіркового середнього значення, то можна одержати безпомилкове
розпізнавання речовини.

У четвертому методі розпізнавання речовин показники сплайнової регресії
x0, a1, b1, a2, b2 функції щільності концентрації точок фазової
діаграми досліджували за допомогою методу найближчого сусіда. Похибка
цього методу не перевищувала 38,1%.

Таким чином, використання статистичних показників 1-го та 2-го порядків
не дозволило статистично достовірно класифікувати воду та хлорид натрію,
а методи p-статистик та розроблені методи аналізу псевдофазової діаграми
є найбільш адекватними для статистичної оцінки хаотичних кривих МЕ
речовин, що досліджувались. Тобто, для практичного використання
хаотичних показників МЕ необхідна експертна оцінка на основі
вищевказаних методів математичної статистики та нелінійної динаміки.

У підрозділі 3.4 було проведено розпізнавання онкологічних захворювань
травного тракту за показниками МЕ крові онкологічних хворих . Спочатку
було досліджено характер механоемісійних кривих методами математичної
статистики та нелінійної динаміки, зокрема, були підраховані статистичні
параметри механоемісійних кривих 1-го та 2-го порядку та побудовані
довірчі інтервали для середніх значень кривих МЕ за правилом „3s1”,
побудовано автокореляційну функцію, спектри Фур’є, підраховані ємнісна
та кореляційна фрактальна розмірність псевдофазової діаграми
механоемісійного процесу. Проведений статистичний аналіз механоемісійних
кривих свідчить про хаотичний характер електромагнітної МЕ цільної
крові, що узгоджується з гіпотезою ряду авторів про збільшення
детермінованого хаосу при пухлинному процесі на різних ієрархічних
рівнях організму людини.

Нелінійну динаміку МЕ крові вивчали за допомогою параметру розходження
фазової діаграми та функції щільності концентрації точок фазової
діаграми, що є випадковими процесами. Функцію щільності концентрації
точок фазової діаграми апроксимували кусково-лінійним сплайном з однією
точкою переходу.

Запропонований комбінований критерій розпізнавання раку прямої кишки має
такий вигляд:

1) спочатку в пацієнта з непізнаним захворюванням перевіряється ефект
зменшення потужності механоемісійних коливань (МЕК) з часом, якщо ефект
зменшення МЕК відсутній, то в цього пацієнта гіпотеза H – рак прямої
кишки – відхиляється і приймається альтернативна гіпотеза H( відсутності
злоякісних новоутворень в області прямої кишки;

2) якщо в пацієнта спостерігається ефект зменшення МЕК, то для цього
пацієнта використовується алгоритм розпізнавання по методу найближчого
сусіда за нормою вектора ( = (x0, a1, b1, a2, b2), породженого точкою
переходу і коефіцієнтами кусково-лінійної сплайнової регресії; при цьому
приймається гіпотеза H (рак прямої кишки) у випадку, коли найближчий за
нормою сусід точки (вектора) ( входить у групу P; якщо ж найближчий
сусід із групи донорів D, то необхідно перейти до наступного пункту;

не належить інтервалу ID, то приймається гіпотеза H (рак прямої
кишки).

Блок-схема алгоритму розпізнавання раку прямої кишки зображена на
рис. 4.

Похибка 1-го роду в комбінованого критерію діагностики раку прямої
кишки дорівнює 5,9%, а похибка другого роду – 4,8%, так що точність
цього критерію складає 94,1%, а його чутливість – 95,2%.

Рис. 4. Блок-схема алгоритму розпізнавання раку прямої кишки за
допомогою кривих механоемісії крові пацієнтів

Для діагностики раку стравоходу і кардії на підставі механоемісійних
кривих також було побудовано критерій розпізнавання, заснований на
використанні методу найближчого сусіда для вектора параметрів
сплайнової регресії функції щільності концентрації точок фазової
діаграми. Точність критерію склала 85,0% за ймовірності процедури
неприйняття рішення 35,0%, а чутливість – 85,7% за ймовірності
неприйняття рішення 38,1%.

До переваг методу МЕ належать можливість експресної діагностики
онкологічних захворювання при низькій вартості обстеження, а також його
мала інвазивність.

Четвертий розділ “Розпізнавання гастродуоденальних захворювань за
допомогою статистичного аналізу кривих сплайнової регресії” присвячений
діагностиці таких гастродуоденальних захворювань як виразка
дванадцятипалої кишки, постхолецисектомічний синдром та
холецистопанкреатит, що заснована на методі дуоденального зондування.

Для діагностики гастродуоденального захворювання були одержані дві
навчаючі вибірки G1 та G2, одна з яких G1 складається з практично
здорових пацієнтів, а друга G2 – з пацієнтів, хворих цією недугою.
Діагнози пацієнтів обох груп були строго верифіковані. У всіх пацієнтів
було проведено дуоденальне зондування та заповнені таблиці
функціонального стану шлунково-кишкового тракту. За допомогою цих
таблиць визначали числові показники (кислотність шлункового вмісту,
рефлюкс, колір та пасаж дванадцятипалої кишки та ін), а також криві
секреції, що є часовими рядами.

довірчі межі для основної розподіленої маси (b-інтервали).

), побудованим для групи G1 практично здорових пацієнтів та групи G2
пацієнтів з діагностованим гастродуоденальним захворюванням (наприклад,
виразкою дванадцятипалої кишки). Якщо всі показники xP потрапляють у
відповідні b-інтервали для групи G1, а деяка частина з них не належить
відповідним b-інтервалам з групи G2, то ставиться діагноз відсутності у
обстежуваного пацієнта даного гастродуоденального захворювання; якщо ж
всі показники xP належать відповідним b-інтервалам для групи G2, а
частина з них не належить відповідним b-інтервалам групи G1,
то ставиться діагноз про наявність даного гастродуоденального
захворювання у обстежуваного пацієнта.

Наведемо результати діагностики для досліджених патологій.

1. Постхолецистоектомічний синдром. Точність методу складає 100,0%, а
чутливість – 96,7%.

2. Холецистопанкреатит. Точність методу – 96,7%, чутливість – 87,0%.

3. Виразкова хвороба дванадцятипалої кишки. Точність методу – 100,0%,
чутливість – 100,0%.

Слід зазначити, що такі високі точність та чутливість критерію
розпізнавання отримано для конкретних вибірок і пов’язані, насамперед, з
високою точністю методу дуодентального зондування.

ВИСНОВКИ

В дисертаційній роботі запропоновано нові статистично обґрунтовані
алгоритми аналізу нелінійної динаміки кривих МЕ крові онкологічних
хворих та показників дуоденального зондування пацієнтів хворих на
внутрішні захворювання для розпізнавання ряду онкологічних та
неонкологічних захворювань внутрішніх органів, наведено математичне
обґрунтування та програмне забезпечення цих методів.

Основні наукові результати роботи.

1. Побудовано та досліджено математичну модель кусково-лінійної
сплайнової регресії з однією точкою переходу для аналізу часових рядів.
Доведено теореми про строгу слушність оцінок сплайнової регресії,
одержаних методом залишкової суми квадратів, асимптотичну незміщеність
значення точки переходу а також те, що оцінки усіх параметрів за
формулою Бокса, крім точки переходу, є незміщеними. Математично
обґрунтовано доцільність використання методу сплайнової регресії для
аналізу медико-біологічної інформації.

2. Досліджено характер кривих МЕ крові хворих на рак травного тракту за
допомогою методів математичної статистики та нелінійної динаміки:
статистичних показників 1-го та 2-го порядку, p-статистик,
автокореляційної функції, спектру потужностей, розмірності атракторів.
Експериментально обґрунтовано, що механоемісійні криві формуються під
сумісним впливом детермінованих та стохастичних коливальних процесів.

3. Побудовано функцію щільності концентрації точок фазової діаграми
кривих МЕ розчину хлориду натрію та крові хворих на рак травного тракту,
що дозволило вирішити проблему застосування методів математичної
статистики для аналізу нелінійної динаміки механоемісійних процесів.

4. Проведено статистичний аналіз нелінійної динаміки навчаючих вибірок
тестових механоемісійних кривих розчину хлориду натрію, розроблено
методи та побудовано алгоритм для послідуючого розпізнавання
патологічних процесів за показниками кривих МЕ крові.

5. Розроблено критерії та побудовано алгоритми розпізнавання
онкологічних захворювань на основі статистичного аналізу нелінійної
динаміки механоемісійних кривих крові хворих на рак прямої кишки,
шлунку, стравоходу та кардії.

6. Розроблено критерії та побудовано алгоритми розпізнавання
гастродуоденальних захворювань (холецистопанкреатит, виразка
дванадцятипалої кишки, постхолецистоектомічний синдром) на основі
статистичного аналізу чисельних показників дуоденального зондування.

7. Розроблене програмне забезпечення для розпізнавання онкологічних
та внутрішніх захворювань використане в мікрокомп’ютерному
експрес-аналізаторі МЕ крові та медичних дослідженнях.

8. Розроблені на підставі наявних навчаючих вибірок алгоритми
розпізнавання онкологічних та внутрішніх захворювань мають таку точність
та чутливість: для раку прямої кишки точність склала 94,1%, чутливість –
95,2%, раку стравоходу і кардії точність і чутливість – понад 85,0% з
імовірністю неприйняття рішення близько 35,0%, постхолецистоектомічного
синдрому точність – 100,0%, чутливість – 96,7%, холецистопанкреатиту
точність – 96,7%, чутливість – 87,0%, виразкової хвороби дванадцятипалої
кишки точність і чутливість склали 100,0% та можуть бути використані у
клінічній медицині як допоміжні методи при діагностиці онкологічних та
внутрішніх захворюваннях.

СПИСОК ОПУБЛІКОВАНИХ НАУКОВИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЙНОЇ РОБОТИ

1. Романов А.В., Орел В.Е., Петунін Ю.І. Про статистичний аналіз
хаотичних кривих механоемісії води та хлориду натрію // Доповіді НАН
України. – 2003. – №4. – С.58–63.

2. Романов А.В. Зміщення оцінки параметрів у моделі сплайнової регресії
// Вісник Київського університету. Серія: фізико-математичні науки. –
2003. – №3. – С. 262–268.

3. Петунін Ю.І., Орел В.Е., Романов А.В. Діагностичний аналіз хаотичних
кривих механоемісії крові хворих на рак травного тракту за допомогою
методів статистичної теорії розпізнавання образів // Журнал
обчислювальної прикладної математики. – 2004. – № 1. – С. 89–98.

4. Петунін Ю.І., Романов А.В., Стоян Н.М., Бурий О.М., Кожара С.П.,
Савкіна М.Ю. Діагностика гастродуоденальних захворювань методами
статистичної теорії розпізнавання // Вісник Київського національного
університету імені Тараса Шевченка, Кібернетика. – 2003. – № 4. – С.
35–44.

5. Orel V.E., Klyshin D.A., Romanov A.V., Petunin Yu.I., Andrushkiw R.I.
Statistical analysis of mechanoemission curves for water and sodium
chloride solutions // Proceedings of International Conference on
Mathematics and Engineering Techniques in Medicine and Biological
Sciences METMBS’02, – vol. 1 / Editors: Faramarz Valafar. June 24–27,
2002, Las Vegas, Nevada, USA. © CSREA Press. – P. 170–175.

6. Orel V.E., Klyshin D.A., Romanov A.V., Petunin Yu.I., Andrushkiw R.I.
Diagnosis of rectal and esophagus cancer using mechanoemission curves in
blood // Proceedings of International Conference on Mathematics and
Engineering Techniques in Medicine and Biological Sciences METMBS’04,
vol. 1 / Editors: Faramarz Valafar, & Homayoun Valafar. June 2004, Las
Vegas, Nevada, USA., © CSREA Press. – P. 47–51.

7. Orel V.E., Romanov A.V., Dzyatkovskaya N.N., Mel’nik Yu.I. The device
and algorithm for estimation of the mechanoemisson chaos in blood of
patients with gastric cancer // Medical Engineering and Physics. – 2002.
– vol. 24, – № 5. – Р. 365–371.

8. Orel V.E., Dzyatkovskaya N.N., Romanov A.V., Mel’nik Yu.I. An
algorithm for estimating chaos in mechanoemission of blood and magnetic
resonance imaging in patients with gastric cancer // Visualization and
imaging in transport phenomena / Eds. S. Sideman, A. Landesberg. New
York: Annals The New York Academy of Science. – 2002. – vol. 972. –
P.144–150.

9. Orel V.E., Grinevich Y.A., Dzyatkovskaya N.N., Danko M.I.,
Romanov A.V., Mel’nik Y.I., Martynenko S.V. Spatial and Mechanoemission
Chaos of Mechanically Deformed Tumor Cells // J. Mechanics in Medicine
and Biology. – 2003. – vol. 3, № 3 & 4. – P. 337–350.

10. Orel V.E., Romanov A.V., Dzyatkovskaya N.N., Mel’nic Yu.I. Windows
of Mechanoemission Chaos in Blood and Oncogenesis // Proceedings of INSC
2003, International Nonlinear Sciences Conference, Research and
Applications in the Life Sciences, February 7–9, 2003, Vienna, Austria.
– P. 47.

11. Orel V.E., Romanov A.V., Dzyatkovskaya N.N., Mel’nik Yu.I. The
algorithm for estimation of the chaos of patients with gastric cancer:
magnetic resonance imaging and mechanoemisson in blood // Proceedings of
International symposium on “Vizualization and imaging in transport
phenomena”, May 5–10, 2002, Antalya, Turkey, – P. 215–216.

12. Orel V.E., Danko M.I., Dzyatkovskaya N.N., Romanov A.V., Mel’nik
Yu.I. Very high frequency inductive hyperthermia of mechanochemicaly
activated sodium chloride // Proceedings of International symposium on
“Micro/nanoscale energy conversion and transport”, April 14–19, 2002,
Antalya, Turkey, – P. 139–141.

13. Орел В.Э., Дзятковская Н.Н., Кадюк И.Н., Мельник Ю.И., Романов А.В.
Квантовый хаос механоэмиссии крови при злокачественном опухолевом
процессе // Медицинская физика. – 2001. – №1. – С. 67–68.

14. Orel V.E., Mel’nik Yu.I., Romanov A.V., Dzyatkovskaya N.N. The
device and algorithm for estimation of the chaos on mechanical activated
plasma in blood of patients with gastric cancer // Proceedings of 16th
International Symposium on Plasma Chemistry, June 22–27, 2003, Taormina,
Italy. – Р. 18–22.

15. Орел В.Э., Черный В.А. Галахин К.А., Дзятковская Н.Н., Мельник Ю.И.,
Романов А.В. Механоэмиссия крови больных раком желудка // Матеріали X
з’їзду онкологів України, 10–12 жовтня 2001р., Крим. – Київ. –2001. – С.
47.

16. Orel V.E., Belov Yu.A., Romanov A.V., Dzyatkovskaya N.N., Kadiyuk
I.N., Mel’nik Yu.I. Development of medical-informational intellectual
technology // Proceedings of International Conference “Medical
Technologies for the 21st Century”, EUREKA Partnering Days in Ukraine,
October 15–16, 2001, Kyiv, Ukraine. – P. 17.

АНОТАЦІЯ

Романов А.В. Статистичні методи, алгоритми та програмні засоби
розпізнавання у медичних дослідженнях. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за
спеціальністю 01.05.04 – системний аналіз і теорія оптимальних рішень. –
Київський національний університет імені Тараса Шевченка, Київ, 2005.

Дисертаційна робота присвячена розробці статистично обгрунтованих
математичних методів розпізнавання онкологічних та внутрішніх
захворювань. Запропоновано алгоритми комп’ютерної діагностики
онкологічних захворювань травного тракту (рак прямої кишки, шлунку,
стравоходу та кардії) на підставі аналізу нелінійної динаміки кривих
механоемісії. Запропоновано метод комп’ютерної діагностики внутрішніх
захворювань (холецистопанкреатит, виразка дванадцятипалої кишки,
постхолецистоектомічний синдром), що заснований на дуоденальному
зондуванні. Комп’ютерну діагностику побудовано на статистичній теорії
розпізнавання образів з використанням методів нелінійної динаміки,
сплайнової регресії та довірчих інтервалів. Доведено теореми про строгу
слушність оцінок у моделі сплайнової регресії, що отримані методом
залишкової суми квадратів, асимптотичну незміщеність значення точки
переходу та доведено, що оцінки усіх параметрів за формулою Бокса, крім
точки переходу, є незміщеними.

Розроблене програмне забезпечення використане в комп’ютерному
експрес-аналізаторі механоемісії крові онкологічних хворих.

Запропоновані алгоритми можуть бути використані у клінічній медицині як
допоміжні методи при діагностиці онкологічних та внутрішніх
захворюваннях

Ключові слова: розпізнавання образів, сплайнова регресія, слушні оцінки,
довірчі інтервали, хаотичні процеси, механоемісія, онкологічні
захворювання, внутрішні захворювання.

АННОТАЦИЯ

Романов А.В. Статистические методы, алгоритмы и программные средства
распознавания в медицинских исследованиях. – Рукопись.

Диссертация на соискание ученой степени кандидата технических наук по
специальности 01.05.04 – системный анализ и теория оптимальных решений.
– Киевский национальный университет имени Тараса Шевченко, Киев, 2005.

Диссертационная работа посвящена разработке новых статистически
обоснованных математических методов анализа нелинейной динамики кривых
механоэмиссии крови онкологических больных и показателей дуоденального
зондирования больных внутренними заболеваниями с целью распознавания
ряда онкологических и неонкологических заболеваний внутренних органов.

Компьютерная диагностика построена на статистической теории
распознавания образов с использованием методов нелинейной динамики,
сплайновой регрессии и доверительных интервалов.

Исследован характер тестовых кривых электромагнитной механоэмиссии
раствора хлорида натрия и кривых механоэмиссии крови больных раком
пищеварительного тракта с помощью методов математической статистики и
нелинейной динамики. Построена функция плотности концентрации точек
фазовой диаграммы хаотических кривых механоэмиссии раствора хлорида
натрия и крови онкологических больных, что позволило решить проблему
применения методов математической статистики для анализа нелинейной
динамики механоэмиссионных процессов.

Построена и исследована математическая модель кусочно-сплайновой
регрессии с одной точкой перехода для анализа временных рядов. Доказаны
теоремы о строгой состоятельности оценок в модели сплайновой регрессии,
полученных методом остаточной суммы квадратов, асимптотической
несмещенности значения точки перехода и доказано, что оценки всех
параметров по формуле Бокса, кроме точки перехода, являются
несмещенными.

Предложены алгоритмы распознавания онкологических заболеваний
пищеварительного тракта на основе анализа нелинейной динамики кривых
механоэмиссии больных раком прямой кишки, желудка, пищевода и кардии.
Разработаны алгоритмы распознавания внутренних болезней
(холецистопанкреатит, язва двенадцатиперстной кишки,
постхолецистоэктомический синдром), основанные на статистическом анализе
показателей дуоденального зондирования.

Разработанное программное обеспечение использовано в компьютерном
экспресс-анализаторе механоэмиссии крови онкологических больных.

Предложенные алгоритмы распознавания имеют следующую точность и
чувствительность: для рака прямой кишки точность составила 94,1%,
чувствительность – 95,2%, рака пищевода и кардии точность и
чувствительность – более 85,0% с вероятностью непринятия решения около
35,0%, постхолецистоэктомического синдрома точность – 100%,
чувствительность – 96,7%, холецистопанкреатита точность – 96,7%,
чувствительность – 87,0%, язвенной болезни двенадцатиперстной кишки
точность и чувствительность составили 100,0% и могут быть использованы в
клинической медицине в качестве вспомогательных методов при диагностике
онкологических и внутренних заболеваний.

Ключевые слова: распознавание образов, сплайновая регрессия,
состоятельные оценки, доверительные интервалы, хаотические процессы,
механоэмиссия, онкологические заболевания, внутренние заболевания.

ABSTRACT

Romanov A.V. Statistical methods, algorithms, and recognition software
in medical research. – Manuscript.

Thesis for the Degree of Candidate of Sciences in Engineering in
specialty 01.05.04 – the System Analysis and Theory of Optimal
Decisions. – Kyiv National Taras Shevchenko University, Kyiv, 2005.

Thesis is devoted to the development of statistically proved
mathematical methods for recognition of oncological and gastroduodenal
diseases. The algorithms for computer diagnosis of digestive tract
cancer (gastric cancer, rectal cancer, cancer of esophagus and cardia)
based on nonlinear analysis of mechanoemission curves are proposed. The
method for computer diagnostics of internal diseases
(cholecystopancreatitis, duodenal ulcer, postcholecystectomy syndrome)
based on duodenal intubation is suggested. The computer diagnostics uses
the statistical theory of pattern recognition based on methods of
nonlinear dynamics, spline regression and confidence intervals. Strict
consistency of estimators obtained by minimization of residual squares
sum for spline regression model is proved. It is shown also that
estimations of all parameters obtained by Box formula except knot point
are unbiased. Asymptotic unbiasedness of knot point is established.

Developed software was used in computer-controlled device aimed for
analysis of mechanoemission data in blood of cancer patients.

Developed algorithms may find an application as auxiliary methods for
cancer and internal diagnostics.

Key words: pattern recognition, spline regression, consistent estimates,
confidence intervals, chaotic processes, mechanoemission, cancer,
gastroduodenal diseases.

PAGE 13

Похожие записи