ХАРКІВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ ІМЕНІ В.Н.КАРАЗІНА

МИСНИК АНАТОЛІЙ ВАСИЛЬОВИЧ

УДК 577.3

Аналіз одновимірних та двовимірних діагностичних даних методами штучних
нейронних мереж

03.00.02 – біофізика

АВТОРЕФЕРАТ

дисертації на здобуття наукового ступеня

кандидата фізико-математичних наук

Харків – 2004

Дисертацією є рукопис.

Робота виконана в Київському національному університеті імені Тараса
Шевченка.

Науковий керівник

кандидат фізико-математичних наук, доцент

Новоселець Михайло Кирилович,

завідувач кафедри медичної радіофізики Київського національного
університету імені Тараса Шевченка

доктор біологічних наук, кандидат фізико-математичних наук, професор

Говорун Дмитро Миколайович,

заступник директора з наукової роботи, завідувач відділу молекулярної
біофізики Інституту молекулярної біології і генетики НАН України

(м. Київ)

Провідна установа

Інститут фізики НАН України, відділ фізики біологічних систем, м. Київ.

Захист відбудеться “14” __січня___2005 року о 1500 годині на
засіданні спеціалізованої вченої ради Д64.051.13 у Харківському
національному університеті імені В.Н.Каразіна за адресою: 61077, м.
Харків, пл. Свободи, 4, ауд. 7-4.

З дисертацією можна ознайомитися у Центральній науковій бібліотеці
Харківського національного університету імені В.Н.Каразіна за адресою:
61077, м. Харків, пл. Свободи, 4.

Автореферат розісланий “_10_” ____грудня______2004 року.

Вчений секретар

спеціалізованої вченої ради Гаташ С.В.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Під час проведення біофізичних та біомедичних
досліджень виникає необхідність швидкого і високоінформативного аналізу
даних і патологічних станів, а також обробки діагностичної медичної
інформації. Для вирішення подібних задач використовуються різні методи:
візуальний аналіз медичних зображень, аналіз біоелектричних медичних
даних, тощо. Інтерпретація отриманих під час дослідження результатів є
основним і найбільш важливим завданням будь-якого сучасного біофізичного
дослідження. Суб’єктивність методів візуальної оцінки, формалізм методів
аналізу біоелектричних даних обмежують і ускладнюють їх використання в
багатьох випадках. Поряд з традиційними методами одним із актуальних та
перспективних методів обробки і аналізу медичної інформації є
використання модельних штучних нейронних мереж. При цьому самі штучні
нейронні мережі є об’єктом вивчення біофізики, оскільки вони
відображають принципи роботи нервової системи.

У зв’язку з цим тема аналізу експериментальних біофізичних даних за
допомогою штучних нейронних мереж і дослідження методів побудови та
роботи самих мереж є актуальною.

Безсумнівною перевагою штучних нейронних мереж з точки зору аналізу,
обробки і розпізнавання даних, зокрема даних біофізичних, фізіологічних
і терапевтичних досліджень, є здатність формування алгоритму прийняття
рішення як результату навчання і ініціалізації мережі, а також швидкодія
і стійкість отриманої системи. Основними напрямками досліджень в цій
галузі є: створення алгоритмічних моделей нейронних мереж, пошук
параметрів для навчання і розробка алгоритмів за якими навчаються
мережі, класифікація об’єктів; вдосконалення алгоритмів мереж для
скорочення часу побудови нейронних структур, пошук методів підвищення
стійкості нейронних систем з метою аналізу неповних або спотворених
даних і даних з шумом, а також розробка нових або адаптація існуючих
мереж для конкретних прикладних завдань і типів даних, як, наприклад,
для обробки медичних зображень, аналізу різноманітних типів фізичних
даних; відновлення та розпізнавання даних, функцій і послідовностей;
розпізнавання та обробка зображень. Методи вибору кількості прихованих
шарів та нейронів, тобто структури мережі, кодування на вході та
інтерпретація інформації на виході, вибір вхідних параметрів, які
пов’язані з властивостями досліджуваних об’єктів — це найбільш складні
проблеми сучасних алгоритмічних штучних нейронних мереж.

З фізичними принципами утворення та отримання ультразвукових та
магніторезонансних зображень пов’язані задачі представлення даних
медичного експерименту та виділення інформативних параметрів зображень
для експертної медичної діагностики, а також обробка, аналіз та
інтерпретація оброблених даних. До сучасних задач нейромоделювання можна
віднести: розробку швидкодіючих алгоритмічних мереж, пошук текстурних
характеристик зображень, які пов’язані з патологією, їх аналіз і
сегментація медичних зображень з метою встановлення діагнозу; обробку і
аналіз спектральних і біоелектричних даних для встановлення наявності
патології, а також розпізнавання і класифікацію даних. Дана робота
присвячена саме вирішенню перелічених вище проблем.

Зв’язок роботи з науковими програмами, планами, темами. Напрямок
досліджень пов’язаний з тематикою кафедри медичної радіофізики
радіофізичного факультету Київського національного університету імені
Тараса Шевченка. Дослідження проводились в рамках держбюджетної теми №
97037 “Фізичні принципи нових медичних технологій, що базуються на
застосуванні радіофізичної інтроскопії, спектрометрії, лазерного
випромінювання” та НДР № 01БФ052-05 “Розробка нових радіофізичних
методів для діагностики та лікування людей” (Київського національного
університету імені Тараса Шевченка). Робота відповідає завданням
програми 02.09 “Нові фізико-технічні методи, прилади та медичні
технології для діагностики і лікування нервової системи і внутрішніх
органів” приоритетного напрямку розвитку науки і техніки “Здоров’я
людини”, затвердженої Кабінетом Міністрів України (Постанова № 796 від
10.10.1995 р.) та комплексної програми розвитку медичної промисловості
на 1997-2003 рр., затвердженої Постановою Кабінету Міністрів України №
1538 від 18.12.1996 р. Дослідження спектрів частково виконувались в
рамках гранту №24/656 національного комітету з науки і технології
України.

Мета і задачі дослідження. Мета роботи полягала в розробці алгоритмічної
нейронної мережі, вирішенні проблеми вибору кількості нейронів і шарів,
розробці методів експертної медичної діагностики, класифікації, та
аналізу стану паренхіматозних органів за допомогою штучних нейронних
мереж; обробці медичних магніторезонансних та ультразвукових зображень з
метою отримання їх текстурних характеристик і класифікації захворювань,
аналізі і класифікації спектральних даних ДНК та даних біоелектричних
вимірювань, сегментації томографічних магніторезонансних і
ультразвукових зображень.

Для досягнення даної мети розв’язувалися наступні задачі:

— розробка та технічна реалізація алгоритмічної нейронної мережі з
додаванням нейронів і методу навчання, який дозволить вирішити проблему
побудови структури мережі, розробка методу ініціалізації і регуляризації
мережі Кохонена;

— визначення зв’язку між текстурними характеристиками зображень та
наявністю патології;

— дослідження ефективності розробленого методу експертної діагностики
для діагностики та класифікації біофізичних даних.

Об’єктом дослідження є діагностична інформація про зображення
біологічних тканин, які отримані за допомогою магніторезонансних та
ультразвукових систем, біоелектричних вимірювань та спектральних даних,
моделі штучних нейронних мереж.

Предметом дослідження є методи та принципи побудови і роботи штучних
нейронних мереж, діагностичні та біофізичні дані, експертна діагностика,
методи класифікації.

Методи дослідження включають математичне моделювання структури і
поведінки нейросистем, автоматизовану обробку результатів обстежень і
класифікацію порушень в біологічних об’єктах; експериментальні
томографічні і ультразвукові дослідження, порівняння результатів
діагностичних алгоритмів, побудованих за методами нейронних мереж, з
іншими методами аналізу і діагностики за медичними даними; методи
математичної статистики.

Наукова новизна одержаних результатів.

1. Розроблено та реалізовано оригінальну алгоритмічну штучну нейронну
мережу з додаванням нейронів і процедуру її навчання, яка дозволяє
вирішити проблему вибору кількості окремих нейронів та прихованих шарів,
а також містить новий тип нейронів.

2. Розроблено новий метод початкової градієнтної ініціалізації для
модельної нейронної мережі Кохонена і методи експертної діагностики за
допомогою штучних нейронних мереж.

3. Вперше досліджено зв’язок текстурних характеристик ультразвукових
зображень щитовидної залози й томографічних зображень головного мозку
людини з різними класами захворювань за допомогою методів нейронних
мереж і отримано оцінки діагностичної ефективності для класифікації
захворювань.

4. Вперше отримано оцінки ефективності розроблених методів нейронних
мереж для аналізу та розпізнавання відмінностей в опромінених та
нормальних спектрах ДНК.

5. Вперше отримано оцінки ефективності розроблених методів нейронних
мереж для аналізу і класифікації порушень серцевої системи за
електрокардіограмами.

6. Запропоновано метод сегментації ультразвукових і магніторезонансних
зображень з використанням штучних самоорганізуючих мереж.

Практичне значення одержаних результатів. Результати, отримані в роботі,
можуть мати широке практичне застосування як методика аналізу та обробки
даних при створенні нових методів обробки та фільтрації медичних
магніторезонансних томографічних і ультразвукових зображень, для
класифікації і аналізу спектрів ДНК, РНК і електрокардіографічних даних,
для встановлення діагнозу при скринінгових обстеженнях, при створенні
нових медичних технологій, а також можуть бути використані для вивчення
особливостей побудови сенсорних шляхів головного мозку, тощо.

Особистий внесок здобувача. В опублікованих із співавторами наукових
працях особистий внесок здобувача полягає: в роботах [1,2,5] — критичний
аналіз літературних даних, розробка методики аналізу медичних і
біофізичних експериментальних даних, розрахунок параметрів оцінки
ефективності методу; в роботах [3,7] — проведено аналіз технічних
можливостей при дослідженні та реалізації алгоритмів методів нейронних
мереж, проведено розробку алгоритмів та комп’ютерних програм для
чисельних моделювань та розробку і реалізацію методів експериментального
дослідження; в роботах [4,6] — участь в постановці задач, участь в
проведенні експериментальних досліджень, аналіз та інтерпретація
одержаних даних.

Апробація результатів дисертації. Основні наукові результати дисертації
доповідалися на міжнародній та вітчизняній конференціях: Conference on
Physics of Biological Systems (PBS98) September 1998, Kyiv, Ukraine;
First International Young Scientists Conference on Applied Physics, June
2001, Kyiv, Ukraine.

Публікації. Матеріали дисертації опубліковані в 7 роботах, з них — 5
статей в реферованих фахових журналах і 2 статті в матеріалах
конференцій.

Структура та обсяг дисертації. Дисертація складається зі вступу, п’яти
розділів, які закінчуються висновками, і загальних висновків роботи.
Повний обсяг дисертації становить 156 сторінок, робота містить 51
рисунок, 26 таблиць, в тому числі 9 таблиць і рисунків на окремих
сторінках. Список використаних літературних джерел — 104 найменування на
10 сторінках.

ОСНОВНИЙ ЗМіСТ РОБОТИ

У ВСТУПІ обґрунтовано актуальність теми досліджень, сформульовано мету
дисертаційної роботи, відображено наукову новизну, основні результати та
практичне значення роботи, сформульована постановка задачі і визначені
шляхи її вирішення.

У РОЗДІЛІ 1 аналізуються методи побудови самоорганізуючих нейронних
мереж, практичне використання, а також їх принципи побудови систем
аналізу зображень, фізичних і біоелектричних даних. Для опису поведінки
штучних нейронних мереж вводиться система рівнянь мережі та функція
зміни похибки, які є засобами дослідження мережі. Для отримання стійких
штучних нейросистем досить поширеними є методи створення
самоорганізуючих структур які або не потребують зовнішнього контролю,
або керуються певним алгоритмом, який також виконує регуляризацію, що
підвищує відмовостійкість. Суть цих методів полягає в застосуванні
мереж, які динамічно будуються під час навчання, або навчаються за
певним алгоритмом з використанням відомих даних. Головною проблемою під
час розробки структури та алгоритму навчання штучних нейронних мереж, та
при експериментальних дослідженнях залишається проблема збіжності
алгоритму мережі, а саме так звана проблема локального мінімуму, в якому
може опинитися система. Локальний мінімум призводить до нестійкої
поведінки і до зростання похибки розпізнавання, що є небажаним для
практичного застосування системи. Проблема локального мінімуму присутня
практично в будь-якому алгоритмі нейронної мережі і може бути вирішена
шляхом подальшого ускладнення алгоритму, структури нейронів, архітектури
мережі, або процедури навчання. Всі три шляхи є актуальними, оскільки
можуть бути застосовані як до існуючих штучних нейронних систем, так і
для створення нових.

Розділ 2 присвячено побудові і тестуванню самоорганізуючих нейронних
мереж, проблемам вибору структури мережі (вибору кількості прихованих
шарів), а також методам вирішення проблеми локального мінімуму.
Регулярізацію рішення мережі і мінімізацію похибки було проведено за
допомогою градієнтної ініціалізації і оптимізації ентропії. Для
використаних типів мереж ці методи застосовано вперше.

У розділі наведено алгоритми побудови двох штучних нейронних мереж:
мережі з додаванням нейронів і мережі Кохонена; представлені теоретичні
відомості загальної теорії нейронної класифікації, які використані для
створення алгоритмічних мереж і досліджується запропонований метод
регулярізації, якій дозволяє зменшити кількість даних для навчання і
отримати стійку поведінку системи. Для вирішення завдань аналізу було
обрано саме самоорганізуючі структури нейронних мереж, оскільки це
спрощує процедуру побудови і навчання нейронних мереж. Було створено дві
програмні моделі для біофізичних досліджень і аналізу одновимірних і
двовимірних медичних даних.

Мережа Кохонена є тривимірною структурою, в якій всі вхідні вузли
з’єднані з площиною нейронів. Для адаптації вагових коефіцієнтів було
запропоновано таку формулу:

wijk(t+1) = wijk(t) + c(t) L (xi(t) — wijk(t)), (1)

де wijk(t) — ваговий коефіцієнт зв’язку між і-м вхідним сигналом і
вузлом (j,k) для ітерації t; xi(t) — і-та компонента вхідного вектору;
коефіцієнт c(t=0) =с0 =1,0 і зменшується з часом, а L — функція впливу
сусідніх нейронів:

, (2)

Програмні параметри радіусу, (r1,r2,r3) = (1,2,3), визначають відстань
до сусідніх нейронів від “нейрона-переможця”, координати якого позначено
зірочкою. На вихідній площині мережі утворюються кластери, центри
(j*,k*) яких визначаються з умови мінімуму відстані від вагових
коефіцієнтів до вхідного сигналу , де wijk(t) — ваговий коефіцієнт
з’єднання між і-тою компонентою вхідного сигналу xi(t) і вузлом (j,k)
для ітерації t. Для мережі Кохонена було доведено, що при аналізі деяких
типів медичних даних локальні мінімуми рішення мережі розміщуються поруч
з глобальним. Для подолання такої ситуації було запропоновано метод
градієнтної ініціалізації мережі, який задає початкові значення вагових
коефіцієнтів і зменшує похибку. Ваговим коефіцієнтам мережі присвоюються
початкові значення які залежать від розміру мережі: wij(t=0) = F(j,k),
де F(j,k) — лінійна функція градієнта. Така процедура дозволяє збільшити
відстань між локальними і глобальним екстремумами мережі і отримати
більш стійке рішення.

Друга структура, яку було розроблено для класифікації і аналізу
біофізичних даних, — мережа, що працює за алгоритмом додавання нейронів.
Вона за структурою близька до персептроноподібних мереж, але на відміну
від них будується під час навчання.

Рис. 1. Поодинокий нейрон

Доведено, що для мереж на основі персептрона існують тільки емпіричні
правила вибору архітектури мережі, кількості прихованих шарів між
вхідними та вихідними вузлами, крім того система може опинитися в
локальному мінімумі замість глобального, що відповідає частковому
розв’язку системи рівнянь мережі.

Для вирішення наведених проблем було розроблено новий тип модельного
нейрону, який наведено на рис. 1. Він має два комплементарні виходи F і
F’, які з’єднані з керуючими (Е) входами нейронів наступного шару, W —
вагові коефіцієнти вхідних зв’язків, Х — вектор вхідних значень, Т —
поріг.

Під час навчання з нейронів динамічно будується мережа. Ускладнення
структури мережі і нейрону дозволяє суттєво прискорити навчання,
спростити і автоматизувати процедуру вибору кількості шарів і нейронів.

Оптимальна класифікація і глобальний мінімум відповідають екстремуму
ентропії:

(3)

Де pi і ni — ймовірності належності вхідних векторів до одного із класів
(вираз (3) записано для двох класів, i=1,2). Після побудови гіперплощини
простір параметрів розподіляється на дві області, в першій області
залишаються р1, які належать до класу 1 і n1 векторів, які належать
відповідно до класу 2, але розпізнані як клас 1, в другій області
залишаються р2 та n2: n2 віднесені мережею до класу 2 невірно, а р2 —
вірно. Для розпізнавання двох наборів об’єктів необхідно знайти
гіперплощину, яка розділює відповідні класи і відповідає екстремуму
ентропії. Прямий розрахунок ентропії ускладнює обробку і потребує
нормування вхідних даних, що призводить до складнощів при інтерпретації
вихідного сигналу, тому було запропоновано спрощення і зведення завдання
класифікації багатокомпонентних векторів до одновимірної задачі.
Розрахунок ентропії (3) запропоновано звести до розрахунку функції:

, (4)

де та — проекції векторів класу 1 та 2, та — значення розсіяння
проекцій. Величина розсіяння визначається як та , де Хр = Wt?X?J(W) —
девіація проекцій векторів класу 1 та 2. Якщо ввести матриці розсіяння у
вигляді та , де M1 і M2 — середні значення векторів класів 1 і 2, то
розрахунок виразу (4) зводиться до розрахунку лінійного дискримінанта
Фішера, для якого знаходиться мінімум: , де Sk — матриця розсіяння
проекцій у вихідному гіперпросторі, W — девіація. Даний метод дозволяє
неявно знайти екстремуми функціоналу ентропії. Мережа з такою
оптимізацією є стійкою і має збіжне рішення для всіх випадків, за
винятком особливої точки, коли значення матриць розсіяння вхідних
параметрів збігаються.

Розроблені нейронні мережі було реалізовано у вигляді комп’ютерних
програм і перевірено на фантомних і реальних діагностичних і біофізичних
даних з метою визначення специфічних особливостей поведінки структури і
необхідної початкової кількості даних для навчання мереж (рис. 2).

Рис. 2. Мапа ознак (вихідний) для мережі за алгоритмом Кохонена для
чотирьох нозологічних типів. Н – норма, ДЗ – дифузний зоб, Г –
гіпотериоз, ХТ – хронічний тиреоїдит Т – тиреотоксикоз

Для мережі Кохонена з градієнтною ініціалізацією за наборами
статистичних характеристик медичних зображень проведено навчання і
отримано вихідну мапу ознак — шар нейронів розміром 1000х1000 (рис. 2).
Скупчення нейронів ДЗ, Т, ХТ, Г відповідають різнім захворюванням. Всі
діагнози, тобто вхідні класи об’єктів, відповідають різним відокремленим
скупченням нейронів і утворюють локальні області у вихідному просторі
ознак.

Рис. 3. Залежність прогнозованості негативного результату (ПН) і
прогнозованості позитивного результату (ПП) від кількості навчаючих
записів

Таким чином, розроблена мережа придатна до експертної медичної
діагностики різних типів захворювань, а процедура градієнтної
ініціалізації дозволяє однозначно розділити на виході отримані діагнози
і отримати високу ймовірність розпізнавання.

Із залежності параметрів діагностичної ефективності яку наведено на рис.
3 для мережі з додаванням нейронів видно, що прогнозованість негативного
результату слабко залежить від кількості навчаючих даних. Наведені
залежності є усередненням 20 експериментальних досліджень, вертикальними
рисками позначено похибку, тобто розкид діагностичних параметрів.

Таку поведінку можна пояснити малою варіабельністю діагностичної
інформації про зображення біологічних тканин в нормальному стані.
Кількість навчаючих даних, яка потрібна для стійкої поведінки мережі є в
декілька разів меншою ніж для інших моделей нейронних мереж.

Розроблена штучна мережа з додаванням нейронів дозволяє отримати в
середньому на ?15-18% більшу діагностичну ефективність при аналізі та
класифікації медичних зображень за текстурними характеристиками і
призводить до зменшення похибки розпізнавання на ?12% порівняно зі
стандартними методами, зокрема алгоритмами нечіткої логіки. Процедура
градієнтної ініціалізації дозволяє зменшити похибку розпізнавання на
?10% для мережі Кохонена.

У РОЗДІЛІ 3 розроблений метод застосовується для обробки і аналізу
медичних ультразвукових і магніторезонансних зображень.

При комп’ютерній обробці зображень сигнал проходить дискретизацію і
перетворюється в двовимірний масив точок з певною яскравістю. Розподіл
по рівням квантування яскравості точок може бути описано як розподіл
ймовірностей першого і другого порядку, якщо вважати зображення
реалізацією деякого випадкового процесу, який є стаціонарним і
однорідним, або стаціонарним у строгому розумінні. Розподіл частот
першого порядку для такого процесу можна записати як , де М — повне
число пікселів у вікні сканування; розподіл другого порядку — , де
N(a,b) — число випадків, якщо одночасно для двох елементів зображення
виконується умова F(j,k) =a i F(m,n) =b, a i b — рівні яскравості точок.

Для отримання текстурних характеристик спочатку були розраховані
розподіли ймовірностей в околі кожної точки зображення: дисперсія ,
автокореляція , ковариація , та інші (L — кількість рівнів квантування
яскравості, a, b — рівні яскравості елементів зображення).

Текстурні характеристики було розраховано для виділених областей на
зображеннях і занесено у базу поряд з зображеннями і іншими даними
попередніх обстежень за допомогою гормональних та деяких інших методів:
один діагноз норма і чотири діагнози патології: дифузний зоб,
гіпотеріоз, хронічний тиреоідит і тиреотоксикоз — п’ять класів вхідних
даних. Отримані результати були відібрані далі за діагнозами. Всього
було оброблено більше 400 медичних зображень щитовидної залози з різними
ступенями захворювань.

В роботі також використовувались набори томографічних зображень зрізів
головного мозку, що зареєстровані за різних умов отримання
магниторезонансних зображень (з різним часом спінового відлуння),
діагноз для яких був попередньо встановлений лікарем.

За попередніми дослідженнями було сформовано набори даних з текстурних
характеристик з максимальною кореляцією (більше 0,9) між
характеристиками. Для підвищення діагностичної ефективності також
створено систему з ієрархічною схемою, коли аналіз зображень ведеться
одночасно за декількома парами параметрів.

‚ „ 3/4 Oe f

?

a

- ae e v

®

????

d

f

?

?

??????

??????

a

O

?e e i v

®

YY»»»»sTT

O

???????на ефективність — 0,95, чутливість — 0,93, специфічність — 0,95.
Найкращі результати отримано для пар текстурних ознак
автокореляція-зворотна різниця, автокореляція-момент інерції,
дисперсія-коефіцієнт асиметрії, коефіцієнт асиметрії-ентропія. Отримані
результати свідчать про зв’язок вказаних характеристик з захворюванням.
Для ієрархічної системи максимальна чутливість досягає 0,99,
специфічність — 0,98, також діагностична ефективність досягає значення
більше 0,98 для тих же самих характеристик.

Основна робота з аналізу та сегментації була виконана на зображеннях
томографу “Образ-1” з резистивним магнітом (0,12 Тл).

Для сегментації було обрано гладеньку функцію зміни вагових коефіцієнтів
нейронів: , де — вектор вагових коефіцієнтів між певним нейроном і
вектором вхідного сигналу в момент часу t, — функція впливу сусідніх
нейронів, яка замінює L в (1) і на нескінченності спадає до нуля. Було
обрано Гаусову функцію з коефіцієнтом ? і поперечником ?, які
експоненційно зменшуються на протязі часу в момент часу t вони
визначатимуться як:, , де індекси i та f відносяться відповідно до
початкового (t0) та кінцевого (t) значень, N=t/t0.

За допомогою розробленої штучної нейронної мережі експериментально було
встановлено, що для сегментації томографічних зображень не підходять
такі параметри як коваріація, момент інерції та дисперсія. Вони
приймають великі значення для кісткових тканин черепа та слабко
відрізняються для різних тканин головного мозку. Найбільш чіткий
контраст для більшості магніторезонансних зображень виявили такі чотири
параметри: автокореляція, зворотна різниця, одновимірні енергія та
ентропія; результат сегментації зображень за вказаними параметрами
показано зліва на рис. 4; за допомогою розробленого методу на зображенні
було автоматично виділено пухлину (контур зліва).

Також експериментально було показано, що для ультразвукових зображень
характерним є те, що для фону зображення та гортані коефіцієнт асиметрії
і коефіцієнт ексцесу мають протилежні за знаком значення відносно
щитовидної залози і зображення більш яскраве. Тому для виділення
щитовидної залози із ультразвукового зображення були одночасно
використані коефіцієнт

асиметрії, коефіцієнт ексцесу та додатково середня інтенсивність околу
кожної точки. Результат виділення щитовидної залози з фону за трьома
вказаними параметрами наведено на рис. 4 справа; за допомогою штучної
нейронної мережі було виділено контур щитовидної залози. Розроблений
метод сегментації дозволяє автоматично виділяти анатомічні структурі на
ультразвукових і магніторезонансних зображеннях з метою подальшого
розрахунку текстурних характеристик виділених областей.

Розроблений метод дозволяє досить впевнено сегментувати медичні
зображення і виділити на них деякі анатомічні особливості з метою
подальшого автоматичного аналізу і встановлення діагнозу.

Рис. 4. Типове магніторезонансне зображення головного мозку (зліва) і
ультразвукове зображення (справа) щитовидної залози, які відсегментовані
за текстурними характеристиками

На відміну від стандартних методів для сегментації медичних зображень
потрібно використовувати різні статистичні характеристики, для
сегментації різних типів зображень практично неможливо побудувати
універсальний метод. Сегментовані за фіксованими ознаками області, які
на одному зображенні відповідають патології, на зображенні, отриманому з
іншими параметрами або не мають аналогів, або відносяться до здорових
тканин і навпаки; крім того різні області можуть мати однакові
статистичні характеристики. Таку проблему можна вирішити додатковим
врахуванням координат точок з однаковими параметрами, що потребує
ускладнення алгоритму за рахунок розпізнавання образів. Розроблений
метод сегментації забезпечує достатню для практики якість сегментації
медичних зображень.

РОЗДІЛ 4 присвячено проблемам застосування розробленого методу для
аналізу спектральних даних нуклеїнових кислот.

Висока чутливість коливальної спектроскопії до різних конформаційних
станів молекул ДНК та РНК і суттєві зміни в відповідних спектрах були
отримані під час експериментів по дослідженню інфрачервоних спектрів
ДНК, опроміненої гама-радіацією в дослідницькій лабораторії
Чорнобильської АЕС протягом 4-12 місяців.

Інфрачервоні спектри нуклеїнових кислот було отримано на інфрачервоному
спектрометрі “Bruker” IFS-48. Експериментально було показано, що при
розпізнаванні змін у вказаних спектрах кластери різних класів
розміщуються досить близько і можуть перекриватися. Для подолання
наведеної проблеми було запропоновано ввести інгібуючі з’єднання між
нейронами. Для точок спектру, які викликають нестабільність мережі, що
відповідає перекриванню кластерів на вихідній мапі ознак було введено
від’ємні міжнейронні зв’язки. При цьому проводиться перерахунок вагових
коефіцієнтів, для чого у формулу розрахунку (1) wijk(t+1) = wijk(t) +
c'(t)?L?[xi(t) — wijk(t)] введено зміни. Коефіцієнт c'(t) розраховується
наступним чином: c'(t)=c(t)?, де ? (-1 ? ? ? 1) — параметр співпадання
двох вихідних кластерів, він дорівнює -1 коли два кластери повністю
співпадають, 0 — коли вони торкаються один одного, і 1, коли кластери не
мають спільних точок. Далі проводиться додатковий розрахунок структури
мережі. Значення ? вважається похибкою за рахунок перекриття, її
розрахунок приводить до збільшення часу роботи мережі, але дозволяє
уникнути зациклювання системи.

За допомогою нейронної мережі було оброблено декілька наборів
спектральних даних: зразків проб РНК із пухлин головного мозку людини,
яку отримано з операційного матеріалу на золотих підкладинках; а також
зразків ДНК різних тварин з різними стадіями злоякісності на золотих,
кремнієвих і підкладинках з СаF2.

Прямий зв’язок між змінами в спектрі ДНК і змінами структури молекул в
залежності від отриманої дози опромінення ще цілком не доведений. Для
зразків 12-місячних щурів є присутніми більш помітні як кількісні так і
якісні зміни для вищої дози — більше уширення спектральних смуг і
більший зсув максимуму, тому тривалість опромінення є важливим фактором
який визначає зміни поряд з загальною отриманою дозою. Для методу
нейронних мереж зміни структури ДНК приводять до підвищення похибки
розпізнавання спектрів одного класу, що свідчить про наявність змін в
спектрах.

Експериментальне дослідження порушень структури ДНК та РНК довело, що як
і для текстурних характеристик медичних зображень розпізнавання норми
практично не залежить від кількості навчаючих даних. Отриманий результат
може бути пов’язаний з малою варіабельністю параметрів і результатів
медичних досліджень стану організму в гомеостазі також як і для медичних
зображень (рис. 5, Р3). Поведінка залежності правильного розпізнавання
норми цілком відповідає результатам, які отримані під час аналізу
магніторезонансних і ультразвукових зображень з метою встановлення
діагнозу.

Рис. 5 Розраховані ефективності аналізу спектрів нуклеїнових кислот
пухлин в діапазоні 3800-1180 см-1. Р1, Р2 і Р3 — чутливість,
діагностична ефективність і прогнозованість негативного результату

Експериментальне дослідження ефективності алгоритму діагностичної
методики на основі нейронних мереж для розпізнавання і аналізу
інфрачервоних спектрів ДНК та протеїнів, що зазнали радіаційного
опромінення, дає змогу якісно оцінити величину пошкоджень і зробити
оцінки діагностичної ефективності для розробленої методики: чутливість —
0,7, специфічність — 0,92. Найкращі результати отримано для двох
діапазонів: 820-1300 см-1 і 1590-1800 см-1, де характеристичні смуги
менше маскуються смугами іншого походження (рис. 5, Р1 і Р2).

РОЗДІЛ 5 присвячено аналізу електрокардіографічних даних за допомогою
нейронних мереж. Для аналізу електрокардіограм вибрано найбільш
інформативні часові та амплітудні характеристики: позитивні зубці P,R і
Т, негативні зубці Q і S і непостійний зубець U; інтервали P-Q, Q-T,
S-T, T-P, R-R; комплекси QRS і QRST. Найбільш важливими є інтервали R-R
і (R-R )-1, оскільки саме вони пов’язані з нестабільністю роботи серця.

За допомогою розроблених нейронних мереж проведена автоматизована
діагностика декількох розповсюджених захворювань серцево-судинної
системи. При проведенні автоматичного аналізу методів нейронних мереж
виникають додаткові складнощі, тому що дані біоелектричних досліджень є
сильно варіабельними за рахунок суттєвої залежності від відведення,
якості електричних контактів, типу та хімічного составу використаного
електрогелю, стану та структури шкіри пацієнта, особливостей
реєструючого пристрою. Тому точні значення амплітуд піків і інтервалів
не можуть бути безпосередньо використані для точного встановлення
діагнозу. Параметри кардіограм було розбито на групи, яким були
зіставлені у відповідність додаткові вагові коефіцієнти, щоб зменшити чи
збільшити вплив певних груп параметрів. Інтервалограмам R-R і (R-R)-1
було присвоєно найбільші вагові коефіцієнти, які на два порядки
відрізняються від експериментально встановлених середніх значень.
Інтервалам між окремими піками QT, PQ, TP були поставлені у
відповідність вагові коефіцієнти, які на порядок більші, ніж середні
значення синаптичних зв’язків; вагові коефіцієнти амплітуд піків, які є
найбільш різними для різних умов запису і різних людей, не змінювались.
Таке розбиття параметрів на групи відповідає випадку створення
інгібуючих зв’язків.

Ефективність діагностики захворювань залежіть від якості біоелектричних
досліджень, навіть для кардіограм нормального стану серцево-судинної
системи дані дослідження мають велику варіацію. Для отримання кращої
ефективності методу нейронних мереж було також застосовано кардіологічні
дані з бази MIT-BIH (Гарвард). Було встановлено, що значний вклад в
похибку методу вносять ділянки з надзвичайно низькою відносно ізолінії
амплітудою і ділянки, де кількість QRS–подібних артефактів перевищує або
близька до кількості кардіокомплексів. Для якісної діагностики необхідно
розробити метод попередньої обробки і фільтрації даних біоелектричних
досліджень.

Діагностика за веріфікованими наборами навчальних даних дозволяє
отримати на 12-17% вищу діагностичну ефективність, розроблені нейронні
мережі дають на 10% кращі результати порівняно з кореляційними методами
і алгоритмами нечіткої логіки.

ВИСНОВКИ

В дисертаційній роботі вперше запропоновано метод аналізу текстурних
характеристик ультразвукових і томографічних медичних зображень і
класифікації біофізичних даних для експертної діагностики за допомогою
штучних нейронних мереж. Найбільш суттєві висновки з роботи зводяться до
наступного:

1. Для вирішення проблеми вибору кількості нейронів і шарів в мережі
розроблено оригінальну штучну нейронну мережу, яка містить новий тип
нейрону з інвертованими виходами і контролюючим входом. Проблема
локального мінімуму вирішена за допомогою методу оптимізації ентропії.

2. Для підвищення стійкості і збільшення діагностичної ефективності
методу на основі мережі Кохонена вперше запропоновано використовувати
метод градієнтної ініціалізації вагових коефіцієнтів і інгібіруючі
міжнейронні з’єднання.

3. Вперше встановлено текстурні характеристики, які дають високу
діагностичну ефективність і високу якість сегментації зображень:
автокореляція, зворотна різниця, момент інерції, дисперсія, коефіцієнт
асиметрії, ентропія, а також отримано пари характеристик, які дають
найвищу ефективність. Отримані результати свідчать про зв’язок патології
з вказаними текстурними характеристиками.

4. Вперше встановлено, що ефективність розпізнавання норми для різних
типів вхідних даних слабко залежить від кількості навчальних даних, що
може бути пояснено малою варіабельністю біофізичних і діагностичних
параметрів в гомеостазі; мінімальна кількість навчальних даних для
стійкої класифікації за допомогою розроблених мереж в декілька разів
менше ніж для інших алгоритмів.

5. Запропонований метод експертної діагностики на основі штучних
нейронних мереж дозволяє досягнути високої діагностичної ефективності
для ультразвукових медичних зображень щитовидної залози і томографічних
зображень мозку, яка перевищує на 90% і на 15% вище ефективності інших
автоматизованих методів. Аналіз за декількома текстурними параметрами
одночасно дозволяє отримати ефективність на рівні 98% для тих же самих
текстурних характеристик.

6. Методами штучних нейронних мереж встановлено наявність змін в спектрі
опромінених ДНК, що свідчіть про зміни структури молекул. Зі збільшенням
дози спостерігаються більш помітні зміни в положенні максимуму
інтенсивності і напівширини смуги; метод штучних нейронних мереж генерує
більшу похибку для опромінених зразків порівняно з референтними
зразками, що свідчить про наявність пошкоджень.

7. Запропоновано оригінальний алгоритм сегментації томографічних і
ультразвукових зображень за допомогою самоорганізуючих нейронних мереж,
отримано чітке розділення тканин.

8. Для методу експертної діагностики за електрокардіограмами найкращі
результати отримано для захворювання комбінованої гіпертрофії обох
шлуночків серця; діагностична ефективність перевищує 85%. Встановлено,
що для підвищення діагностичної ефективності методу нейронних мереж для
навчання системи необхідна попередня обробка і фільтрація даних
біоелектричних досліджень з метою усунення неінформативних ділянок і
артефактів, або навчання за відібраними даними.

Список опублікованих праць за темою дисертації.

1. А.В.Мисник, М.К.Новоселець. Діагностика захворювань щитовидної залози
за статистичними параметрами її ультразвукових зображень за допомогою
самоорганізуючих нейронних мереж // Вісник КУ, серія фіз.-мат. науки.
-1998. — Вип. № 3. — С. 339-348.

2. А.В.Мысник, М.К.Новоселец. Анализ текстур медицинских ультразвуковых
и томографических изображений с помощью нейронных сетей // Вісник ХУ,
Біофізичний вісник. — 1999. -№434, Вип. 3(1). — С.107-111.

3. А.Л.Луговик, А.В.Мысник, М.К.Новоселец. Анализ текстур медицинских
УЗ-изображений с помощью нейронных сетей // Український журнал медичної
техніки і технології. — 2000. — №1-№2. — C.40-44.

4. G.I.Dovbeshko, E.B.Kruglova, O.P.Pashcuk, M. Alesina, N.Ya.Karpenko,
A.Mysnyk, M.Novoselets. FTIR spectroscopy studies of DNA from low-dose
irradiated tissue // Вісник ХУ, Біофізичний вісник — 2000. — №497, Вип.
2(7). — C.65-74.

5. А.В.Іванчук, А.В.Мисник, М.К.Новоселець. Нелінійний ентропійний
аналіз медичних даних за допомогою нейронних мереж з метою сегментації
магніторезонансних та ультразвукових зображень // Вісник КУ, серія
фіз.-мат. науки. — 2001. — Вип. №1. — C.330-338.

6. A.Mysnik, M.Novoselets. Ultrasound and magnetic resonance medical
images textures analysis using neural networks // Conf. on Physics of
Biological Systems (PBS98), Kyiv. — 1998 — P.71-77.

7. A.V.Mysnyk. Ultrasound and magnetic resonance medical images textures
analysis using neural networks // Proc. of the First International Young
Scientists’ Conf. on Applied Physics, Kyiv. — 2001. — P.148-149.

АНОТАЦІЯ

Мисник А.В. Аналіз одновимірних та двовимірних діагностичних даних
методами штучних нейронних мереж. Рукопис.

Дисертація на здобуття наукового ступеня кандидата фізико-математичних
наук за спеціальністю 03.00.02 біофізика, фіз.-мат. науки. Харківський
національний університет імені В.Н. Каразіна, Харків, 2004.

Дисертація присвячена моделюванню нейросистем за допомогою штучних
нейронних мереж і практичному їх використанню для аналізу біофізичних
експериментальних даних та розпізнавання патології. Доведено, що
проблему локального мінімуму для штучних нейронних мереж можна вирішити
за рахунок регуляризації рішення мережі шляхом використання додаткових
міжнейронних зв’язків, а також градієнтного методу ініціалізації і
оптимізації ентропії. На основі розроблених в роботі методів аналізу
експериментальних даних створено та апробовано метод оцінки стану
паренхіматозних органів та спосіб експертної діагностики за біофізичними
даними. Експериментально показано, що при аналізі паталогічних станів
норма розпізнається краще і ймовірність розпізнавання слабко залежить
від граничних умов системи для ультразвукових, магніторезонансних
зображень і даних спектральних досліджень.

Ключові слова: штучні нейронні мережі, магніторезонансні томографічні
зображення, ультразвукові інтраскопічні зображення, інфрачервоні
спектри, біоелектрометрія, статистична оцінка, текстурні характеристики,
експертна медична діагностика.

АННОТАЦИЯ

Мысник А.В. Анализ одномерных и двумерных диагностических данных
методами искусственных нейронных сетей. Рукопись.

Диссертация на соискание ученой степени кандидата физико-математических
наук по специальности 03.00.02 биофизика, физ. мат. науки. Харьковский
национальный университет имени В.Н. Каразина, Харьков, 2004.

Диссертация посвящена моделированию нейросистем с помощью искусственных
нейронных сетей и их практическому применению для анализа биофизических
экспериментальных данных и распознавания патологий. Доказано, что
проблема локального минимума для искусственных нейронных сетей может
быть решена за счет регуляризации решения путем использования
дополнительных типов межнейронных связей, а также применения метода
градиентной инициализации и оптимизации энтропии. На основе предложенных
в работе методов анализа экспериментальных данных разработано и
апробировано метод оценки состояния паренхиматозных органов и способ
экспертной диагностики по биофизическим данным. Экспериментально
показано, что при анализе патологических состояний норма распознается
лучше и вероятность распознавания слабо зависит от граничных условий
системы для ультразвуковых, магниторезонансных изображений и данных
спектральных исследований.

Ключевые слова: искусственные нейронные сети, магниторезонансные
томографические изображения, ультразвуковые интраскопические
изображения, инфракрасные спектры, биоэлектрометрия, статистическая
оценка, текстурные характеристики, экспертная медицинская диагностика.

SUMMARY

Mysnyk A.V. One-dimensional and two-dimensional diagnostic data analysis
using the methods of artificial neural networks.

Thesis to the competition for the Candidate of Physical and Mathematical
Sciences degree in speciality 03.00.02 — biophysics. National V.N.
Karazin university of Kharkov, Kharkov, 2004.

Thesis is dedicated to the development of neural system modelling
methods, so called artificial neural networks, and their practical
application for experimental biophysical and diagnostic data analysis,
recognition of pathology state, medical ultrasound and magnetic
resonance images segmentation and pathology recognition with the help of
texture characteristics. It is shown that local minima problem could be
solved using normalisation with the help of new neuron architecture, and
more complex structure of the network. Developed artificial neural
network with adding neurons contains additional elements: additional
inter-neuron links and inverted outputs with specific connections, and
implicit entropy optimisation procedure is introduced; Kohonen
feature-map neural network is initialised using gradient method as well
as new link types are introduced. Learning-by-adding-neurons neural
network algorithm and network structure is presented. Neural network
consists of complex structure neurons, they have additional control
input for threshold management and two inverted outputs which are
connected to control input link of next-layer neurons. It is shown that
such structure helps to solve the problem of number of neurons and
hidden layers selection. It is shown that division of input feature
space into two half-spaces and optimal hyperplane selection, which is
dependent of links weight coefficient and threshold, could be done by
finding minima of class vector projections which is an equivalent of
finding entropy extremum. Method of expert diagnostics based on
developed Learning-by-adding-neurons neural network and expert
diagnostics based on Kohonen map with gradient initialisation and
additional specific inter-neuron links for magnetic resonance imaging,
ultrasound images, spectra and electrocardiograph data is presented.
Both neural networks are self-organising unsupervised structures and are
governed by formal learning rules.

Developed neural structures allow to achieve 98% of diagnostic
efficiency for ultrasound, 96% of diagnostic efficiency for magnetic
resonance images analysis, about 92% recognition efficiency for infrared
spectra of normal and damaged by radiation nucleonic acid; bio-electric
investigations allow to get an efficiency about 85% for low-quality data
and more than 93% of right diagnosis recognition for pre-filtered and
pre-selected data from MIT BIH cardiographic data database.

Direct relation between DNA and RNA spectra and molecule structure
changes according to radiation dose is not proved yet, but for tissues
of 4- and 12-month rat with 57 cGy have more specific changes in spectra
as to lower doses; the changes result in band maximum position shift and
greater band width, for greater doses more changes where observed.

It is shown, that for bio-electircal investigations pre-processing of
data and filtration is needed to exclude non-informative regions and
QRS-artefacts to improve diagnostic efficiency, otherwise efficiency
does not exceeds 85%, which is too low for modern expert systems.
Diagnostics efficiency essentially depends on data quality, contact
quality, supplementary materials and noise level. It is shown that for
high quality data efficiency could be raised up to 7% from previous
level of efficiency.

It was experimentally shown, that normal state, or absence of pathology,
is recognised better and normal state identification does not depend
from data quantity and start conditions for ultrasound, magnetic
resonance imaging and spectral data.

Method of magnetic resonance and ultrasound imaging segmentation based
on textural characteristics of images with Kohonen-based neural network
structure with gradient initialisation and continuous gaussian-like
neighbouring function is used as neighbour neurons interaction function.
It is experimentally shown that different images type require different
texture characteristics selection for segmentation: one- and
two-dimensional. It is almost impossible to build uniform segmentation
method, thus recommendations of parameters selection are presented.
Segmentation quality as to experts opinion is acceptable for practical
purposes.

The results of thesis are published in 7 scientific papers and 2
international conferences.

Keywords: artificial neural networks, magnetic resonance tomography
images, ultrasound images, infrared spectra, bioelectric
characteristics, statistical estimation, texture characteristics, expert
diagnostic systems.

Похожие записи