Прогнозування впливу техногенного забруднення на довкілля методом непараметричного регресійного аналізу (автореферат)

УКРАЇНСЬКИЙ НАУКОВО-ДОСЛІДНИЙ ІНСТИТУТ

ЕКОЛОГІЧНИХ ПРОБЛЕМ

Проскурнін Олег Аскольдович

УДК 504.054

Прогнозування впливу техногенного забруднення на довкілля методом
непараметричного регресійного аналізу

Спеціальність: 21.06.01 – екологічна безпека

АВТОРЕФЕРАТ

дисертації на здобуття наукового ступеня

кандидата технічних наук

Харків – 2007

Дисертацією є рукопис.

Робота виконана в Українському науково-дослідному інституті екологічних
проблем Міністерства охорони навколишнього природного середовища
України.

Науковий керівник: кандидат хімічних наук, доцент

Захарченко Микола Іванович,

Національний аерокосмічний університет ім. Жуковського “ХАІ”, кафедра
екології і хімії

Офіційні опоненти: доктор технічних наук, професор

Рябченко Ігор Миколайович,

Харківській інститут МАУП, директор

кандидат технічних наук,

Василенко Сергій Леонідович,

Комунальне підприємство “ПТП “Вода”, м. Харків, головний гідролог

Провідна установа: Донбаська національна академія будівництва та
архітектури, Міністерство освіти і науки України, м. Макіївка

Захист відбудеться “17” травня 2007 р. о 15 годині на засіданні
спеціалізованої вченої ради Д.64.812.01 в Українському
науково-дослідному інституті екологічних проблем за адресою: 61166,
м.Харків, вул.Бакуліна,6.

З дисертацією можна ознайомитися в бібліотеці Українського
науково-дослідного інституту екологічних проблем (61166, м. Харків,
вул. Бакуліна, 6).

Автореферат розісланий “16” квітня 2007 р.

Вчений секретар

спеціалізованої вченої ради Жуковський Т.Ф.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Прогнозування стану навколишнього середовища під
впливом техногенних факторів необхідне при вирішенні екологічних задач,
пов’язаних з пошуком оптимальних форм управління екологічною безпекою.
Найбільш характерними з таких задач є наступні:

екологічний моніторинг;

нормування природокористування;

оцінка впливу на навколишнє середовище (ОВНС) промислових об’єктів.

Одним із традиційних підходів до прогнозування техногенного впливу на
довкілля є використання математичних моделей, які описують процеси та
явища, що характерні для досліджуваного об’єкта – екосистеми. Проблемою
використання таких моделей є необхідність їх адаптації до конкретних
умов, а це, як правило, пов’язане зі значними матеріальними і часовими
витратами. Крім того, може бути відсутньою адекватна математична модель.
За цих обставин все частіше застосовують статистичні методи
прогнозування, перш за все регресійний аналіз, коли за даними натурних
спостережень оцінюється залежність (функція регресії) найбільш
імовірного значення показника стану навколишнього середовища від рівня
техногенного забруднення. Проблема використання базового на даний час
методу оцінювання функції регресії – методу найменших квадратів –
полягає в тому, що метод є параметричним: достовірність прогнозу
залежить від параметрів розподілу значень показників стану навколишнього
середовища та техногенного забруднення. Ця обставина суттєво обмежує
дієвість методу щодо екологічного прогнозування. Існуючі непараметричні
методи або малоефективні при невеликих обсягах даних, або дозволяють
оцінювати тільки лінійну регресійну залежність, що для екологічної
задачі може бути неприпустимим.

У зв’язку з цим в дисертаційної роботі вирішується актуальне
науково-прикладне завдання щодо розробки непараметричного статистичного
методу прогнозування впливу техногенного забруднення на довкілля.
Розроблений метод дозволяє прогнозувати стан довкілля по відносно
невеликій кількості даних натурних спостережень. Достовірність прогнозу
за розробленим методом не залежить від розподілу розглянутих величин, що
істотно поширює можливості його застосування.

Зв’язок роботи з науковими програмами, планами, темами. Робота виконана
в рамках затвердженої Мінприроди України наукової праці “Ранжування
точкових джерел забруднення Азовського моря” (держреєстрація
№ 0103U006727).

Об’єкт дослідження: техногенне забруднення навколишнього природного
середовища.

Предмет дослідження: прогнозування стану навколишнього природного
середовища під впливом техногенного забруднення.

Методи дослідження. Основним методом дослідження є метод статистичних
випробувань (Монте-Карло). Крім того, були використані методи теорії
ймовірностей, математичної статистики, математичного аналізу та
комп’ютерного моделювання.

Мета та задачі дослідження. Метою дослідження є удосконалення
методології прогнозування стану навколишнього середовища під впливом
техногенного забруднення на основі статистичної обробки даних.

Для досягнення поставленої в дисертації мети були вирішені такі задачі.

Аналіз існуючих підходів до прогнозування впливу техногенного
забруднення на довкілля.

Обґрунтування застосування непараметричного регресійного аналізу (НРА)
для оцінювання впливу техногенного забруднення на довкілля.

Розробка непараметричного методу пошуку регресійних залежностей стану
навколишнього середовища від техногенного забруднення за даними натурних
спостережень.

Розробка алгоритму та комп’ютерної програми прогнозування впливу
техногенного забруднення на довкілля методом НРА.

Дослідження властивостей розробленого методу НРА.

Практичне використання методу НРА для прогнозування стану навколишнього
середовища; порівняльний аналіз результатів розрахунку методом НРА та
методом найменших квадратів.

Перевірка достовірності прогнозування розробленим методом на незалежних
(що не використовувались у розрахунках) даних натурних спостережень.

Наукова новизна отриманих результатів полягає в розробці і дослідженні
властивостей методу прогнозування впливу техногенного забруднення на
довкілля шляхом оцінювання відповідної регресійної залежності. При цьому
вперше:

коефіцієнти регресійної залежності стану довкілля від техногенного
забруднення наводяться у вигляді інтегральних показників;

оцінки коефіцієнтів регресії розраховуються методом статистичних
випробувань (Монте-Карло);

підвищення точності екологічного прогнозування досягається шляхом
послідовного виключення доданків шуканої регресійної залежності.

Практичне значення. Розроблено алгоритм та комп’ютерна програма
прогнозування впливу техногенного забруднення на довкілля за розробленим
методом. Результати досліджень впроваджені:

у Держуправлінні екології та природних ресурсів у Запорізькій області
при досліджені впливу скидання стічної води ДКП “Бердянський
міськводоканал” на якість води Азовського моря в районі скиду;

в Українському НДІ лісового господарства і агромеліорації
ім. Г. Н. Висоцького в рамках проведених інститутом робіт за темою
“Моніторинг стану, продуктивності і біорізноманіття лісів України в
умовах антропогенної трансформації навколишнього середовища”
(держреєстрація № 0196U018785).

у ТОВ “ПНДТЕП” (м. Харків) при виконанні науково-дослідної роботи з теми
“Розробка нормативів ГДС і ТПС речовин зі стічними водами для ТОВ
“Рубіжанський Краситель” і пропозицій до плану заходів для досягнення
ГДС”.

Особистий внесок здобувача полягає у наступному:

обґрунтування застосування НРА для оцінки впливу техногенного
забруднення на довкілля;

дослідження статистичних властивостей регресійного методу прогнозування
стану довкілля;

дослідження похибки прогнозування стану довкілля методом НРА;

розробка алгоритму та комп’ютерної програми прогнозування стану довкілля
методом НРА;

дослідження результатів екологічного прогнозування на модельних
прикладах; порівняльний аналіз результатів прогнозування розробленим
методом та методом найменших квадратів;

обґрунтування пропозицій щодо підвищення точності прогнозу стану
довкілля;

практичне впровадження результатів досліджень для прогнозування стану
довкілля.

Апробація результатів дисертації. Результати дисертаційної роботи
доповідались на: ІІ Міжнародній науково-практичній конференції “Проблеми
природокористування, сталого розвитку та техногенної безпеки регіонів”
(Дніпропетровськ, 2003); Міжнародному водному форумі “Аква України –
2003” (Київ, 2003); Міжнародній науково-практичній конференції
“Екологічна безпека: проблеми і шляхи вирішення” (Алушта, 2005); V
Міжнародній міждисциплінарній науково-практичній конференції “Сучасні
проблеми гуманізації та гармонізації управління” (Харків, 2004); VI
Міжнародній міждисциплінарній науково-практичній конференції “Сучасні
проблеми гуманізації та гармонізації управління” (Харків, 2005).

Публікації. За результатами дисертаційної роботи опубліковано 12 статей,
серед них 7 у провідних фахових виданнях ВАК України.

Структура й обсяг дисертації. Дисертація включає: вступ, чотири розділи,
висновки, список використаних джерел з 112 найменувань на 7 сторінках та
3 додатка на 24 сторінках. Загальний обсяг дисертації – 171 сторінка, з
яких основний текст – 134 сторінки. Робота містить 30 таблиць та 51
рисунок (з них 4 таблиці та 4 рисунка на окремих 8 сторінках).

ОСНОВНИЙ ЗМІСТ ДИСЕРТАЦІЇ

У вступі розглянуто актуальність теми, визначено зв’язок з науковими
програмами та темами, сформульовано мету, об’єкт, предмет та задачі
дослідження, визначено наукову новизну та практичне значення отриманих
результатів, а також особистий внесок здобувача.

У першому розділі проведено аналіз стану проблеми і сформульовано
формальну постановку задачі прогнозування методом регресійного аналізу.

Доведено, що екологічне прогнозування є складовою частиною системи
управління екологічною безпекою. Окремим напрямком екологічного
прогнозування є оцінювання безпосереднього впливу техногенного
забруднення на стан навколишнього середовища. Необхідність такого
прогнозування виникає при вирішенні екологічних задач, пов’язаних з
розробкою практичних рекомендацій з оптимального управління екологічною
безпекою (екологічний моніторинг, нормування природокористування, ОВНС
тощо).

Наведено загальні принципи та проблеми екологічного прогнозування, що
пов’язані зі складністю об’єктів прогнозування – екосистем.

Проаналізовано базові підходи до розв’язання задачі екологічного
прогнозування шляхом використання математичних моделей і прогнозування
на основі статистичної обробки наявних даних.

При математичному моделюванні природний об’єкт (водний об’єкт, ґрунт,
деревостан, атмосферне повітря тощо) розглядається як система з n
компонентів. Математична модель природного об’єкта в загальному випадку,
як правило, має форму системи диференційних рівнянь

де Y = {Y1,…,Yn} – вектор, що характеризує стан природного об’єкта;
V = {V1,…,Vm} – вектор зовнішніх факторів, що впливають на стан
природного об’єкта; t – час.

Розв’язанням системи диференційних рівнянь є функціональні залежності
Yi = Yi (t), які дозволяють здійснювати прогнозування стану природного
об’єкта.

Проблемою використання математичних моделей є те, що функції gi
включають до свого складу деяку кількість параметрів, тому в кожному
конкретному випадку потрібно проводити ідентифікацію цих параметрів з
метою адаптації моделей до конкретних умов. Цей процес є самостійним
науковим дослідженням і потребує великої кількості інформації про
досліджуваний об’єкт. Може виявитись необхідним проведення спеціальних
натурних досліджень, або використання фізичних моделей. Крім того,
адекватної моделі може не існувати, а її розробка стане невиправдано
трудомістким процесом.

Серед статистичних методів найбільш придатним для розв’язання задачі
екологічного прогнозування є регресійний аналіз. Регресійна задача
полягає у прогнозуванні деякої випадкової величини за відомими (або
спрогнозованими) значеннями інших (однієї або декількох) випадкових
величин за наявності між ними стохастичного зв’язку. Тобто за даними
натурних спостережень {xi, yi}, i = 1 ( N (де y – стан довкілля за
досліджуваним показником; x – вектор якісних та кількісних характеристик
забруднення; N – кількість спостережень), оцінюється функція регресії
f (x) – залежність найбільш імовірного стану довкілля від техногенного
забруднення. Крім того, розраховуються межі довірчої зони, що віддалені
від f (x) на величину, кратну середньоквадратичному відхиленню (f:

f+ (x) = f (x) + k(f;

f – (x) = f (x) – k(f.

Як правило, береться k = 2, що приблизно відповідає рівню надійності
0,95 для довірчого інтервалу [f–, f+] за умови нормального розподілу
величини f. (Значення функції f є випадковою величиною, оскільки вона
залежить від випадкової вибірки {xi, yi}.)

Регресійна залежність стану навколишнього середовища від техногенного
забруднення може бути наведена в формі розвинення по ортогональному
базису {(k}:

,

де (k – коефіцієнти розвинення, які в даній задачі мають значення
невідомих коефіцієнтів (параметрів) регресії; М – порядок шуканої
функції.

У цьому разі регресійна задача зводиться до оцінювання коефіцієнтів
регресії (k.

У розділі розглянуто основний на даний час метод розв’язання регресійної
задачі – метод найменших квадратів. Він полягає у тому, що функція f
вибирається із заданого класу функцій за умовою:

.

Відзначається, що метод найменших квадратів належить до параметричних
методів обробки даних, тобто він припускає наявність інформації про
закон розподілу розглянутих випадкових величин. Особливо це істотно при
малих обсягах натурних спостережень, коли перевірка гіпотези про закон
розподілу виявляється неможливою з високим ступенем достовірності. Крім
того, через специфіку об’єктів, що досліджуються, характеристики стану
довкілля та техногенного забруднення можуть мати розподіли, що істотно
відрізняється від вивчених (нормального, експоненціального, (-квадрат та
ін.).

У роботі відзначається, що існуючий непараметричний метод регресійного
аналізу дозволяє оцінювати лише лінійну регресійну залежність, що для
екологічних задач є дуже обмеженим чинником, або може бути
неприпустимим. Використання ж універсальних (з погляду кола статистичних
задач) непараметричних методів (типу Bootstrap та “методу складного
ножа”) для розрахунку оцінок коефіцієнтів регресійної залежності
утруднене тим, що дані методи малоефективні при невеликих обсягах
вибірки.

На основі проведеного аналізу зроблено висновок про актуальність
розробки непараметричного регресійного методу прогнозування впливу
техногенного забруднення на довкілля та визначено напрямок дослідження.

Другий розділ присвячено теоретичному обґрунтуванню використання методу
статистичних випробувань (Монте-Карло) для оцінювання коефіцієнтів
регресійної залежності стану складових довкілля від техногенного
забруднення. В основі цього методу лежить наступна математична
закономірність: функція розподілу будь-якої випадкової величини
розподілена рівномірно на чисельному відрізку [0, 1] незалежно від виду
розподілу вихідної випадкової величини.

Центральним поняттям розробленого методу прогнозування є інтегральний
показник – величина, що може бути визначена як

,

де a(() – щільність розподілу показника A у заданій області ( (( ( ()
об’єму V (() деякого простору.

Методами математичного аналізу доведено можливість подання
інтегрального показника у вигляді інтеграла по функції розподілу

,

де a(w) – функція, зворотна до функції розподілу w(a):

,

де ((a) – щільність розподілу величини a в області її змінювання
amin0
виконується рівняння

.

При малому обсязі вибірки спостережень і значному шумі оцінка, що
розрахована методом Монте-Карло, виявляється більш ефективною у
порівнянні з оцінкою, розрахованою методом найменших квадратів. Тобто
математичне очікування квадрата похибки М((k – (k)2 є меншим при
розрахунку методом Монте-Карло.

Результативність розробленого методу прогнозування стану довкілля
перевірена на натурних даних на прикладі р. Канзас, США. Для цього були
розраховані емпіричні регресійні залежності концентрації хлорофілу та
розчиненого кисню від температури води за великою кількістю спостережень
(відповідно 1125 і 432). Після цього емпіричні функції порівнювались із
результатом розв’язання регресійної задачі непараметричним методом за
невеликими вибірками даних спостережень (обсягом по 10 елементів),
випадково відібраних з великих вибірок. Згідно з розрахунками за
розробленим методом, має місце погодженість результатів: емпіричні
функції не виходять за межі довірчої зони [f–, f+], що свідчить про
надійність розрахунків. Крім того, ширина довірчої зони в обох випадках
є невеликою (порівнянною з коливанням емпіричної функції), що свідчить
про точність розрахунків. При розрахунку методом найменших квадратів
така погодженість має місце лише при визначенні залежності концентрації
хлорофілу від температури води.

У третьому розділі досліджується достовірність результатів прогнозування
стану довкілля методом непараметричного регресійного аналізу на
модельних прикладах. Необхідність проведення комп’ютерного моделювання
зумовлена тією обставиною, що в реальних екологічних задачах справжня
залежність стану довкілля від забруднення невідома і тому важко оцінити
результат розрахунку. У зв’язку з цим проведено експерименти, в яких
було задано функцію y* (x), що приймалась за справжню регресійну
залежність стану довкілля від техногенного забруднення і на яку
накладався шум ((x), що імітує множину інших випадкових факторів. Далі
за вибіркою {xi, yi} = {xi, y*i (x) + ((x)} вирішувалась регресійна
задача, і результат розв’язання (функції f, f–, f+) порівнювався з
функцією y*. За результатом порівняння робився висновок про якість
розрахунку.

В якості модельних були розглянуті функції y* (x) = xm, m = 0 ( 3.
Третій порядок обрано виходячи з того, що в реальних екологічних задачах
з малими обсягами вибірки та значним шумом отримання статистично
значущих доданків більш високого порядку малоймовірно.

, яке, у свою чергу, оцінювалось шляхом великої кількості генерацій
вибірки {xi} за законом рівномірного розподілу. Результат розрахунку
наступний: похибка S(m, k) не перевершує значення 0,14, тобто може
вважатися незначною. Друга частина експерименту проводилась для
розрахунків при використанні ортонормованих поліномів {Qi}, коли
коефіцієнти розвинення, як і самі поліноми, залежать від конкретної
вибірки {xi}. Тому було розглянуто розрахунки для двох “несприятливих”
випадків розташування точок {xi}: зсув точок до країв і зсув до центру
області визначення (в обох випадках зсув за квадратичним законом).
Результат розрахунку наступний: похибка S(m, k) не перевершує значення
0,3. Таким чином, методом комп’ютерного моделювання встановлено, що
похибка оцінки коефіцієнтів регресії, яка викликана використанням
вибіркових мінімуму і максимуму, є незначною.

Досліджено ефективність модифікації запропонованого методу прогнозування
– послідовного виключення доданків шуканої залежності стану довкілля від
техногенного забруднення, коли з ряду спостережень {yi} перед оцінкою
чергового коефіцієнта віднімаються величини (j(j(xi), що відповідають
раніше оціненим доданкам регресійної залежності. Аналіз ефективності
такої заміни зроблено шляхом порівняння між собою результатів
розв’язання регресійної задачі обома способами: з виключенням доданків
та без виключення. У результаті дослідження встановлено, що механізм
виключення доданків підвищує точність оцінки коефіцієнтів регресії за
рахунок більшої «зручності» функції

. («Зручність» підінтегральної функції визначається рівномірністю
розподілу аргументів {wi}, що відповідають обчислювальним значенням
{аi}).

Проведено порівняльний аналіз результатів прогнозування за розробленим
методом та методом найменших квадратів. Основними показниками якості
розв’язання регресійного задачі є точність – площа довірчої зони
[f+, f–] і надійність, що дорівнює імовірності відсутності помилки 1-го
роду Р(y* ( [f+, f–]). Оскільки обидва показники є взаємосуперечливими,
то оцінювати якість розв’язання необхідно за компромісним критерієм.
Було розглянуте два критерії оцінки якості розв’язання:

,

де S4( – площа довірчої зони [f+, f–]; S4(max – максимальна площа
довірчої зони у ряду розрахунків, які порівнюються; D – область
визначення функції f(x); Dпом ( D – множина точок, у яких виконується
умова y* ( [f+, f–] (тобто має місце помилка 1-го роду); ( – функціонал
міри, що має значення об’єму;

інтегральна відстань справжньої функції регресії y*(x) від меж довірчої
зони f(x) ( 2(f:

.

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

& ( N ? Ae r

( ? ? Ae r

t

O

U

hp

hp

hp

hp

. hp

hp

hp

hp

( hp

hp

hp

hp

hp

hp

&

&

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

hp

@

o

@

o

hp

hp

j hp

hp

hp

hp

jU0 hp

@

o

jAe6 hp

hp

hp

j hp

hp

hp

hp

j hp

hp

j?3 hp

hp

hp

????

o

??

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *