РЕФЕРАТ

на тему:

База даних і системи управління БД у СППР

Зауважимо, що в літературних джерелах існує багато описів поняття бази
даних, що зовні значно відрізняються один від одного, акцентуючи увагу
на тій чи іншій рисі об’єкта опису, але по своїй суті вони достатньо
близькі.

База даних (БД) — це сукупність взаємозв’язаних даних, що зберігаються
разом. Основними та невід’ємними властивостями БД є такі:

— для даних допускається така мінімальна надлишковість, яка сприяє їх
оптимальному використанню в одному чи кількох застосуваннях;

— незалежність даних від програм;

— для пошуку та модифікації даних використовуються спільні механізми;

— як правило, у складі БД існують засоби для підтримки її цілісності та
захисту від неавторизованого доступу

Прокоментуємо додатково підкреслені слова та вирази у вищенаведеному
описі, порівнюючи в основному з близьким попередником БД — файловими
системами (ФС).

На відміну від файлових систем БД зорієнтована для підтримки даних для
кількох застосувань. На практиці ця властивість інколи порушується.
Часом таке порушення можна пояснити тим, що проект вводиться в дію
поетапно, і у певний момент дійсно функціонує тільки одне застосування.
Іноді відхід від вказаної властивості зумовлений іншими важлими
причинами, але, на жаль, не є рідкістю просто помилка у виборі засобів
для реалізації проекту і ситуація нагадує відоме прислів’я про
стрілянину з гармати по горобцям.

Взаємозв’язаність даних полягає в тому, що доступ до певної групи даних
якогось застосування загалом полегшує доступ до інших груп даних цього ж
застосування. В умовах орієнтації БД на велику кількість застосувань
виникає необхідність у підтримці значного числа різноманітних зв’язків
між даними. Саме у розумінні тісного логічного зв’язку використані слова
про збереження разом даних. Розглянемо приклад, який ілюструє вказану
властивість у порівнянні з простими ФС.

Приклад про міщок з різнокольоровими кульками.

Нехай у мішку є багато різнокольорових кульок, і завдання полягає в
тому, щоб знайти кульку певного кольору, витягаючи їх по одній з мішка.
Якщо операції витягання кульки з мішка повністю незалежні між собою, то
цей приклад є аналогом технології роботи у рамках простих ФС з
послідовним доступом. Якщо ж припустити, що кульки зв’язані між собою
різнокольоровими мотузками, тоді пошук кульки можна пришвидчити,
використавши на черговому кроці мотузку потрібного кольору. Цей варіант
прикладу є аналогом технології роботи з взаємозв’язаними (мотузками)
даними, що характерно для функціонування БД.

Вимога мінімізаціїї надлишковості полягає у мінімальній кількості копій
для одних і тих же даних з урахуванням орієнтації на кілька
застосувань. Ці надлишкові копії використовуються для підтримки зв’язків
між даними. Як приклад, розглянемо відомості, що зберігаються у відділі
кадрів деякого підприємства про своїх співробітників. Користувачами цієї
інформації виступають адміністрація, профспілкова організація та
бухгалтерія підприємства. Адміністрацію цікавлять дані про кваліфікацію,
професійний рівень і досвід роботи, профспілки використовують відомості
соціально-побутового характеру, а бухгалтерія оброблює ті дані, що
потрібні для нарахувань заробітної плати та підрахунку податків, інших
нарахувань та відрахувань. Хоча інформація і різнорідна, але все ж має
значну спільну частину. Всім користувачам потрібні службовий номер,
прізвище, ім’я, по-батькові співробітника, його рік народження, дані про
умови праці. Інформація про сімейний стан та склад сім’ї
використовується бухгалтерією і профспілками. Якщо для зберігання даних
застосувати технологію ФС, то можливі два крайні варіанти: а)незалежні
один від одного файли, відсортовані згідно з потребами того чи іншого
користувача, передбачають значну надлишковість даних; б)всі дані
знаходяться у одному файлі, відсортованому так, як потрібно одному з
користувачів (наприклад, адміністрації) — надлишковість при цьому
практично відсутня, але зручно працювати тільки одному з користувачів.
Концепція БД займає проміжне становище між вищеописаними крайніми
позиціями.

Зайва надлишковість має кілька недоліків. По-перше, зберігання кількох
копій веде до додаткових витрат пам’яті. По-друге, доводиться виконувати
численні операції оновлення для кількох надлишкових копій. Крім того,
оскільки різні копії даних можуть відповідати різним стадіям оновлення,
то інформація, що зберігається в системі на певний час може стати
суперечливою.

Про незалежність даних часто говорять, як про одну з основних
властивостей БД. Під цим поняттям розуміється можливість зміни
структури даних без зміни програм, що її використовують, а також рівень
самоінтерпрето-ваності даних. Міра незалежності даних тісно пов’язана з
ступенем необхідної деталізації відомостей про організацію їх
зберігання. Проілюструємо цю ситуацію дещо абстрагованим прикладом.
Припустимо, що ви збираєтесь переглянути фільм у кінотеатрі, а для того,
щоб прибути на місце плануєте скористатись послугами таксі.
Поінформованість та досвід водія таксі відповідають мірі незалежності. У
одному випадку Вам достатньо вказати лише назву фільму, а все інше
зробить водій. У іншому випадку Вам потрібно буде визначити назву
кінотеатру. Наступне зниження рівня — це адреса кінотеатру, а ще далі —
вказівки по дорозі типу «їхати прямо, звернути наліво, а через 500
метрів — направо і т.п.». Аналогічно і користувачу при підвищенні
ступеня незалежності даних треба менше задавати (і знати) «процедурної»
інформації щодо доступу до даних. Зауважимо, що певний (хоч і досить
низький) рівень незалежності мають сучасні ФС: при доступі до файлу
достатньо вказати його ім’я, а інформація про треки та сектори
непотрібна, але зміна розміру запису вимагає корекції всіх програм, що
звертались до цього файла.

Під цілісністю БД розуміють несуперечливість між собою даних, що в ній
зберігаються. Наприклад, для кадрових відомостей рік народження
співробітника не може бути більшим року призначення на посаду або
поточного року. Щоб запобігти виникненню таких ситуацій при модифікації
і поповненнях БД, співвідношення між даними контролюються спеціальними
засобами підтримки цілісності БД. Специфікація подібних умов, що
накладаються на дані і відслідковуються при будь-яких їх оновленнях,
покладаються на спеціальну службу Адміністратора бази даних (АБД), а
системи управління базами даних (СУБД) надають інструментальні засоби,
які забезпечують службі АБД можливість виконання її функцій.

За критерієм виразової потужності інструментальні засоби специфікації
умов цілісності можна підрозділити на такі групи:

порівняння поля запису (або атрибута) з константою або з іншим полем
цього ж запису; приклад такої умови наводився вище;

порівняння поля запису з полем або кількома полями інших записів;

порівняння поля запису з множиною (підмножиною) значень полів всього
файлу або навіть кількох файлів. При порівняннях використовуються
відношення належності (неналежності) елемента множині, або
застосовуються множинні функції типу суми, кількості, середнього
арифметичного, тощо. Приклад такої умови: заробітна плата певного
службовця не може більш ніж у 5 разів перевищувати середнє арифметичне
від заробітної плати його підлеглих.

Зауважимо також, що вищенаведений поділ на групи має в своїй основі не
тільки виразову потужність, а і складність алгоритмів реалізації.

Оскільки однією з основних властивостей БД є орієнтація на широке коло
застосувань, то природно передбачити засоби захисту від неавторизованого
доступу (навмисного чи ненавмисного) користувачів до даних. З цією метою
в БД встановлюється система паролів та ідентифікацій користувачів, а
також розподіл даних і користувачів на групи з різноманітними взаємними
правами.

Представлення знань у СППР

У базі знань у деякому закодованому виді зберігаються формалізовані
знання. На сучасному етапі розвитку ЕС використовується кілька форм
представлення знань. Виділимо з них чотири основні:

1.»Трійка» об’єкт- атрибут- значення, наприклад: будинок- колір-
зелений; пацієнт- температура- висока. Ця форма представлення знань
визначає «об’єкт», що володіє деякими атрибутами (властивостями), що
можуть приймати значення з відомого набору.

2.Правила продукції у виді: Якщо пацієнт хворий грипом И стадія
захворювання початкова, ТО температура висока з імовірністю = 0.95 И
головний біль є з імовірністю = 0.8.

Правило продукції складається з двох частин: посилки (ЯКЩО) і
висновку (ТЕ), кожна з який складається з конъюнкції тверджень більш
низького рівня деталізації.

3.Фрейм. Являє собою іменовану таблицю з деякою кількістю слотів-
осередків, що мали свої імена й одержують у процесі роботи машини
висновку деякі значення. Як значення можуть бути присутнім константи,
посилання на фрейми більш високого чи більш низького рівня, а також
деякі обчислювальні процедури.

4.Семантична мережа. Це орієнтований граф, вершини якого
відповідають об’єктам (подіям), а дуги описують відносини між вершинами.

Перша з зазначених форм представлення знань («трійка») є найбільш
ранньою формою, свого роду перехідної, від представлення даних до
представлення знань. Найкраща область застосування «трійки»-
діагностичні ЕС у предметній області з великою кількістю
легко-кластерізуємих об’єктів, у кожнім класі яких мається велика
кількість загальних атрибутів. Прикладом такої області може служити
діагностика складних технічних систем.

Представлення знань за допомогою правил продукції — найпоширеніша
форма реалізації БЗ. За допомогою продукції можна описати практично
будь-яку систему знань. На них засновані всі ранні ЕС, такі, як MYCIN, а
також гнітюча більшість сучасних ЕС у різних предметних областях.
Відповідно до цієї форми реалізації БЗ зроблена більшість систем —
«оболонок» і багато інструментальних середовищ. У цілому продуктійна
форма представлення знань є природної і зручний для формалізації знань,
отриманих в експерта.

Фрейд — структури деякою мірою стали розвитком методу електронних
таблиць в області обробки знань. Це друга по частоті зустрічальності в
конкретних реалізаціях ЕС форма представлення знань. Фрейм -структури
найбільше розумно застосовувати в предметній області з чітко вираженою
ієрархічною структурою.

Семантичні мережі споконвічно виникли як модель довгострокової людської
пам’яті в психології. Великий інтерес до роботи із семантичними мережами
виявляють розроблювачі систем взаємодії на природних мовах.

Використана література:

Вінер Н. “Бази даних”, М.: Наука, 1993

Стефанюк В.Л. “Інформаційні системи і їх застосування”. – К., 1999.

“Обчислювальна техніка і її застосування”. – Москва, 2000.

Похожие записи