Реферат

на тему:

Поняття про пошукові технології системи Internet та їх класифікація

Поповнення інформаційного ресурсу Internet відбувається швидкими
темпами, тому знайти необхідну інформацію стає все важче. Різноманітні
друковані довідники старіють ще до їх появи у торгівельній мережі.
Єдиним надійним способом пошуку інформації є використання спеціальних
пошукових методів та технологій, які постійно слідкують за зміною
інформаційного ресурсу мережі.

За час існування мережі Internet робились різноманітні спроби
організації пошукових технологій. Багато з цих спроб виявилися
невдалими, інші привели до створення зручних технологій пошуку
інформації. Найефективніші технології пошуку з’явилися в останні два-три
роки. Загалом у світі існують сотні різноманітних пошукових технологій,
тому вибір тієї чи іншої технології та її пошукової системи залежить від
компетентності користувача та його особистих уподобань.

Багато пошукових технологій дозволяють шукати інформацію не тільки на
Web-сторінках, але й в групах новин, сховищах файлів мережі Internet.
Таким чином, в результаті пошуку можна знайти повідомлення в групі новин
або який-небудь файл. Тому зручнішим є застосовувати замість терміна
“сторінка” більш загальний термін “документ”. Під документом треба
розуміти Web-сторінку, повідомлення чи файл, що вміщує ту чи іншу
інформацію.

В Internet пошукові технології можна класифікувати за групами, за
допомогою яких здійснюється пошук документів:

Пошук за допомогою систем FTP, Gopher, Archie, Veronica тощо;

Пошук за допомогою “жовтих” та ”білих” сторінок Internet;

Пошук за допомогою каталогів;

Пошук за допомогою пошукових машин;

Пошук за допомогою метапошукових машин;

Пошук за допомогою програмних агентів;

Пошук за допомогою професійних служб пошуку.

Розглянемо ці технології пошуку.

Перша технологія.

В Internet створені спеціальні Web-вузли FTP, на яких знаходяться
програми, графічні та звукові файли й інша цінна інформація.

Вузол FTP-search

Предметний.

При роботі з ним необхідно знати ім’я файлу, що відшукується.

Вузол Snoopie

Адреса: HYPERLINK http://www.snoopie.com http://www.snoopie.com
Найшвидший предметний покажчик пошуку вузлів FTP.

За допомогою архівів Gopher краще всього знаходити текстові ресурси,
наприклад, книги, статті тощо. Для пошуку в архівах Gopher можна
використовувати такі вузли: Alex, Archie, Veronica та Galaxy.

Технологія “жовтих” сторінок.

Жовті сторінки Internet використовують ту саму концепцію, що й
однойменні телефонні довідники, й призначені для полегшення пошуку в
мережі шляхом розподілення їх за визначеними темами.

Більшість “жовтих” сторінок упорядковані за темами та надають
користувачеві назви вузлів та їх опис, а також URL. Найбільш популярні
довідники:

Official World Wide Web Yellow Pages від New Riders;

The Internet Yellow Pages від McGraw Hill;

McKinley Yellow Pages від New Riders.

Взагалі існує багато видань подібного типу, що містить інформацію про
вузли Web. Вартість таких довідників становить US$25-50.

Пошук за допомогою каталогів.

Каталоги – це вузли Web, які вміщують предметні покажчики інформації про
інші вузли, доступ до яких важливо отримати за допомогою перегляду або
пошуку. Завдяки розбивці даних на різноманітні категорії, забезпечується
можливість звуження пошуку доки не буде отримано необхідний документ.

Найпопулярнішим є каталог Yahoo, що має множину категорій та
підкатегорій. З його допомогою можна виконати пошук за визначеним
критерієм в цілому каталозі або його підкаталозі.

Інші каталоги, такі як Magellan, Excite, надають у ваше розпорядження
переліки вузлів, інформацію про них, різні статті, книги, новини (як
внутрішні, так і міжнародні) тощо.

Крім того, можна використовувати комерційні каталоги для отримання
інформації про місцезнаходження товарів та послуг. Комерційними
каталогами є Apollo, Linkstar та інші. В таблиці 1 наведено перелік
основних каталогів.

Таблиця 1. Перелік основних каталогів

№ Назва Адреса Призначення

1. Apollo HYPERLINK http://apollo.co.uk http://apollo.co.uk
Комерційний

2. Excite Netdirectory HYPERLINK http://www.excite.com
http://www.excite.com Бібліотечний

3. Galaxy HYPERLINK http://galaxy.einet.net http://galaxy.einet.net
комерційний та бібліотечний

4. Linkstar HYPERLINK http://www.linkstar http://www.linkstar
Комерційний

5. Point.com HYPERLINK http://point.com http://point.com Загального
призначення

6. Yahoo HYPERLINK http://www.yahoo.com http://www.yahoo.com
Загального призначення

7. Clearing House HYPERLINK http://www.lib.umich.edu
http://www.lib.umich.edu Бібліотечний

Пошукові машини.

Пошукові машини являють собою вузли Web, на яких для полегшення пошуку
знаходяться алфавітні покажчики майже всіх слів, що розміщуються на всіх
існуючих сторінках Web. Деякі пошукові машини призначені для роботи з
групами новин Usenet. Заслуговують на увагу двоє вузлів, за допомогою
яких виконується пошук серед груп новин:

Dejanews – http://www.dejanews.com

SIFT – http://sift.stanford.edu

Деякі пошукові машини розміщують дані про сторінки Web, що створені
заново. Уже за кілька годин після виникнення Web-сторінки інформація про
неї може бути в пошуковій машині.

Нижче в Таблиці 2 наведено перелік пошукових машин, що спеціалізуються
на наданні інформації про недавно створені вузли Web.

Таблиця 2. Інформація про нещодавно створені вузли

№ Назва Адреса

1. What’s New Too HYPERLINK http://www.manifest.com
http://www.manifest.com

2. What’s New On Yahoo HYPERLINK http://www.yahoo.com
http://www.yahoo.com

3. Starting Point HYPERLINK http://www.stpt.com http://www.stpt.com

4. New Happenings HYPERLINK http://www.midinet.net
http://www.midinet.net

Пошук адреси електронної пошти.

Існують пошукові машини, призначені для того, щоб знаходити адреси
електронної пошти.

Fourll – база даних, що вміщує більш ніж 3 мільйони адрес електронної
пошти: http://www.fourll.com

LookUp – база даних (менших за розміром), вміщує адреси електронної
пошти: http://www.lookup.com

Пошук за допомогою метапошукових машин.

Метапошукова машина являє собою вузол, за допомогою якого в системі Web
здійснюється пошук визначеної, деталізованої інформації. Метапошукова
машина дозволяє при введенні критерію пошуку лише раз, одночасно
опитувати велику кількість баз даних, представляючи результати в
організованій, релевантній формі. На жаль, більшість з існуючих на даний
час метапошукових машин не функціонують таким чином. Більшість з них
здійснюють пошук у декількох базах даних, але не одночасно, а послідовно
звертаючись до них.

Найкращою метапошуковою машиною є система Sawy Search, яка може
звертатися одночасно до 5 баз даних. Перед видачею результатів ця
система вилучає інформацію, що дублюється.

В таблиці 3 наведені найбільш популярні метапошукові машини з їх
адресами:

Таблиця 3. Метапошукові машини

№ Назва Адреса

1. All-In-One HYPERLINK http://www.albany/net/allinau
http://www.albany/net/allinau

2. Internet Heuth http://www.intbc.соm/sleuth/sleuth/html

3. Metasearch HYPERLINK http://www.metasearch.com
http://www.metasearch.com

4. Sawy Search HYPERLINK http://cage.cs.colostate.edu
http://cage.cs.colostate.edu

5. Web-Search HYPERLINK http://www.biddeford.com/soaring
http://www.biddeford.com/soaring

6. W3 Catalog HYPERLINK http://cuiwww.unige.ch/w3catalog
http://cuiwww.unige.ch/w3catalog

Програмні агенти.

Незважаючи на велику кількість пошукових та метапошукових машин,
розробники програмного забезпечення створили пошук за допомогою
програмних агентів. Такі агенти являють собою інтелектуальне програмне
забезпечення, яке може відслідковувати найбільш важливі вузли. Агенти
переходять від одного вузла до іншого, відшуковуючи потрібні дані та
визначають їх місцезнаходження. Таким чином зберігається час
користувача, який би він витрачав на введення умов для пошуку,
відвідуючи кожен вузол окремо. Агенти також зможуть відслідковувати
зміну інформації на певних вузлах і повідомляти про це користувачу.

У таблиці 4 наведені найбільш уживані системи програмних агентів.

Таблиця 4. Програмні агенти

№ Назва Адреса Призначення

1. Web Compass http://www.quarterdeck.com Найбільший пошуковий агент

2. SqURL http://www.bluesguierrd.com Працює із системами Altavista,
Exite, Lycos

3. Surfbot http://www.specter.com Забезпечує пошук у пошукових машинах
за ключовими словами

Професійні служби.

Зараз усе більше фірм починають спеціалізуватися на наданні платних
послуг, що пов’язані з пошуком інформації.

Фірма Dataquest (http://dataquest.com/weekly/main.html) спеціалізується
в області комп’ютерної індустрії. Ця компанія видає оперативну газету
Dataquest Interactive, основна частина якої є безкоштовною для
споживачів. Але при звертанні до комерційної інформації потрібна оплата
від US$95 до US$4000, залежно від обсягу та виду інформації (детальний
аналіз ринку, тенденція його розвитку тощо.)

Для отримання свіжих новин, спортивної інформації, прогнозу погоди можна
використовувати вузол Forecast (http://www.forcast.com). Служба Data
Times (http://www.de.enews.com/chisters/datatimes) є також комерційною
професійною інформаційною системою. Вона використовує у своїй базі даних
повідомлення, взяті з місцевих, регіональних і міжнародних газет,
журналів, теле- і радіопередач та інших джерел інформації. Але існують
компанії, що надають інформаційні послуги цілком безкоштовно.

В таблиці 5 представлені такі вузли

Таблиця 5. Безкоштовні вузли.

№ Назва Адреса Призначення

1. National Public Radio http://www.npr.com Загальна інформація

2. СNN Interactive http://www.cnn.com Загальна інформація

3. Reuters New Media http://www.yahoo.com/headlines Загальна
інформація

4. USA Today http://www.usatoday.com Газетна інформація

5. The New York Times http://nytemes.com Газетна інформація

6. Time http://www.pathfinder.com/time/ Журнальна інформація

7. The Washington Times Weekly Edition http://www.watchtimeweekly.com
Журнальна інформація

Похожие записи