.

Пошук за допомогою системи AltaVistа та основні технологічні операції (реферат)

Язык: украинский
Формат: реферат
Тип документа: Word Doc
0 1034
Скачать документ

Реферат

на тему:

Пошук за допомогою системи AltaVistа та основні технологічні операції

Пошукова машина (система) AltaVista належить корпорації Digital і
відкрита для вільного користування в кінці 1995 року. Система була
створена для демонстрації по мережі Internet характеристик серверів
Alpha. Ця система є найбільш популярною серед усіх пошукових машин. В
ній передбачені два варіанти пошуку:

простий (Simple Search);

складний (Advanced Search).

Адреса системи: http://www.altavista.com

Розглянемо технології роботи кожного варіанту:

Технологія простого пошуку броузера

Web-сторінка пошукового сервера має два елементи: поле введення
запитання та кнопку (або посилання) для відправки запитання. Крім того
властиві ще два елементи, що дозволяють уточнити зону пошуку та форму
виведення результатів (рис/ 1).

Меню Search, яке випадає на екран, пропонує вибрати систему, в якій буде
пошук:

Web – в системі Web;

Usenet – в групах новин.

Меню Display the Results (Показати результати) установлює форму
представлення інформації:

In Standart Form – у стандартній формі;

In Compact Form – в компактній формі;

In Detailed Form – в детальній формі.

Рис. 1. Початкова сторінка системи AltaVista

Пошукове запитання формується за допомогою логічних операторів “і”,
“або”, “ні” і т.д. Вони дозволяють з’єднати слова запитання в єдину
логічну конструкцію. На жаль, значки, що використовуються для позначення
логічних функцій у різних пошукових системах не завжди співпадають.
Навіть в межах однієї пошукової машини AltaVista для систем простого й
складного пошуку використовується різний синтаксис. В таблиці 6 наведені
логічні оператори в системі AltaVista.

Крім булевих операторів, в системі використовуються й інші логічні
оператори.

Зірочка (*) після слова.

Цей оператор має значення ВСЕ (або БУДЬ-ЯКИЙ). Наприклад, на запитання
russi* будуть знайдені слова: russia, russian, russifi… Цей знак дає
пошуковій машині зрозуміти, що вас не цікавлять закінчення слів, воно
може бути будь-яким.

Але існують обмеження на використання цього оператора:

перед зіркою (*) повинно бути не менше 3-х букв;

коли буде знайдено дуже багато документів, наприклад, більше мільйона,
то система пошуку не виведе результат.

Подвійні лапки (“”).

На противагу до попереднього оператора, цей оператор виділяє певний
вираз і наказує пошуковій машині точно відшукати текст, що відповідає
написаному.

Наприклад, на запит “fat cat” будуть знайдені всі документи про товстих
котів.

Таблиця 6. Логічні оператори в системі Alta Vista

Логічний оператор Простий пошук Складний пошук

Пояснення

Позначення Приклад Позначення Приклад

АБО Пропуск Fat cat OR Fat OR cat Знайти документ, де є слово fat або
слово cat

І + +Fat +cat AND FatAND cat Знайти документи, де є слово fat і слово
cat

НЕ – Fat -cat NOT Fat NOT cat Знайти документи, де є слово fat, але
немає слова cat

БІЛЯ Не використовується NEAR Fat NEAR cat Знайти документи, де слова
fat розташовані поряд із словами cat

Складаючи запитання слід бути дуже обережним із пропусками. Між логічним
знаком (оператором) та словом пропуску не повинно бути. Але перед
наступною групою новин пропуск повинен бути.

Запитання набирається в полі запитань. Для надсилання запитання потрібно
натиснути клавішу Submit.

Через певний час у програму перегляду броузера буде завантажена сторінка
з результатами пошуку. Результати пошуку, наприклад, будуть представлені
записом:

Документи з першого по десятий з приблизно 40000, що задовольняють
запит, найбільш точно відповідають перші (documents 1-10 of about 400000
matching the query, best matches first)

Оскільки всі знайдені документи розташовано за рангом, то в перших рядах
знаходяться ті, що найбільше відповідають запиту. При бажанні можна
зберегти сторінку, записавши її на дискету через меню File.

Технологія складного пошуку

Складний пошук відрізняється від попереднього тим, що в ньому
застосовується новий алгоритм складення запитів на нових полях. Замість
одного поля з’явилося два текстових поля і ще одне поле для введення дат
(рис. 2).

Згідно з таблицею 6 тепер потрібно застосовувати булеві оператори AND,
OR, NOT, NEAR для формування запитань, а також оператори зірочка (*),
подвійні лапки (“). Крім того, з’явився новий оператор – круглі дужки.

Круглі дужки дозволяють, як в алгебрі, правильно згрупувати складові
пошукового запиту. Буде зрозуміліше, якщо уявити оператор AND як знак
множення, а OR – як знак додавання.

Складна система дозволяє обмежити пошук документів за якийсь період. Для
цього потрібно задати часовий інтервал. Поле Початкова дата (Start Date)
потрібне для введення нижньої межі діапазону, а поле Кінцева дата (End
Date) – верхньої межі діапазону. Наприклад, 31/Jan/97, 1/Jan/97.

Крім того, у складній системі існує спеціальне поле Критерії сортування
результатів (Results Ranking Criteria), що дозволяє задати власний
варіант сортування. Наприклад, коли потрібно, щоб першими з’явилися
документи, що вміщують якесь певне слово, то це слово заноситься в поле
сортування результатів. Тоді всі документи будуть видані у відповідності
з цим критерієм.

Рис. 2. Поля для введення складного запиту в Alta Vista

Новий інструментарій системи Live Topics

Цей інструментарій дозволяє очистити та проаналізувати результати
пошуку. Система Live Topics аналізує зміст документів, які були знайдені
у відповідь на запитання, і виводить на екран монітора таблицю слів, що
найчастіше зустрічаються (частотну таблицю).

Можна по-новому відсортувати документи, відмічаючи прямо в списку, які
слова потрібно включити в уточнене запитання, а які ні. Система
реалізована для різних програм перегляду:

Visual Live Topics – для програм, що підтримують Java;

Live Topics – для програм перегляду, що підтримують JavaScript;

Text – текстовий варіант для будь-яких програм.

Початкова сторінка Live Topics вміщує текстову зону з вашим запитом,
таблицю слів, що часто зустрічаються.

Коли поставити хрестик у першому квадраті перед словом, то всі
документи, що його вміщують, будуть вилучені зі списку. Хрестик у
другому квадраті перенесе документи з цим словом на початок переліку.
Після кожного натиснення “мишки” до запитання буде додаватися нове слово
(із знаком мінус попереду, коли його потрібно виключити, та зі знаком
плюс, коли його потрібно додати).

Коли вибір завершено, натисніть кнопку Submit. Система представить новий
перетворений список.

Нашли опечатку? Выделите и нажмите CTRL+Enter

Похожие документы
Обсуждение

Ответить

Курсовые, Дипломы, Рефераты на заказ в кратчайшие сроки
Заказать реферат!
UkrReferat.com. Всі права захищені. 2000-2020