.

Програми розпізнавання мови. Створення списку ілюстрацій (контрольна)

Язык: украинский
Формат: контрольна
Тип документа: Word Doc
0 2152
Скачать документ

Контрольна робота з інформатики

1.Програми розпізнавання мови. 2.Створення списку ілюстрацій

1. Програми розпізнавання мови

Подальше поширення і поглиблення використання різних інформаційних
систем приводить до необхідності надання користувачу максимальних
зручностей при роботі з ЕОМ у режимі діалогу. Тенденція удосконалювання
комунікаційного інтерфейсу веде до спрощення діалогу користувача з ЕОМ.
В останні роки розробці зручного інтерфейсу приділяється пильна увага з
боку ведучих виробників програмних продуктів. Звичним стандартом стали
многооконные системи, оснащені візуальними засобами керування відповідно
до принципів GUI (Graphical Users Interface). Керування інформаційними
системами більше не вимагає пошуку потрібної клавіші на клавіатурі. Усе
здійснюється наочно, і користувач бачить результати своїх дій на
моніторі комп’ютера, у будь-який момент він може звернутися до системи
допомоги, що стала невід’ємним компонентом будь-якої інформаційної
структури.

Огляд програм розпізнавання мови:

Були випробувані чотири лідируючих продукти – Dragon NaturallySpeaking
Preferred, IBM ViaVoice 98 Executive Edition, Lernout & Hauspie Voice
Xpress Professional і Philips FreeSpeech 98.

Усі пакети були установлени на комп’ютері Pentium II-266 з оперативною
пам’яттю 128 Мбайт і звуковою платою Sound Blaster. З кожним пакетом
було проведено експерименти по диктуванню тексту в основному екрані
(звичайном варіанті Windows WordPad), а також у середовищі текстового
процесора, електронної таблиці і поштової програми. Серед тестових
документів був діловий лист, що містив багато виділень жирним шрифтом,
центрованих абзаців і незвичайних слів, а також URL і таблицю, були
прості електронні листи і вірші.

У цілому допустившей найменше число помилок і одночасно найпростіший у
використанні виявилася програма Dragon NaturallySpeaking Preferred, хоча
і з нею було достатнє незручно працювати в електронних таблицях і
керувати переміщеннями по екрану. Однак у кожного з розглянутих пакетів
є і сильні, і слабкі сторони. От як вони співвідносяться по основних
параметрах.

Первинне навчання. В описах усіх пакетів затверджується, що їх досить
установити, зачитати вголос кілька пропозицій – і можна приступати до
диктування добре поставленим голосом. Допускаю, що це так, але
результати будуть набагато краще, якщо витратити від 10 до 50 хв на
навчання програми особливостям свого голосу. Відповідна процедура
складається в зачитанні серії тестових фрагментів; вона стомлююча, але
виконується всього один раз. У цілому найменш обтяжним виявилося
навчання Dragon.

Спочатку треба виконатинавчання по тестах. Далі потрібно дати системам
розпізнавання слова, що отсутствовали в їхньому убудованому словнику
(обсягом від 30 до 64 тис. слів). Створювати додатковий словник треба у
всіх розглянутих пакетах, але Dragon NaturallySpeaking краще усіх
розпізнавав, як пишеться нове чи незвичайне слово. У загальному і
цілому, чим більше ви навчаєте програму і працюєте з нею, тим точніше
вона вас розуміє.

Диктування. Усі чотири пакети розраховані в першу чергу на те, щоб
забезпечити введення в документ ніяк не оформленого потоку тексту. З
цією задачею краще усіх справляється Dragon. Він єдиний з усіх досяг
заявленої безпомилковості розпізнавання – 95%. Але безпомилковість 95%
означає, що кожне двадцяте слово інтерпретується неправильно, а
виправлення вимагає часу. У IBM ViaVoice 98, Philips FreeSpeech 98 і L&H
Voice Xpress Pro точність розпізнавання була близько 90%.

Підтримка інших програм. Усі чотири пакети забезпечують диктування
безпосередньо у вікні будь-якої програми, що працює з текстами, зокрема
Microsoft Word, Excel і таких популярних поштових клієнтів, як Outlook
Express і Netscape Messenger. Правда, на комп’ютерах щодо старих моделей
обробка вимовлених слів може відбуватися з затримкою.

Команди і керування. Мона не тільки диктувати програмам, але і давати їм
інструкції – відкрити той чи інший файл, надрукувати ту чи іншу
сторінку, – а крім того, керувати переміщеннями по Робочому столі.
Відповідні функції працювали у всіх чотирьох програмах, але не завжди.
Деякі команди, наприклад click File (клацнути по пункту File) чи click
Save (клацнути по пункту Save) у Word, приходиться повторювати по
декілька разів, перш ніж комп’ютер погоджується виконати команду, –
особливо при роботі з Philips FreeSpeech 98. Керування Робочим столом
найкраще виходило в IBM ViaVoice 98.

Звукова апаратура. Усі програми припускають використання визначених
звукових плат – включаючи, утім, такі популярні марки, як Sound Blaster.
До трьох з чотирьох пакетів (виключенням є Philips) додається
стандартний мікрофон з навушниками. Але щоб домогтися кращих
результатів, видимо, має сенс купити більш високоякісний мікрофон із
шумозаглушенням.

Dragon NaturallySpeaking Preferred.

Достоїнства: найвища безпомилковість розпізнавання, простота
використання.

Недоліки: незручне введення чисел, посереднє керування екраном.

Єдина програма, що наблизилася до того, щоб виконати рекламні обіцянки,
– 160-доларова Dragon NaturallySpeaking Preferred – добре вводить текст
і дозволяє легко переключатися між диктуванням, виправленням і
форматуванням.

Пакет компанії Dragon набагато перевершив інші в розпізнаванні тексту
ділового листа, дивно точно записавши такі складні імена власні, як
О’кееffе, Bernardo і Peterborough. У цілому він дуже близько підійшов до
досягнення заявленої безпомилковості розпізнавання – 95%.

Коли Dragon усе-таки припускається помилки, ви можете ввійти в режим
виправлення, просто сказавши “delete that” (видалити) чи “scratch that”
(викреслити), а потім повторити чи слово словосполучення правильне.
Форматувати текст також дуже просто: ви виділяєте текст і вимовляєте
слова типу “set font Arial 24” (установити шрифт Arial кегля 24),
“center that” (центрувати) чи “bold that” (виділити жирним шрифтом). Але
от набір команд переміщення і виправлення в Dragon, як і в інших трьох
пакетах, складний. Результат диктування було набагато швидше і простіше
поправити за допомогою миші і клавіатури.

З Dragon можна працювати двома способами: по-перше, пакет дозволяє
диктувати у своєму текстовому вікні (отриманий документ потім
вставляється в потрібну програму), по-друге, він містить убудовані
утиліти, що забезпечують уведення безпосередньо у вікні текстового
процесора, поштової програми, електронної таблиці. Що простіше, залежить
від ваших особистих переваг і від використовуваної вами програми. Зовсім
не важко перенести надиктований текст у вікно поштової програми, а в
електронній таблиці зручніше диктувати числа прямо в кумірки.

Модуль NaturalWord для диктування у вікні Microsoft Word 97 (з більш
ранніми версіями він не працює) дуже схожий на основний екран мовного
введення Dragon. Він надає також доступ до команд меню Word, але
доводиться зробити кілька спроб, перш ніж Word виконав команду, та й
після цього швидше було діяти за допомогою клавіатури і миші. Компанія
попереджає, що на комп’ютерах з відносно повільним процесором
розпізнавання може відбуватися з паузами, але на Pentium II-266 цього
жодного разу не случилося.

Утиліта NaturalText забезпечує диктування в середовищі практично
будь-якої програми для Windows 95/98. Після її установки в системному
лотку на Панелі задач з’являються значки тексту і мікрофона. Щоб почати
працювати з NaturalText, досить клацнути по значку мікрофона – і можна
говорити.

IBM ViaVoice 98 Executive Edition.

Достоїнства: гарне розпізнавання простих слів, удосконалені переміщення
по екрану і дизайн.

Недоліки: низька якість розпізнавання імен власних і скорочених слів,
повільна робота в середовищі деяких програм.

Пакет добре справляється з чисто текстовими секціями тестового листа,
але спіткнувся на деяких іменах власних і скороченнях. Наприклад,
прізвище Bernardo він записав як Bernad O, назва містечка Westwood – як
West would it, а Peterborough – як Peter burrow. Це істотно знизило
підсумковий відсоток помилок розпізнавання. По моїх враженнях, чим більш
великий контекст забезпечувався для слова, тим з більшою імовірністю
ViaVoice його правильно розпізнавав.

Як і Dragon, корпорація IBM забезпечує просте переключення між режимами
диктування, виправлення, диктування по буквах і введення команд. Досить
сказати, що ви збираєтеся зараз робити, і пакет, як правило, зрозуміє
вас вірно. Епізодично в процесі тестування приходилося зіштовхуватися з
незначними проблемами при спробі змусити ViaVoice 98 сприйняти команду
переміщення, таку як move up four lines – піднятися на чотири рядки.
Найкраще це вдається, якщо давати команди уривчасто і монотонно; при
цьому часом виникає неприємне відчуття, що не Ви навчаєте програму, а
вона Вас.

Можна використовувати ViaVoice безпосередньо усередині таких програм, як
Word, Excel і Internet Explorer Mail. Диктування в Word відбувається
майже без затримок, але в інших програмах приходиться мало-мало
почекати, поки продиктований текст буде оброблений. Зате в ViaVoice 98
більш природна робота з числами, чим у Dragon: щоб записати в осередок
Excel суму 23 432 дол., потрібно сказати “twenty-three thousand four
hundred thirty-two dollars” (двадцять три тисячі чотириста тридцять два
долари).

Ще одне достоїнство ViaVoice 98 – чудово організоване керування Робочим
столом Windows. Щоб запустити Excel, досить сказати “open Excel”, щоб
розгорнути пункт меню, досить його назвати. Можна вибирати кнопки,
вимовляючи написані на них слова (такі, як OK чи Cancel). На випадок,
якщо програма не буде розпізнавати команди, у ній передбачене навчання,
до цієї тактики рідко приходиться прибігати.

L&H Voice Xpress Professional.

Достоїнства: просте і швидке виправлення неправильне сприйнятих слів,
чудове розпізнавання чисел.

Недоліки: причепливість до вимови команд, нерівномірна якість
розпізнавання.

На перший погляд Voice Xpress Professional компанії Lernout & Hauspie
дуже схожий на NaturallySpeaking Preferred. Але, хоча в цього
150-доларового пакета і є визначені переваги – гарне розпізнавання
чисел, тісна інтеграція з компонентами Office 97, – він уступає програмі
Dragon як розпізнавання слів і команд.

Процедура навчання в Voice Xpress Pro – сама довга з усіх. Займає вона
понад 50 хв, за які треба прочитати 230 екранів з текстом – списки
команд, вправи в диктуванні по буквах і уривки з книги про Антарктику з
такими труднопроізносимими пасажами, як vulpine Russian glaciologist
(хитрий росіянин гляціолог).

З розпізнаванням ділового листа програма в основному справилася, але час
від часу з її роботою щось случалося. Westwood Park перетворився в west
with a park, June twenty-second – у June twenty seconds, quarter – у
water. Реальною проблемою були також артиклі і короткі службові слова
(такі як a, the, that). Дефекти розпізнавання, можливо, зв’язані з
невеликим обсягом основного словника – 30 тис. слів, що приблизно вдвічі
менше, ніж в інших пакетах.

З розпізнаванням деяких команд переміщення і керування, наприклад go to
the end of the document (перейти в кінець документа), у Voice Xpress Pro
також виникли складності. Удається зменшити число помилок, почавши
говорити повільно і неприродно чітко. Ще кращий результат дало злиття
слів – потрібно було вимовити щось начебто “downtwoparagraphs” (на два
абзаца вниз), зробивши паузу перед командою і після її.

Що стосується позитивних сторін Voice Xpress Pro, те цей пакет володіє
кращої з усіх розглянутих системою виправлення помилок. Ви говорите
“correct that” (виправити), і на екрані з’являється список варіантів.
Якщо придатний варіант є в списку, потрібно вимовити “take” (прийняти) і
номер правильного слова, після чого воно вставляється в документ. Інше
достоїнство пакета – гарна інтеграція з компонентами Microsoft Office
97: робота з ними відбувається без яких би то ні було затримок. Крім
того, Voice Xpress Pro блискуче вводить числа: диктувати їх у Excel
можна зовсім природно. І усе-таки він істотно уступає Dragon по якості
розпізнавання і IBM Via Voice по простоті керування.

Philips FreeSpeech 98.

Достоїнства: наявність безкоштовної спробної версії, дешевина.

Недоліки: посередня якість розпізнавання при диктуванні, деякі команди
не розпізнаються, відсутність мікрофона.

З чотирьох розглянутих нами програм Philips FreeSpeech 98 має сама точна
назва: його можна протестувати зовсім безкоштовно (одне зі значень
англійського free – “безкоштовний”. – Прим. перши.), просто одержавши із
сервера HYPERLINK “http://www.freespeech98.com/” www.freespeech98.
com настановний файл обсягом у 30 Мбайт. Користування пакетом після
іспитового періоду, що триває сім днів, коштує 39 дол.

Незважаючи на дуже низьку ціну, пакет FreeSpeech 98 функціонально
повний. Він підтримує і стандартне вікно диктування типу WordPad, і
можливість диктувати в будь-якій програмі для Windows, де є введення
тексту, і керування переміщеннями по меню і вікнам на Робочому столі. На
відміну від інших пакетів, FreeSpeech вимагає ручного переключення між
диктуванням, керуванням, диктуванням по буквах і режимом “сну”.
Передбачається, що відповідні команди можна подавати голосом, але вони
спрацьовували так рідко, що краще віддати перевагу миші.

Стартова якість розпізнавання FreeSpeech 98 робило не занадто сприятливе
враження. У тестовому діловому листі він прекрасно розпізнавав базову
лексику, але будь-яке незвичайне слово вибивало його з колії. Прізвище
О’кееffе була записана як both keys, а Bernardo – як burn our goal.
Числа, як і в Dragon NaturallySpeaking, орієнтуються тільки якщо
диктувати їх по одній цифрі.

Команди переміщення і форматування FreeSpeech 98 дуже схожі на наявні в
інших пакетах (у дійсності ряд команд просто збігається). Але FreeSpeech
часто з разючою упертістю ігнорував мої указівки виділити чи текст
перемістити курсор.

2. СТВОРЕННЯ СПИСКУ ІЛЮСТРАЦІЙ

Вважається, що саме можливість використовувати графіку зумовила
перетворення World Wide Web з чисто технічного і наукового інструмента в
найважливішу складову сучасної поп-культури. У наш час ми часто можемо
спостерігати, що повна відсутність зображень на Web-сайті може просто
відштовхнути відвідувачів (проте, зайва перевантаженість зображеннями
позначається на швидкості завантаження і приводить до схожих
результатів).

Суворо кажучи, HTML не призначений для зберігання зображень. Замість
цього в код HTML вміщуються посилання на файли зображень і, можливо,
деякі команди форматування для них. При завантаженні файла в форматі
HTML браузер прочитує посилання на графічні файли, запитує їх з
Web-сервера і відображає відповідно до їх місцезнаходження, визначеного
в коді HTML. Проте на практиці зображення і текст на Web-сторінці тісно
пов’язані між собою і звичайно спеціально розробляються дизайнерами так,
щоб доповнювати одне одного.

У Microsoft FrontPage передбачені не тільки засоби, які дозволяють
отримати доступ до будь-яких методів розміщення графічних файлів на
Web-сторінці, але й засоби інтегрованого перегляду зображень, а також (в
дещо обмеженому варіанті) засоби редагування зображень.

Формати графічних файлів

Більшість браузерів можуть відображати графічні файли тільки двох
форматів: Graphic Interchange Format (GIF) і Joint Photographic Expert
Group (JPEG). Деякі браузери також підтримують формат Portable Network
Graphics (PNG) – новий формат, в якому передбачено безліч функцій.
Інформація про відмінності різних форматів наведена в табл. 4.

Стиснення: із втратами або без втрат. У растрових файлах повинна
зберігатися інформація про кожний піксель зображення. Однак, якщо просто
записувати інформацію про кожний піксель, файл може виявитися дуже
великим. Тому в більшості форматів графічних файлів передбачені засоби
стиснення: спеціальні математичні алгоритми, які дозволяють записувати
інформацію про зображення за допомогою меншої кількості байт. Звичайно
стиснення проводиться за рахунок областей зображення, що повторюються.

У файлах GIF використовується такий алгоритм компресії, при якому ніяка
інформація про зображення не втрачається. Таким чином, стиснення
проводиться без втрат (lossless). Інший механізм компресії передбачений
в форматі JPEG. З одного боку, він забезпечує різні міри стиснення за
бажанням автора, з іншого – в багатьох випадках після стиснення JPEG
повернутися до початкового файла стає неможливим. В залежності від
настройок зображення може втратити частину інформації про колірну
палітру, контури і контраст. Такий підхід називається компресією із
втратами (lossy). Чим більша кількість втрат є допустимою, тим меншим є
підсумковий розмір графічного файла.

Прозорість. Всі формати графічних файлів передбачають використання
прямокутних зображень. При цьому висота і ширина зображення в пікселях
може бути будь-якою, але за допомогою звичайних засобів зробити
зображення круглим, овальним або довільної форми не можливо.

Один з можливих спосібів уникнути використання виключно прямокутних
зображень – використати по краях зображення той же колір, який
передбачений в браузері як фон. Однак простий підбір відповідного
кольору в деяких випадках може не спрацювати (наприклад, коли на
сторінці використовуються фонові зображення або коли браузер настроєний
на використання власної палітри кольорів).

Тому найкращий вихід – привласнити одному з кольорів зображення
властивість прозорості. У цьому випадку браузер замість цього кольору
буде відображати те, що повинно знаходитися під ним (як правило, фон).

Ще більш сильний засіб – використати так званий альфа-канал (alpha
channel), який дозволяє задавати до 256 степенів прозорості.

Анімація. Формат GIF дозволяє зберігати в одному і тому ж файлі декілька
зображень і настроювати час показу кожного з них. Це – найпростіший
засіб використання анімації без установки додаткового програмного
забезпечення в браузерах відвідувачів Web-сайту.

Гамма. У різних системах передбачені різні співвідношення між
яскравістю, яка визначена в графічному файлі, і тим, як ця яскравість
буде відтворюватися на апаратному рівні (крім того, ця залежність є
нелінійною). Для розв’язання цієї проблеми у файлах PNG передбачена
можливість запам’ятовування гамми на одному комп’ютері для відтворення
її з максимальною точністю на інших комп’ютерах.

Більшість Web-дизайнерів для тексту, зображень, створених за допомогою
ліній і значків, використовують формат GIF через стиснення без втрат в
якості і можливості використання прозорості. JPEG застосовується для
фонових зображень, фотографій і у всіх інших випадках, де більш сильне
стиснення і краще перенесення кольорів важливіше, ніж точність контурів.

Новітній формат графічних файлів PNG (Portable Network Graphics)
забезпечує повну підтримку 32-бітного кольору з використанням
альфи-каналу, множинні методи компресії, збереження інформації про гамму
і додаткові можливості, які дозволяють згладити відмінності між різними
платформами. На жаль, формат PNG підтримується не всіма браузерами. Крім
того, звичайно файли у форматі PNG є більшими, ніж зображення GIF і
JPEG.

Пам’ятайте, що насправді файли HTML не можуть містити в собі графіку.
Замість графічних зображень в них зберігаються посилання на графічні
файли, які завантажуються браузером окремо.

Додаткові можливості при роботі із зображеннями

Частина розділу, що залишилася, буде присвячена деяким додатковим
можливостям, які можна використати при роботі з графічними файлами.
Більшість з них знадобляться вам при роботі із зображеннями з
використанням спеціалізованих програм.

Нашли опечатку? Выделите и нажмите CTRL+Enter

Похожие документы
Обсуждение

Ответить

Курсовые, Дипломы, Рефераты на заказ в кратчайшие сроки
Заказать реферат!
UkrReferat.com. Всі права захищені. 2000-2020