Реферат на тему

Основні принципи обробки текстових документів

План

1. HYPERLINK «http://anotherlevel.profi.net.ua/lek%20html/» \l «1. Три
типи текстових файлів|outline» Три типи текстових файлів

2. HYPERLINK «http://anotherlevel.profi.net.ua/lek%20html/» \l «2.
Програми для перегляду текстових файлів різних форматів|outline»
Програми для перегляду текстових файлів різних форматів

3. HYPERLINK «http://anotherlevel.profi.net.ua/lek%20html/» \l «3.
Поняття редакторів і текстових процесорів|outline» Поняття редакторів і
текстових процесорів

4. HYPERLINK «http://anotherlevel.profi.net.ua/lek%20html/» \l «4.
Особливості редагування текстових документів|outline» Особливості
редагування текстових документів

5. HYPERLINK «http://anotherlevel.profi.net.ua/lek%20html/» \l «5.
Особливості інтерфейсу та базові можливості текстових процесорів (MS
Word, OpenWrite)|outline» Особливості інтерфейсу та базові можливості
текстових процесорів (OpenWrite)

Література 1. Три типи текстових файлів

Однією з найбільш розповсюджених функцій сучасного персонального
комп’ютера є підготовка різноманітних текстових документів. Текстові
документи зберігаються у файлах, які називаються – текстовими.

Текстові файли – найбільш наочна форма представлення алфавітно-цифрової,
інформації, що дозволяє зберігати, редагувати, читати на екрані й
друкувати будь-які текстові документи – листи, записи, довідки, об’яви,
звіти, статті, вихідні тексти програм і багато іншого.

Спосіб організації даних у файлі того чи іншого типу називається
форматом файлу. Формати текстового файлу – найпростіший з усіх відомих
способів організації даних. Уся інформація у такому файлі представлена
просто символами кодової таблиці, які без усяких перетворень можна
вводити з клавіатури, надсилати на екран чи принтер. Подібно до
будь-якого документу на аркуші паперу, текстовий файл складається з
набору рядків змінної довжини (наприклад, одна сторінка – 64 символи,
інша – 15 символів і т.п.).

Багато з текстових файлів передаються у вигляді простого тексту, який є
не досить привабливим і такими, що легко прочитуються, через те що в
ньому немає шрифтів різних накреслень, графіки, заголовків,
підзаголовків та ін. Ці додаткові особливості носять назву розмітки
тексту. Говорячи про розмітку тексту, виділяють поняття фізичної та
логічної розмітки. При використанні фізичної розмітки тексту вказується
точний вид кожного фрагменту. Наприклад, “відцентрований текст, 14-м
кеглем, жирний, гарнітура Times». При логічній розмітці тексту
вказується логічне значення даного фрагменту, наприклад “це заголовок
глави”.

При обміні інформацією між різними машинами розмітка тексту може не
зберігатися. Для зберігання розмітки документу при передачі інформації
від машини до машини застосовуються різні способи. Текстові процесори та
видавничі системи використовують спеціально розроблені формати файлів,
що містять не тільки текст, але й інформацію про те, як він повинен бути
оформлений. Основна проблема тут в несумісності таких форматів між
програмами-конкурентами (наприклад, Word та StarWriter).

Серед текстових файлів виділяють

— ASCII-файли — файли, в яких символи тексту та як вони повинні бути
розташовані на сторінці кодуються різними значеннями байта чи
послідовністю байтів. Прикладами таких файлів можуть бути файли, що
створені редакторами типу вбудованого редактора програми Midnight
Commander, файли, створювані програмою Notepad в Windows та vi в UNIX;

— файли з розширеними можливостями форматування тексту; від попередніх
відрізняються числом кодів, що використовуються як керуючі можливостями
форматування тексту. Прикладами таких файлів є файли, що створюються за
допомогою простих редакторів типу Лексикон, файли у форматі .html.

— файли, що використовують власний формат для представлення тексту (в
яких символи тексту також представлені спеціальними послідовностями). Це
файли MS Word з розширенням .doc, файли OpenWriter з розширенням .sxw,
файли Kword з розширенням .kvd та ін.

Файли, створенні різними редакторами, мають унікальні розширення, що
дозволяє, не зазираючи до документу, здогадуватися про способи розмітки
тексту. Так файли, створені редакторами підготовки простого тексту,
часто мають розширення .txt, а підготовлені у процесорі Word .doc або
.rtf). Документи, що місять команди розмітки мови HTML, мають розширення
.html або .htm.

Текстовий файл канонічного формату – це файл з розширенням .txt. Його
можна підготувати і прочитати на будь-якому ПК, з будь якою ОС.

Для перегляду деяких типів текстових файлів (не кажучи вже про їх
редагування) вимагаються спеціальні програмні засоби. Часто для
перегляду файла користувач застосовує звичний йому текстовий редактор.
Але бувають випадки, коли інформація представлена у незнайомому для
цього редактора форматі. Існують засоби для перетворення (конвертування)
текстового документу з одного формату в інший.

2. Програми для перегляду текстових файлів різних форматів

1) традиційні засоби UNIX для перегляду текстових файлів – це є команди
перегляду файлів cat, more (для виводу рядками) або less;

2) програма Acrobat Reader призначена для перегляду файлів формату
Portable Document Format (.pdf), який широко розповсюджений у
комп’ютерному світі і використовується в різних ОС і на різних
платформах;

3) програма gv (або ghostview) призначена для перегляду файлів формату
PostScript та PDF;

4) «Переглядач PS/PDF» та «Переглядач DVI» програми KDE для перегляду
PS, PDF та DVI;

5) бібліотека wv призначена для отримання доступу до файлів форматів MS
Word 2000, 97, 95 та 6 з операційних систем типу UNIX, а саме з Linux. З
її допомогою файли перетворюються у файли формату HTML, PS, PDF, LaTex,
DVI (формат видавничої системи TEX), ABW (формат текстового редактора
AbiWord), Wml (формат, що використовується у персональних органайзерах
PDA і устройствах типу Web-телефонів), ASCII-текст;

6) програми-перекодувальники кодових сторінок;

7) WordPad для перегляду файлів формату .rtf, .txt, старих документів MS
Word.

Редагування текстових файлів – одна з найбільш часто виконуваних робіт
на будь-якому комп’ютері і в будь-якій ОС.

3. Поняття редакторів і текстових процесорів

Розрізняють дві основні групи програм підготовки текстових документів:

— текстові редактори

— текстові процесори.

Текстовими редакторами, в основному, називають програми, що створюють
текстові файли без елементів форматування (тобто не дозволяють виділяти
частини тексту різними шрифтами і гарнітурами). Редактори такого роду
незамінні при створенні текстів комп’ютерних програм.

Текстові процесори вміють форматувати текст, вставляти в документ
графіку та інші об’єкти, що не відносяться до класичного поняття текст.
Різноманіття програм для обробки тексту дозволяє знайти редактор з
будь-яким набором функцій.

Деякі текстові процесори є так званими WYSIWYG-редакторами. Назва
отримана по першим буквам фрази What You See Is What You Get – те, що ти
бачиш, є те, що ти отримаєш. Коли говорять, що це WYSIWYG-редактор, то
гарантують повну відповідність зовнішнього виду документу на екрані
комп’ютера і його друкованій копії. До редакторів такого типу
відносяться Word , OpenWriter та StarWriter.

Деякі сучасні редактори підтримують концепцію “майже” WYSIWYG. Вигляд
документу на екрані при цьому трохи відрізняється від того, який вигляд
буде мати друкований документ, але це робиться для цього спеціально з
метою більш ефективного використання робочого вікна документу.
Прикладами таких редакторів є Netscape Composer та KLyX.

Можна також виділити редактори неформатованих текстів, редактори, що
створюють текст з елементами розмітки, та консольні редактори.

Редактори неформатованих текстів

NotePad – вбудований у ОС Windows, досить зрозумілий і простий у
використанні;

McEdit – має спільне з редактором Edit з MS DOS, компонента файлового
менеджера Midnight Commander ОС Linux;

KEdit — найпростіший текстовий редактор, входить у склад KDE Linux;

KWrite текстовий редактор, що має ряд додаткових налаштувань у
порівнянні з іншими простішими текстовими редакторами;

Emacs – поєднує у собі функції файлового менеджера і текстового
редактора, може створювати макрокоманди (макроси), наявний у всіх клонах
Unix, у тому числі Linux, його можна використовувати і в MS Windows.

Редактори, що створюють текст з елементами розмітки

Word служить для створення різноманітних друкованих документів, є
компонентом jфісних додатків MS Windows;

StarWriter (OpenWriter) входить у склад програми StarOffice
(OpenOffise.org), зовнішнім виглядом і функціональністю він подібний до
Word, працює і в MS Windows і в ОС Linux;

LyX (KLyX в KDE) — сучасний текстовий редактор, який може вставляти в
текст команди розмітки TeX і LaTeX;

Netscape Composer — вставляє в текст команди розмітки мови HTML, існують
версії як для ОС Linux, так і для MS Windows.

Консольні редактори призначені для редагування конфігураційних файлів у
ситуації, коли не завантажується графічний режим системи. Вибір
редакторів такого типу досить великий: vi, vim, bvi, Nvi, Elvis, Levee,
vile, Wily, joe, aee, Fred, gred, le, lpe, Zed, Emacs, CoolEdit.

4. Особливості редагування текстових документів

Основний набір операцій введення і редагування текстової інформації за
допомогою клавіатури ПК і будь-якого простого редактора називається
основним стандартом редагування.

Основний стандарт редагування передбачає такі операції:

— введення алфавітно-цифрової інформації

— переміщення по набраному тексту

— видалення і вставка символів

— видалення і вставка рядків.

Проте його недостатньо при створенні сучасних текстових документів.
Більшість текстових редакторів дозволяє працювати з блоками
(фрагментами) тексту, вести пошук та заміну фрагментів тексту, друкувати
весь файл чи його фрагменти.

Набір всіх перерахованих операцій (основний стандарт редагування,
операції з блоками, пошук чи заміна фрагментів, друк) обслуговує майже
всі потреби при роботі з простими текстовими файлами.

Проте можливості комп’ютера по створенню, редагуванню і друку не
обмежуються цими простими операціями. Сучасні програми передбачають
багатство додаткових функцій, що дозволяють набагато удосконалити набір
і модифікацію текстів, підвищити якість відображення тексту на екрані,
якість друку документів. Серед цих функцій:

1) форматування символів (використання різноманітних шрифтів і
накреслень);

2) форматування абзаців (вирівнювання по ширині сторінки і автоматичне
перенесення слів);

3) оформлення сторінок (автоматична нумерація, введення колонтитулів і
зносок);

4) оформлення документу (автоматична побудова заголовків і показників);

5) створення і обробка таблиць;

6) перевірка правопису та ін.

Крім того, сучасні програми дозволяють включати у текст графічні
об’єкти: малюнки, діаграми, фотографії.

Таким чином, від поняття “простий текст як об’єкт обробки текстового
редактора” ми переходимо до поняття “текстовий документ як об’єкт
обробки текстового процесора”. Файл, що являє собою текстовий документ,
містить, крім алфавітно-цифрових символів, загальну двійкову інформацію
про форматування тексту, а також графічні об’єкти.

Найбільш відомі на сучасному етапі редактори текстів можна умовно
розділити “за спеціалізацією” на три групи:

1) процесори загального призначення (“Лексикон”, MS Word, OpenWriter та
ін.)

2) редактори наукових документів (Chs Writer, TEX)

3) редактори вихідних текстів програм (Multi-Edit і вбудовані редактори
систем програмування BASIC, Pascal, C і т.д.).

Звісно, за допомогою “Лексикону” можна підготувати і текст програми, а
за допомогою Multi-Edit – документ загального призначення.
“Спеціалізація” редактора у тому, що в ньому додані (або оптимізовані)
функції, які необхідні для обслуговування документів певного типу.

Крім того, особливе місце у групі пакетів, що дозволяють працювати з
документами, займають так звані видавничі системи – PageMaker, Corel
Ventura, QuarkXPress). Проте для набору тексту для тих же видавничих
систем краще використовувати текстові процесори.

5. Особливості інтерфейсу та базові можливості текстових процесорів (MS
Word, OpenWrite)

Отже, текстовий процесор – прикладне програмне забезпечення, що
використовується для створення текстових документів.

Типова структура інтерфейсу текстового процесора включає ряд елементів.

Координатна лінійка

РОБОЧЕ ПОЛЕ

Рис. Вид типового інтерфейсу текстового процесора

Рядок меню містить імена груп команд, що об’єднані за функціональною
ознакою. Вибір режиму з рядка меню відкриває відповідне підменю, а вибір
певної опції у ньому забезпечує доступ до меню більш низького рівня.
Така система вкладених меню складає основу інтерфейсу текстового
процесора. Команди меню обираються, за допомогою миші, клавіш керування
курсором або комбінацією клавіш.

Рядок стану (статусу) містить ім’я документу, що редагується, і визначає
положення курсору у цьому документі. У рядку вводиться довідкова
інформація.

Рядок підказки містить інформацію про можливі дії користувача у поточний
момент.

Робоче поле – це простір на екрані дисплею для створення документу і
роботи з ним. Максимальний розмір робочого поля визначається
стандартними параметрами монітору і складає 25 рядків по 80 знаків
кожна.

Координатна лінійка визначає межі документу і позиції табуляції.
Розрізняють вертикальну і горизонтальну лінійки. За замовчуванням
координатна лінійка градуйована у сантиметрах. Нульова точка
координатної лінійки вирівняна по першому абзацу тексту.

Лінійка прокрутки служить для переміщення тексту документу у робочому
полі вікна. Лінійка, що забезпечує вертикальне переміщення тексту,
називається вертикальною лінійкою прокрутки, а горизонтальне переміщення
– горизонтальною лінійкою прокрутки.

Курсор – коротка, як правило, миготлива лінія, показує позицію робочого
поля, у яку буде розміщено видимий символ або елемент тексту. Керування
інтерфейсом здійснюється за допомогою клавіатури і миші.

Індикатори – знаки або символи, що відображають відповідні режими роботи
програми або комп’ютера. Індикатори у рядку стану – це символи або
службові (ключові) слова, що відображають режими роботи програми.
Індикатори на клавіатурі відображають режим роботи перемикачів і
клавіатури, їх три: NumLock, CapsLock, ScrollLock.

Перемикач – елемент екранного інтерфейсу або команда, що
використовується для вмикання або вимикання того чи іншого режиму.
Індикатор може бути і перемикачем, якщо на ньому натиснути мишею.

Найпоширенішими представниками текстових процесорів є Miсrosoft Word та
OpenOffice.org Writer.

Текстовий процесор OpenOffice.org Writer 1.1.4. призначений для
перегляду, створення нових і редагування існуючих текстових документів,
входить у дистрибутивний офісний пакет OpenOffice.org 1.1.4.. Він
містить стандартний набір інструментів, за допомогою яких можна
створювати високоякісні документи, що можуть включати зображення,
таблиці. Підтримується: перевірка орфографії та розміщення переносів для
багатьох мов, зокрема, української, російської, англійської, німецької
та інших; імпорт і експорт у текстові формати MS Word 2000/XP, HTML
тощо.

Робота з базовими функціями Writer — введення тексту, переміщення по
тексту, виділення блоку, його вирізання, копіювання і вставка –
практично аналогічна роботі в будь-якому з відомих текстових процесорів
з графічним інтерфейсом (наприклад, для Windows чи Macintosh). У
OpenOffice Writer передбачено два режими перегляду і редагування тексту
на екрані – розмітка сторінки і розмітка online. Writer як і Word
дозволяє встановити масштаб перегляду тексту у відсотках, перевіряти
орфографію як під час набору тексту (підкреслює слово з помилками), так
і при виклику функції перевірки.

Цікавою в OpenOffice Writer є функція автозавершення слів. Якщо ви
набираєте кілька перших літер слова, яке вже набиралось, Writer
автоматично підставляє це слово. Якщо пропонований варіант не підходить,
просто продовжуйте набирати. OpenOffice Writer дозволяє встановлювати
повністю незалежне форматування для різних сторінок – навіть до різного
розміру аркуша. Для цього використовуються стилі сторінок.

Панелі інструментів OpenOffice Writer

Панель функцій розташована у верхній частині робочого вікна. На ній
розташовані значки функцій, що використовуються у всіх додатках
OpenOffice.org

Головна панель інструментів – для вставки різних об’єктів у документ і
вибрати основні функції

Контекстна панель графічних об’єктів (для web-сторінок) – коли
відкривається web-сторінка, на головній панелі інструментів змінюється
набір значків. Панель дає можливість вставляти різні об’єкти в документ
і забезпечувати доступ до більш загальних функцій.

Панель текстових об’єктів – пропонує кілька можливостей форматування
тексту без використання Стилів

Панель графічних об’єктів – містить функції для форматування і
розміщення вибраних малюнків, вона може бути налагоджена відповідно до
потреб конкретного користувача

Панель рамочних об’єктів – з’являється, коли вибрані рамки. Дозволяє
форматувати і розміщувати рамки

Контекстна панель – містить функції для форматування і розміщення
вибраних об’єктів і з’являється тільки тоді, якщо у текст вставлено
якийсь об’єкт

Контекстна панель таблиць – з’являється, якщо в документ вставлена
таблиця, містить функції, необхідні при роботі з таблицями, наприклад,
вставка і видалення рядків і стовпців чи зміни стилю ліній

Контекстна панель креслення – з’являється при кресленні, містить функції
для внесення змін в креслення

Контекстна панель структурних рівні – для зміни пронумерованих абзаців

Панель текстових об’єктів у кресленні

Панель об’єктів при створенні форм – перелічені значки панелі форм

Панель поточного стану – надає інформацію про поточний документ і
містить кілька полів з інформацією

Рядок стану у документах OpenOffice.org Basic – виводиться інформація
про поточний активний документ OpenOffice.org Basic

Панель гіперпосилання – для введення запиту і запуску пошуку в одній з
пошукових машин Інтернету і зміни гіперпосилань у документі

Попередній перегляд – з’являється, коли поточний документ переглядається
у режимі попереднього перегляду

Панель інструментів бази даних – розташована у верхній частині
Навігатора джерел даних

Панель інструментів запиту SQL – при створенні або зміні запиту SQL
використовуються значки на цій панелі

Лінійка – показує розміри сторінок, вказує розміщення табуляції,
відступів, границь тексту і рядків

Панель формул – допомагає робити обчислення, для активізації слід
натиснути F2

Панель об’єктів Безьє – з’являється при виборі будь-якого об’єкта Безьє
і кліку по кнопці “Правка точок”

Список використаної літератури:

Бойс. Дж., Фаллер С., Гилген Р. и др. Использование Microsoft Office97,
профессиональный выпуск: Пер. англ.-К.;М.: СПб.: Издат. Дом «Вильямс»,
1998, 1472 с.

Бородич Ю.С. и др. Паскаль для персональных компьютеров: Справ.
Пособие.-Мн.:высш. шк.: БФ ГИТМП «Ника», 1991.-365 с.

Гарнаев А. Использование Microsoft Excel в экономике и финансах. —
СПб.:БХВ, 2000.-336 с.

Информатика для юристов и экономистов/ Симонович С.В. и др. — СПб:
Питер, 2001. -688 с.

Жалдак М.І, Ю.С.Рамський. Інформатика. Київ, «Вища школа», 1991.

Куперштейн. В. Современные информационные технологии в производстве и
управлении.-СПб.:БХВ, 2000.-304 с.

Новиков Ф., А.Яценко. Microsoft Office в целом. — СПб.:БХВ, 2000.-728с.

Фигурнов В.Э. IBM PC для пользователя. Краткий курс. Изд. 7-е. М.:
ИНФРА-М, 1997, 432 с.

Шафран Ю. Информатика. Информационные технологии: в 2 ч. М.: Лаборатория
Базовых Знаний, 2001.

Похожие записи