Для обработки текстовой информации на компьютере
используются приложения общего назначения - текстовые редакторы.
Текстовые редакторы — это программы для создания,
редактирования, форматирования, сохранения и печати документов. Современный
документ может содержать, кроме текста, и другие- объекты (таблицы, диаграммы,
рисунки и т. д.).
Простые текстовые редакторы (например, Блокнот) позволяют
редактировать текст и осуществлять простейшее форматирование шрифта.
Более совершенные текстовые редакторы, имеющие целый спектр
возможностей по созданию документов (например, поиск и замена символов,
средства проверки орфографии, вставка таблиц и др.), называют иногда текстовыми
процессорами. Примером такой программы является Word из офисного пакета
MicrosoftOffice, или Writer из пакета StarOffice.
Мощные программы обработки текста — настольные издательские
системы — предназначены для подготовки документов к публикации. Пример подобной
системы — Adobe PageMaker.
Для подготовки к публикации в Интернете web-страниц
используют специализированные приложения (например, Microsoft FrontPage или
Macromedia Dreamweaver).
Основные элементы текстового документа
Текст документа текстового редактора содержит следующие
элементы:
символ
(минимальная единица текстовой информации);
слово
(любая последовательность символов, ограниченная с обоих концов служебными
символами. Служебный символ - это пробел, точка, запятая, дефис и т.д.);
предложение
(любая последовательность символов между двумя точками);
строка
(любая последовательность символов между левой и правой границами абзаца);
абзац
(любая последовавтельность символов, замкнутая символом Возрат каретки -
<Enter>).
Редактирование и форматирование
Редактирование — преобразование, обеспечивающее
добавление, удаление, перемещение или исправление содержания документа.
Редактирование документа обычно производится путем
добавления, удаления или перемещения символов или фрагментов текста.
Объектно-ориентированный подход дает возможность реализовать механизм
встраивания и внедрения объектов (OLE — Object Linking Embedding). Этот
механизм позволяет копировать и вставлять объекты из одного приложения в
другое. Например, работая с документом в текстовом редакторе Word, в него можно
встроить изображения, анимацию, звук и даже видеофрагменты и таким образом из обычного
текстового документа получить мультимедиа-документ.
Форматирование — преобразование, изменяющее форму
представления документа.
Любой документ состоит из страниц, поэтому в начале работы
над документом необходимо задать значения параметров страницы: формат,
ориентацию, поля и др. Стандартным является формат страницы А4 (21х29,7 см).
Существуют две возможные ориентации страницы – книжная и альбомная. Для обычных
текстов чаще используется книжная ориентация, а для таблиц с большим
количеством столбцов – альбомная.
Форматирование абзацев.
Абзац с литературной точки зрения – это часть текста,
представляющая собой законченный по смыслу фрагмент произведения, окончание
которого служит естественной паузой для перехода к новой мысли.
В компьютерных документах абзацем считается любой текст,
заканчивающийся управляющим символом конца абзаца. Ввод конца абзаца
обеспечивается нажатием клавиши ВВОД (ENTER).
Форматирование абзацев позволяет подготовить правильно и
красиво оформленный документ.
В процессе форматирования абзаца задаются параметры его
выравнивания (выравнивание отражает расположение текста относительно границ
полей страницы), отступы (абзац целиком может иметь отступы слева и справа) и
интервалы (расстояние между строк абзаца), отступ красной строки и др.
Форматирование шрифта (символов).
Символы – это буквы, цифры, пробелы, знаки
пунктуации, специальные символы. Символы можно форматировать (изменять их
внешний вид). Среди основных свойств символов можно выделить следующие: шрифт,
размер, начертание и цвет.
Шрифт – это полный набор символов определенного
начертания. Каждый шрифт имеет своё название, например Times New Roman, Arial,
Comic Sans MS. Единицей измерения шрифта является пункт (1 пт = 0,367 мм). Размеры шрифтов
можно изменять в больших пределах. Кроме нормального (обычного) начертания
символов обычно применяют полужирное, курсивное, полужирное курсивное.
По способу представления в компьютере различаются шрифты
растровые и векторные. Для представления растровых шрифтов служат методы растровой
графики, символы шрифта — это группы пикселей. Растровые шрифты допускают
масштабирование только с определенными коэффициентами.
В векторных шрифтах символы описываются математическими формулами и возможно
произвольное их масштабирование. Среди векторных шрифтов наибольшее
распространение получили шрифты типа TrueType.
Можно также установить дополнительные параметры
форматирования символов: подчеркивание символов различными типами линий,
изменение вида символов (верхний и нижний индекс, зачеркнутый), изменение
расстояний между символами.
Если планируется цветная печать документа, то можно задать
различные цвета для различных групп символов.
Проверка орфографии и синтаксиса
Для проверки орфографии и синтаксиса используются
специальные программные модули, которые обычно включаются в состав текстовых
процессоров и издательских систем. Такие системы содержат словари и
грамматические правила для нескольких языков, что позволяет исправлять ошибки в
многоязычных документах.
Формат файла
Формат файла определяет способ хранения текста в файле.
Простейший формат текстового файла (ТХТ) содержит только символы (числовые коды
символов), другие же форматы (DOC, RTF) содержат дополнительные управляющие
числовые коды, которые обеспечивают форматирование текста.