Скачать книгу

формат DOC. Для кодирования любого символа такого текста используется всего один байт. Пример такой кодировки представляет код ASCII (American Standart Code for Information Interchange, Американский стандартный код для обмена информацией). Для языков на основе латиницы и кириллицы такое кодирование вполне удовлетворительно.

      Рис. 3.3. Интерфейс и диалоговое окно Вставка объекта редактора MS Word 2002

      Однако, для некоторых восточных языков, например, китайского или японского, такой подход неприменим, так как разнообразие символов в этих языках многократно превышает 256 – предельного значения этого параметра в ASCII-стандарте. В последние годы все более прочные позиции приобретает стандарт Unicode или ISO 10646, т. е. стандарт Международной организации по стандартизации (International Organization for Standartization) под номером 10646. В этом стандарте каждый символ кодируется уже 2 байтами, т. е. предельное разнообразие символов достигает значения 65536. Этот стандарт часто называют стандартом многоязыковой поддержки, так как он позволяет кодировать символы государственных языков всех стран нашей планеты.

      Однако электронное издание в TXT-формате не удовлетворяет даже самым скромным эстетическим запросам, так как в нем нет возможности использования не только графики, но даже шрифтов различного начертания, заголовков и подзаголовков, примечаний и других элементов, которые в совокупности называют "разметкой текста" (markup). Из языков разметки текста помимо HTML, рассмотренного в предыдущей главе, наибольшее распространение получили:

      ✓ TROFF, разработанный для оформления документации в рамках операционной системы UNIX и различных ее версий, включая LINUX;

      ✓ TEX, который широко используется для подготовки изданий с большим количеством математических формул;

      ✓ SGML (Standart Generic Markup Language – стандартный обобщенный язык описания документов), разработанный для длительного хранения документов большого объема.

      Исходная программа форматирования электронных документов в системе UNIX называлась ROFF (от Run OFF – тиражирование). TROFF означает Typesetting ROFF, т. е. форматирование текста для принтеров с высоким разрешением и фотонаборных устройств. Хотя область распространения этого языка и поддерживающих его программ постепенно сужается, в США он продолжает использоваться для создания электронных отчетов, которые могут одинаково успешно выводиться на терминалах с низким разрешением и распечатываться с полиграфическим качеством.

      Система верстки и язык TEX был разработан хорошо известным среди программистов и математиков профессором Дональдом Кнутом для подготовки книг и пособий по математическим дисциплинам. TEX работает на различных аппаратных и программных платформах. Его можно отыскать в сети Интернет и бесплатно перенести на свой компьютер. Имеются и коммерческие версии этого продукта, в частности для платформы Macintosh фирмы Apple. Отметим, что помимо математических книг на этом языке издаются различные академические журналы, в том числе и в нашей стране.

      Язык SGML реализует принцип логической разметки текста, который позволяет разграничить содержимое издания

Скачать книгу