Сделай Сам Свою Работу на 5

Формат PDF. Описание, преимущества, недостатки. Обобщённая структура формата. Структура файла. Структура документа. Три типа структурированных документов.





PDF (аббревиатура от англ. Portable Document Format) — разработанный фирмой Adobe Systems с использованием ряда возможностей языка PostScript, как независимый от платформы формат представления в электронном виде полиграфической продукции, различной электронной документации (в том числе электронные книги) и презентаций.

PostScript – язык программирования для работы с принтерами. Технология PostScript позволяет упростить и автоматизировать процесс печати. Во время вывода на экран документа, содержащего изображение, программа макетирования страниц преобразовывает пиксели в коды PostScript, которые понятны принтеру. Во время вывода пиксели заменяются на последовательности полутоновых точек (half-tone-dots), которые и воспроизводятся при печати. Эти точки круглые, занимают несколько пикселей. В отличие от пикселей, эти точки не имеют специального цвета и не покрывают всего изображения. Бывают разного размера, благодаря чему при их просмотре невооруженном глазом создается впечатление, что присутствуют разные оттенки. Размер точки зависит от цветов тех пикселей, которые она заменила. Программы управления векторной графикой создают истинный код PostScript уровня 2 и 3, который впоследствии отправляется в печатающее устройство. PostScript – язык программирования, имеющий набор управляющих конструкций. Программа на языке PostScriptинтерпретируются, а не компилируются. Все данные, используемые операторами языка, хранятся в стеках. Программа на языке PostScript – это последовательность операторов, заданных в постфиксной нотации или обратной польской записи: операнды записываются перед оператором. Читая файл программы, интерпретатор записывает в стек операнды, затем выполняет оператор, снимая операнды со стека.



Преимущества:

- Кроссплатформенность (означает, что вы можете увидеть документ точно таким же, каким он был создан, вне зависимости от того, на какой платформе он создавался);

- Машино-независимость (может быть напечатан как на принтере, так и на полиграфической машине)

- Компактность, т.к. PDF поддерживает большое количество алгоритмов компрессии данных.

- Мультимедийность (поддерживает элементы, такие как видео- и/или звуковые ролики, так же как и гипертекстовые элементы и превью страниц)



- PDF поддерживает безопасность. Создатель PDF-файла может задать несколько опций безопасности. Возможно заблокировать файл так, что он может быть открыт только после ввода пароля. Также возможно запретить изменение файла и/или его печать.

Недостатки:

- PDF — патентованный формат компании Adobe, соответственно имеет закрытую структуру.

- PDF пытается стать всеохватывающим стандартом, что не позволяет ему быть настолько эффективным, как специализированные решения. Вы можете использовать PDF в Интернете, но HTML-файлы более эффективны. Можно использовать PDF для обмена графикой, но большинство препресс-приложений используют форматы EPS и TIFF.

- PDF-файлы сложно редактировать. Небольшие изменения могут быть внесены, но очень сложно, если не невозможно, добавлять блоки текста или изображения в существующий PDF-файл.

Структура формата:

- Объекты (несколько типов: логические; числовые; последовательность символов; таблицы, состоящие из 2 элементов, включающих значения; объекты типа stream)

- Структура файла

- Структура документа

- Страничное описание

Структура файла:

Заголовок (Первая строка PDF-файла, определяет номер спецификации PDF, которой придерживается данный файл, грубо говоря, версию файла)

Тело (Содержит последовательность косвенных объектов, входящих в состав публикации. Объекты - это компоненты публикации: страницы, изображения, шрифты. Комментарии могут быть во всем PDF-файле. Их синтаксис совпадает с синтаксисом комментариев в PostScript, они начинаются с % и заканчиваются символом конца строки)



Таблица перекрестных ссылок (Таблица содержит информацию о каждом объекте в файле в виде одной строки описания места объекта в файле. PDF-файл содержит таблицу, состоящую из одного или более разделов. Если нет изменений или добавлений в файл, таблица состоит из одного раздела. В противном случае в ее состав добавляется новый раздел.)

Трейлер (позволяет программному приложению при чтении PDF-файла быстро находить таблицу перекрестных ссылок и специальные объекты. Приложения должны читать PDF-файл с конца)

Структура документа – иерархия объектов, содержащихся в теле PDF-файла.

Каталог – главный объект, содержащий ссылки на дерево страниц в документе, ссылку на дерево объектов, представляющих схему документа, ссылки на статьи и места их назначения. Каталог может показывать также, где хранятся публикации.

Дерево страниц - доступ к страницам документа открывается через дерево узлов, названное деревом страниц. Это дерево определяет порядок страниц в документе. Структура дерева позволяет приложению быстро открыть документ, содержащий тысячи страниц, используя ограниченный объем памяти. Структура дерева страниц документа не связана с содержимым документа.

Дерево закладок – описывает содержание и последовательность закладок на странице.

Дерево статей – может включать несколько статей, которые могу содержать несколько фрагментов.

Место назначение - комментарии и закладки могут определять место назначения, которое состоит из страницы, места на странице и масштаба показа страницы.

3 типа структурирования PDF-файлов:

1) Неструктурированные файлы – они не обладают древовидной логической структурой, все содержимое интерпретируется, как единый блок, не имеющий никакой иерархии или внутренней связи. При конвертации таких файлов сохраняется только текст и исходные абзацы, все остальное форматирование исчезает.

2) Структурированные файлы – обладают древовидной структурой, позволяют сохранять содержимое в естественном порядке. В отличие от неструктурированных, эти файлы сохраняют и внутреннее форматирование (включая, например, атрибуты шрифта), но не сохраняют таблицы, списки и т.д.

3) Размеченные файлы – характеризуются логической структурой, набором четких связей между различными элементами, содержат дополнительную информацию, позволяющую выполнять форматирование.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.