Сделай Сам Свою Работу на 5

Формат FictionBook. Структура и элементы формата FictionBook.





Формат FictionBook, так же известный под наименованием его самой популярной схемы FB2, - это XML формат хранения книг, где каждый элемент книги описывается своими тегами. Данный формат был разработан для использования на специальных электронных книгах. Книги FB2 очень просты для создания. Поддерживает Unicode, графику. Разработан для Windows и PocketPC. Книги в данном формате отлично поддаются каталогизации. Никаких проблем с возможностью конвертирования книг из других форматов.

Общая структура документа проста и похожа на структуру HTML. Однако главная цель этой работы состоит в том, чтобы спроектировать основанный на XML документ, который фокусируется на логической структуре документа, а не на особенностях визуального представления информации. Важная особенность структурной разметки состоит в том, что она явным образом определяет структуру и семантику материала документа. Она не определяет способы отображения документа при просмотре, печати или как-либо иначе. Вместо этого представлены некоторые специальные элементы для различных логических частей книги, таких как: стихи, цитаты и эпиграфы.

Все документы начинаются с корневого элемента FictionBook, под которым могут появляться элементы stylesheet, description, body и binary.



Stylesheet элементы сразу после корня содержат таблицы стилей, их атрибут type содержит MIME тип таблицы стилей. Если в документе используются стили, рекомендуется включать одну text/css таблицу стилей для упрощения конвертации в другие форматы.

Элементы binary также очень просты и содержат закодированные base64 данные, которые могут потребоваться для отображения документа. Они всегда должны содержать id и content-type атрибуты.

Элемент description содержит всю информацию о книге, которая разбивается на четыре главных категории: title-info, document-info, publish-info и custom-info.

Элемент title-info содержит данные о самой книге. Элемент genre определяет жанр книги. Атрибут match используется тогда, когда жанр не может быть точно определён с помощью единственного ключевого слова, например, некоторые книги могут быть одновременно детективами и научной фантастикой. Список авторов хранится в элементе author, который имеет традиционные поля first-name, middle-name, last-name, и добавляет необязательные подэлементы home-page и email. Элемент book-title - это название книги. Элемент annotation содержит описание книги в свободной форме. Поле keywords перечисляет любые подходящие ключевые слова, которые могут быть использованы поисковыми машинами. Элемент date определяет дату написания книги в любом формате, необязательный атрибут value должен содержать дату в понятном компьютеру формате, если он был использован. Элементы src-lang и lang указывают соответственно язык, на котором книга написана, и язык данного документа, если он является переводом оригинала. Элементы translator имеют точно такую же структуру, как и элементы author, описанные ранее, и используются для перечисления переводчиков книги, в случае если книга является переводной.



Информация, непосредственно о данном документе, собрана в элементе document-info, который содержит подэлементы author, program-used, date, src-url, src-ocr, version и history. Элементы author и date имеют тот же тип, что одноимённые элементы из группы title-info. Элемент history имеет тот же тип, что и annotation, и предназначен для перечисления важных изменений, внесённых в документ. Элемент version имеет свободный формат и должен увеличиваться, когда документ меняется.

Блок publish-info используется в случаях, когда документ создан на основе печатного материала и имеет несколько библиографических полей, так как: book-name, publisher, city, year и isbn.

Записи в блоке custom-info должны использоваться для хранения информации, которая не соответствует другим ранее описанным полям. Эти записи должны обязательно содержать атрибут info-type.

Следующая важная часть FictionBook документа - это body, которая содержит сам текст книги. Первый элемент body всегда главный поддокумент данной книги. Последующие элементы body могут быть использованы для хранения сносок, комментариев и другой информации, которая не укладывается в нормальный поток текста. Каждый элемент body может содержать не обязательные элементы title, epigraph и как минимум один section элемент. Есть две разновидности секций. Одна из них содержит только другие подсекции, другая содержит сами параграфы текста.



В текущей версии стандарта FictionBook не допускается смешивание подсекций и параграфов внутри одного и того же контейнера. Каждая секция может иметь несколько не обязательных полей заголовка: title, epigraph, image и annotation. После них должен быть как минимум один параграфный элемент для текстовых секций или как минимум одна подсекция для второго типа секций.

 

Формат ePub. Структура и элементы формата.

Electronic Publication (ePub) — открытый формат электронных версий книг, разработанный Международным форумом по цифровым публикациям.

Файлы в этом формате имеют расширение .epub. Формат позволяет издателям производить и распространять цифровую публикацию в одном файле, обеспечивая совместимость между программным и аппаратным обеспечением, необходимым для воспроизведения цифровых книг и других публикаций с плавающей вёрсткой.

ZIP-архив контейнера ePub содержит тексты в форматах XHTML, HTML или PDF, описание издания в XML, рядом в папках — графика, включая векторную (SVG), и встроенные шрифты, таблицы стилей и т. д.

Фактически, файлы ePub можно создавать и редактировать даже с помощью обычного Блокнота (Notepad). Создав контент в указанных выше форматах, достаточно расфасовать полученные файлы по папкам в соответствии со структурой ePub, упаковать все в zip-архив, а затем изменить расширениеконечного файла на .epub.

Разумеется, существуют и более «цивилизованные» способы создания электронных книг, например программа Adobe inDesign с возможностью сохранения файла в ePub-формате. Первоначальный вариант — Open eBook Publication Structure или «OEB» был задуман в 1999 году, релиз ePub — 2007.

Формат ePub используется, если текст является самой важной частью документа (например, при создании книги, отчёта, документа, сочинения или учебных материалов для чтения).

Стандартный файл в формате ePub обычно содержит следующие файлы и каталоги:

mimetype – сообщает операционной системе (будь то система настольного компьютера или портативной «читалки»), что находится внутри;

META-INF – каталог, содержащий, как минимум, один файл – container.xml, который содержит информацию о том, где в контейнере находится непосредственно книга;
OEBPS – папка, в которой рекомендуется размещать собственно содержимое книги. Каталог содержит:

fonts – каталог шрифтов, использованных в книге;

images – каталог иллюстраций;

content.opf – XML файл с полным списком содержимого контейнера;

toc.ncx – содержание (оглавление) книги;

xhtml файлы – собственно текст книги.

Важное примечание: названия всех файлов, входящих в структуру ePub, чувствительны к регистру. Таким образом, файл ChapterOne.xhtml, содержащий текст одной из глав книги, должен описываться в content.opf и toc.ncxименно как ChapterOne.xhtml, а не chapterone.xhtml или как-либо еще.

MIMETYPE

Этот файл содержит простой ASCII текст, а точнее одну единственную строку: "application/epub+zip"

Этот файл сообщает операционной системе, что ePub-файл является на самом деле zip-архивом. Этот файл должен быть первым в контейнере и не должен быть сжат.

META-INF

Данный каталог содержит файл container.xml, в котором указано местоположение файла Content.opf.

OEBPS

Папка, в которой, как правило, содержится непосредственно книга. Здесь можно увидеть следующие объекты:

– папка fonts – содержит файлы шрифтов, используемых в книге, в формате OTF (OpenType Font).

– папка images – здесь содержатся графические файлы, являющиеся иллюстрациями

к книге (если они есть).

– content.opf – этот файл содержит полный список всех файлов в .epub контейнере,

описывая их порядок, а также хранит метаданные, такие как название книги, автор, жанр, издатель и т.д.

– toc.ncx. Это таблица содержания (оглавления) книги. В программах и устройствах

«читалках» этот файл используется для навигации по содержимому книги.

– page-template.xpgt. Этот файл не является частью спецификации IDPF, но Adobe Digital Editions использует его для форматирования. Другие программы и устройства для чтения электронных книг могут его игнорировать.

– xHTML-файлы. Содержимое книги. Документы в формате XML 1.1, содержащие текст. Как правило, весь текст электронного издания разбивается на главы (отдельный

файл для каждой главы), но может содержаться и в одном файле с закладками для каждой

главы.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.