Сервис Google Books переходит на использование открытого стандарта ePub

Аватар пользователя Ян Злобин

Компания Google объявила о начале распространения через свое книгохранилище более миллиона общедоступных книг в открытом формате ePub, при этом возможность загрузки книг в текстовом виде и в PDF будет сохранена в полном объеме. Главной причиной внедрения ePub называется желание повысить удобство чтения книг на портативных устройствах, чтение PDF на которых вызывает затруднение, в то время как ePub дает возможность изменить форматирование текста в зависимости от размера экрана.

Источник

Комментарии

а внутри епуба лежит таки старый добрый html. со всеми его прелестями и кривостями. напоминает подарочную прищепку на садьбе, завёрнутую в десять упаковок.
одно только чтение спецификаци этого счастья способно расшатать психику. всё сложнее, сложнее, сложнее...

"сложность программы растет до тех пор, пока не превысит способности программиста" (L)законы Мерфи.

скоро не останется в мире простых вещей, которые можно понять с первого подхода.
нет в мире круче монстра, чем пдф, и епуб достойный сын его.

Аватар пользователя Ян Злобин

СерыйМыш написал:
а внутри епуба лежит таки старый добрый html.

Не обязательно. Там может быть и PDF.

Ян Злобин написал:
СерыйМыш написал:
а внутри епуба лежит таки старый добрый html.

Не обязательно. Там может быть и PDF.


Судя по фразе о "проблемах с PDF", там будет именно текстовый вариант документа, т.е. в HTML.

СерыйМыш написал:
а внутри епуба лежит таки старый добрый html. со всеми его прелестями и кривостями. напоминает подарочную прищепку на садьбе, завёрнутую в десять упаковок. одно только чтение спецификаци этого счастья способно расшатать психику. всё сложнее, сложнее, сложнее...

*Мило улыбается* Неспособно, ну или не у всех. Я вот ламер, например, и читать список спецификаций если и буду, то всё равно ничего в нём не пойму. Как говаривал т-щ Коhелет - "Умножающий знания, умножает и печаль";))

А как по мне, так хтмл плох извратами веб-дизайнеров, усложняющих оформление страниц. Живёт себе библиотека Мошкова с дизайном а ля 1994-й год и чего? Ходить на неё перестали когда фейсатели свои странички поубирали.

Какой в баню html? Там xml, завернутый в zip. Отличный и вполне открытый формат. По сравнению с pdf - все плюсы.

Весь Либрусек - сплошной fb2, тот же xml. Какие проблемы?

ePub конвертируется в fb2?

Кот-Баюн написал:
ePub конвертируется в fb2?

Давно пора забить на FB2.

Stager написал:
Кот-Баюн написал:
ePub конвертируется в fb2?

Давно пора забить на FB2.

м-м ... а что взамен, есть что-ли альтернатива? pdf и монстроформаты типа doc, rtf надо сразу отбросить. Голый текст - слишом плоско. Что может быть универсальнее формализованного xml, когда речь идет о книгах?
Аватар пользователя Lord KiRon

Ничего там сложного, хотя и немного муторно.
Внутри там кстати все же XHTML который является HTML ограниченный правилами XML или наоборот XML с тэгами/элементами HTML :)
FB2 легко конвертируется в EPUB , даже я конвертор написал :) http://www.the-ebook.org/forum/viewtopic.php?t=11567 , насчет наоборот... тоже можно, но муторно и будут очень серьезные потери формата, например если стих в FB2-шную stanza его никак не запихать автоматом, ну и тому подобное.

Скачал я для примера одну книгу с Гугля в ePub - самый настоящий ePub-XML!
Нормальный текст (как текст) и иллюстрации (как иллюстрации)!!!

Чем смотреть epub-ы под windows mobile?

Ежебока написал:
Чем смотреть epub-ы под windows mobile?

http://www.mobipocket.com/en/DownloadSoft/ProductDetailsReader.asp

Aristarch Platonov написал:
Ежебока написал:
Чем смотреть epub-ы под windows mobile?

http://www.mobipocket.com/en/DownloadSoft/ProductDetailsReader.asp


У меня одного mobipocket твердо уверен, что предназначен для работы с html, txt, pdb и prc? Терзают сомненья.
Аватар пользователя Jagget

А что посоветуете под Виндофс? Какой программой лучше читать ePub?

Аватар пользователя Lord KiRon

"Лучше" не знаю но Adobe Digital Editions показывает, хотя прога дряная до жути и на русском показывает нормально только если в файле встроенные фонты.

Главное преимущество fb2 перед ePub - как-раз то, что fb2 при желании легко преобразовывается в ePub (fb2epub-0.3.0.jar ), а вот обратно - это уже проблема.

Ajaja написал:
Главное преимущество fb2 перед ePub - как-раз то, что fb2 при желании легко преобразовывается в ePub (fb2epub-0.3.0.jar ), а вот обратно - это уже проблема.

А что это значит? А это значит, что epub мощнее fb2.
Только не думайте, что я призываю отказаться от fb2 в пользу epub. Пока фб2 удобнее епуба. С точки зрения переносимости. Но все читалки написаны энтузиастами. Вот когда они (энтузиасты) обратят свое внимание на епуб, если обратят...

vladk написал:
А что это значит? А это значит, что epub мощнее fb2. ...
Так ведь doc - еще мощнее...
Аватар пользователя soshial

вот бы кто-нибудь статью написал о epub, а то информация содержащаяся в вики очень скудна...

Аватар пользователя Lord KiRon

А что именно интересует?

Коротенько о epub здесь:
http://citkit.ru/articles/1470/

Аватар пользователя Lord KiRon

Да нечего там особо рассказывать , обычный HTML без элементов ввода вроде input и без форм. Вот и все. Если кто не умеет писать на HTML дальше может не читать.
Правда HTML этот называется XHTML но разница минимальна - все элемнеты обязательно должны быть с маленькой буквы, не может быть пустых атрибутов и все элементы должны быть закрыты (то есть например вместо <br> надо писать <br/> чтобы было понятно что закрыт).
Не рекомендуется (но можно) использовать визуальные тэги вроде <b> или <i> .
http://www.w3schools.com/XHTML/
Все.

К нему в принципе можно наложить (но совсем не обязательно) CSS 2.1 стили ( http://www.w3schools.com/Css/ ) , только без задания абсолютных позиций.

К этому создается файл заголовок, в определенном формате, куда запихивается список всех файлов в "книге".
Если есть желание создать оглавление создается еще файл оглавления, тоже в своем довольно простом формате (и тот и другой текстовые).

Все это запихивается в ZIP , который затем переименовывается в EPUB. Первым в этом ZIP-е должен идти не упакованный (stored) и не изменяющийся никогда маленький файл-метка чтобы ридеры были уверенны что это таки EPUB.

Вот собственно и все, как я уже сказал основной смысл формата - HTML , все остальное или технические детали или изменение отображения.

Если кто хочет почитать подробней, то наиболее компромисный вариант (не вдавающийся уж совсем в мелкие детали но при этом рассматривающий более подробно ключевые моменты структуры) тут: http://www.hxa.name/articles/content/epub-guide_hxa7241_2007.html

А как там организуется (в смысле может быть организована) поддержка DRM? Ну и как ее, если что, обойти?
Шифруется архив или что?

Аватар пользователя Lord KiRon

Не архив а отдельные файлы. А вообще про DRM нет в стандарте, просто в EPUB ( в ZIP собственно) можно что угодно засунуть а дальше это проблема ридера. Adobe например отдельный фолдер с конкретным именем держит с ключами и прочим.

X