Вы здесьФормат NFB
Опубликовано ср, 26/11/2008 - 07:23 пользователем СерыйМыш
начиная с 01.12.2008 ТЕМА НЕ МОДЕРИРУЕТСЯ изменено: 30.06.2009. 24.04.2009: работы временно приостановлены по субъективным причинам. возобновление планируется на середину мая этого года. формат разрабатывается как макcимально упрощенный альтернативный вариант хранения книг. работы над спецификацией формата практически закончены. конвертор пока существует только из fb2 в nfb, планируется полная поддержка импорта и экспорта для формата fb2. у кого есть конструктивные идеи/замечания/предложения - прошу высказаться.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
monochka RE:Подайте бедному копеечку на книжку с литреса... 46 мин.
Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 дня babajga RE:Белая княжна 4 дня Nicout RE:Таинственная личность админа Флибусты 6 дней Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 6 дней mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 1 неделя zlyaka RE:С Новым годом! 1 неделя Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 неделя SparkySpirit RE:Прошу переформатировать, распознать, etc... 2 недели SparkySpirit RE:Жорж Санд - переводы 19 века 2 недели Саша из Киева RE:Наш дом - СССР 2 недели babajga RE:Чернушка. Повести 2 недели Саша из Киева RE:Сказки далёких островов 2 недели babajga RE:Лопоухий бес 2 недели babajga RE:Ежик покидает дом 3 недели babajga RE:Сказки бабушки Черепахи 3 недели babajga RE:Свист диких крыльев 3 недели Саша из Киева RE:Турецкие мусорщики в Анкаре открыли библиотеку, полную... 4 недели Впечатления о книгах
alexk про Кича: Большая книга по истории Ближнего Востока. Комплект из 5 книг [litres] (Исторические приключения, История)
11 01 Очень странное издание. И с каких это пор Афганистан стал Ближним Востоком?
behemmoth про Круз: В центре урагана (Социальная фантастика, Самиздат, сетевая литература)
09 01 Долго думал, писать ли отзыв или aut bene aut nihil. Но тем не менее. "Ветер над островами" был, пожалуй, самой "взрослой" серией Андрея, в которой наконец-то хоть чем то была разбавлена набившая оскомину парадигма "война ……… Оценка: плохо
Barbud про Ларин: Прощай СССР (Приключения: прочее, Самиздат, сетевая литература)
09 01 Дочитал... Да, местами смешно, читать можно. Жаль, концовка какая-то невнятная - ГГ вкупе с заклятыми братьями по сверхразуму исчез ХЗ куда, вожатую и ненормального пионера - "кровь-кишки-распидорасило", итог лагерной "Зарницы" остался непроясненным))
mysevra про Дойч: Метроном. История Франции, рассказанная под стук колес парижского метро (Историческая проза, Публицистика, Документальная литература)
09 01 По этой книге Фабрисом Урлие снят замечательный 4-серийный документальный фильм - яркое визуальное дополнение. Оценка: отлично!
nik_ol про Джентльмен сыска Иван Подушкин
08 01 Выложите уже, пожалуйста, новое от Донцовой что-то, а то от Пелевина уже ум за разум заходить начал)))).
Анни-Мари про Потомокъ
08 01 Замечательная серия. Любопытно, будет ли продолжение? В целом, все логически завершено, но! Такое ощущение, что автор допускает, да.
pulochka про Френкель: Бог, которого не было. Красная книга (Проза)
08 01 Это бред сумасшедшего? Как ЭТО вообще можно читать? Оценка: нечитаемо
decim про Серяков: Русы во времена великих потрясений (История, Научпоп)
08 01 Весьма любопытные гипотезы. Однако судить о бесписьменном народе, каким в те поры были предки современных славян(русами их назвал Ибн-Фадлан гораздо позже, и не были ли то Ruotsi, варяги? собственно славян соседи по Балтике ………
Barbud про Ларин: Назад в СССР (Детская фантастика, Самиздат, сетевая литература)
07 01 Чушь какая-то. Автор, вероятно, молодой молокосос, не имеющий понятия о том, как общались пионеры в то время и каких слов и оборотов они вообще не знали. Да и ведут они себя абсолютно неестественно для тогдашних реалий. Затяжной ……… Оценка: неплохо
RusD про Елманов: Серый ангел [litres] (Попаданцы, Историческое фэнтези)
07 01 Это, похоже, 2я часть книги "Последний шанс империи
Вита Бревис про Руслан Владимирович Жуковец
07 01 То что я прочла и поняла - хорошо. Отсюда я заключаю, что и все остальное - тоже. Я прочитала характеристику Порфирия Иванова. Великолепно. И глубина , и анализ, и все такое.
mysevra про Выставной: Тварь (Боевая фантастика)
07 01 Насколько была увлекательной первая книга, настолько же неинтересна вторая. P.S. Здорово, что вы есть, я безумно скучала. Оценка: неплохо |
||||||
Комментарии
Отв: Формат NFB
Э-э, прости за мои постоянные потуги расширить «NFB_Info», но тут вот какое дело: на Либрусеке, насколько я понимаю, довольно активно используется механизм слежения за автором *.fb2 документа, поскольку некоторые авторы склонны к некоторым недоделкам и т. п. А у тебя автор *.fb2 лишается своего особого блока и помещается в общей секции для доп. сведений «INFO». Вопрос: сможет ли твой каталогизатор вытаскивать эту нужную информацию?
Отв: Формат NFB
при возникновении претензий к определенному "автору" на основании его определённой "работы", вполне возможно глазками разобрать поле INFO и сделать выводы. автоматизированно компоновать файлы по имени "автора" - явно лишнее, особенно учитывая, что подпись в поле "document-info.author" заполняется вообще абстрактно и как придётся, потому как человек в здравом уме не станет указывать подробно свои паспортные данные на "вещественном доказательстве".
в связи с этим настораживает гипотетическая вероятность предъявления претензий всякими копирастами к особо активным оцифровщикам. как-то подсознательно мне не хочется помогать всяким идейным борцам и желающим заработать не работая.
надо голосовать. если выяснится реальная полезность отдельного структурированного блока вида "document-info" - добавлю без вопросов.
Отв: Формат NFB
Что-то типа совета. :)
Наверное, надо завести коллекцию образцов для разного рода документов (сборников, колл. монографий, изданий с многими сопроводительными материалами etc. — чтобы можно было наглядно иметь дело с разными «NFB_Info».
Отв: Формат NFB
выложил триннадцатую редакцию. попытался навести порядок и учесть последние пожелания.
перечитал спецификацию, пытаясь представить себе, что читает её посторонний человек в первый раз. понял, что выглядит оно внутри как-то безсистемно и косолапо.
кто может помочь хотя бы рекомендациями по методике оформления спецификации и переводу её на человеческий язык - буду безмерно благодарен.
Отв: Формат NFB
Бегло и сумбурно, но…
У сборников часто бывают разные языки оригиналов отдельных произведений. И было бы неплохо иметь возможность указать язык для каждого произведения.
Стихи могут попадать в оглавление по первой строфе. Дублировать?
Неоднозначность сигнатуры ||. Просто придирка, но парсеру надо будет запоминать, что сейчас он, к примеру, сноску обрабатывает.
Дальше смешной вопрос -- сигнатуры типа === автоматически обозначают применение ~~ для последующего текста при наличии каких-то шрифтовых выделений в предшествующем тексте?
Отв: Формат NFB
вот аццкий сотона. заметил-таки... а я так надеялся... ладно, впишем уже :)
я надеюсь, нет сборников, в которых тексты на разных языках? или всё-таки есть???
не, не дублировать. просто задать в начальной сигнатуре пустой заголовок нужного уровня:
[&]===
Лыжи у печки стоят
Не на что лыжам присесть.
[.]
отмечу в спецификации.
на самом деле не придется. придется по разному обрабатывать маркер при выводе разных видов блоков, но этот вывод сейчас и так сделан с помощью перекрытых методов объектов, так что проблема не столь серьёзна.
опять же - количество символов ограничено, поэтому вразумительные сигнатуры на каждый отдельный случай сложновато придумать.
да. переход к следующему абзацу/блоку всегда сбрасывает шрифтовое выделение. заголовок выводится своим стилем, текст далее - своим, без выделения.
Отв: Формат NFB
Отв: Формат NFB
хм. вроде было указано ещё с первых версий:
Сигнатуры форматирования могут встречаться в любом месте текста. Все сигнатуры являются переключателями. Первое вхождение включает указанный формат символов, следующее - выключает. При отсуствии выключающего вхождения формат действует до конца текущего абзаца.
добавлю уточнение на всякий случай. действительно написано неочевидно.
Отв: Формат NFB
JAW wrote:
Меня в Fb2 в реализации PocketBook не удовлетворила глубина вложенности Section.
Там, какжется, Title, Part, Section и вроде всё...
Всяких SubSection, SubSubSection, Par (с Inline заголовком) не предусмотрено?
Ладно... Нужно смотреть спецификацию внимательней.
А что делать, если мы в одном документе объединяем разные статьи со своими титламами, возможно разными авторами и т.п.
Типичный научный сборник... Там ещё к каждой статье свой индекс УДК болтается...
А потом всё это разбить среди множества таких томов по рубликации?
GribUser wrote:
Типичный научный сборник
Без шансов, fb2 это не переварит.
А nfb такое переварит?
Отв: Формат NFB
уровней вложения заголовков изначально предусмотрено четыре, но в спецификации этот факт жетско не прописан. количество этажей рассчитывалось из соображений удобства пользования оглавлением и усредненной статистики - в основном содержание в книгах имеет два-три уровня деления - Книга первая/Часть первая/Глава первая. четвертый уровень взят для покрытия клинических случаев. вполне допустимо сделать хоть десять уровней вложения, только надо ли?
насчет Par и инлайновых заголовков можно обдумать. но вероятно результатом будет загромождение блока "содержание" и потеря удобства пользования.
сборники с разными авторами уже обсуждались: деление в файле идет на уровне текстовых секций - по отдельным публикациям/авторам, внутри секций - по заголовкам разного уровня.
подход к каталогизации такой - обрабатывается служебная секция "bookinfo", и из нее берутся сведенияоб авторах, названиях и т.п. если очень нужен поиск и систематизация по отдельным статьям - оформлять в виде отдельных секций и прописывать в bookinfo.
не вижу пока ни одной причины не переварить.
п.с. мне неимоверно стыдно, но никак не могу заставить себя доделать движок читалки. завал на работе плюс ремонт дома, в итоге сил и желания практически не остаётся. надеюсь, когда-нибудь ситуация поменяется.
Отв: Формат NFB
Да одному все это поднять нелегко.
Вы и так сделали много.
По-хорошему, этот проект должен поддержать Ларин: деньгами или хотя бы заявлением о постепенном переводе либрусека на nfb.
Отв: Формат NFB
не-не-не-не, девид блейн! (с)
сразу две ошибки в одном предложении. во-первых - Ларин никому из нас ничего не должен, а особенно денег. во-вторых, говорить об использовании какого-либо альтернативного формата для либрусека можно будет только после того, как этот формат будет иметь полную инфраструктуру поддержки - редакторы, читалки, конвертеры. да и то не факт.
чтобы перейти на другой формат, нужны очень веские основания. как минимум тенденция к увеличению количества книг в новом формате, и явные недвусмысленные намеки общественности на то, что имеющийся формат их не устраивает. пока fb2 устраивает большинство, и незачем мутить воду.
по поводу денег - они не помогут. вряд ли у грибова на его работе мало платят, однако fb3 до сих пор не вышел из состояния драфта.
и вообще, я изначально объявил и буду в дальнейшем настаивать: моя разработка была и будет бесплатной и открытой. любого, кто попробует использовать её для зарабатывания денег, я предам анафеме и затаскаю по судам.
кстати, похоже самое время на всякий случай сделать фиксацию факта авторства и подумать, под какой лицензией жить дальше. скорее всего GNU GPL/FDL или СС-NC, надо перечитать и выбрать.
П.С. очень хочется присобачить СС BY-NC-SA, но в нашей стране нет адекватного закона на этот счет. буду думать.
Отв: Формат NFB
< сразу две ошибки в одном предложении
<во-первых - Ларин никому из нас ничего не должен
Ну почему же, затеяв такой проект он несет перед нами определенную моральную ответственность. Например, кореец, drserj и др. разработали разработали замечательные программы, предполагая, что либусек не прекратит свою работу.
>по поводу денег - они не помогут. вряд ли у грибова на его работе мало платят, однако fb3 до сих пор не вышел из состояния драфта.
Ну деньги, иногда, штука очень полезная. Например, если бы ваш проект в какой-то степени финансировался, то вы бы побыстрее закончили ремонт и написали движок. Кроме тоо деньги пригодились бы для регистрации авторских прав и торговой марки на "nfb".
Отв: Формат NFB
в любом случае, слово _должен_ тут неуместно. не привязывайте вражью капиталистическую идеологию к данным обстоятельствам. никаких гарантий, явных или подразумеваемых, всё исключительно на энтузиазме и любви к людям.
НЕЕЕЕЕТ. если бы это была моя основная работа, и от того, сделаю я ее или нет, зависило моё финансовое благополучие - тогда может быть деньги помогли бы. сейчас всё упирается в отсутствие свободного времени, и в голову, забитую всякой хренью типа 1С. после фантазий на тему бухучета креативное мышление отключается напрочь. и ремонт тут не особо причём.
за деньги это есть смысл делать, если собираешься потом делать на этом деньги. я не собираюсь делать ни того ни другого, вполне достаточно выполнения некоторых идиотских условий, обеспечивающих подтверждение авторства. остальное излишне.
п.с. предлагаю на этом перестать мусолить тему денег.
п.п.с. в ближайший день-два выложу 14 редакцию спецификации, статус "релиз". хватит уже в кандидатах сидеть.
Отв: Формат NFB
И таки хотелось бы увидеть «прозрачный» маркер «номер страницы в оригинальном издании». И, как вариант, сослаться на него из другой книги.
Т. е. довести до идеала: «Возможен переход по ссылке или вывод расшифровки в виде подсказки.
Допускается указание номера страницы после номера книги:
Подробнее данная тем описана в ["1,234]».
P. S. А поглядеть на исходники того, что было в самом начале в исполняемом виде с примером, можно? :)
Отв: Формат NFB
"номер страницы в оригинальном издании" уже давно включен в спецификацию, курите внимательнее.
с переходом несколько проблем, не относящихся к собственно формату. первая и основная - однозначная идентификация книги, на которую оформлена ссылка. код ISBN/ISSN, указанный в библиографическом списке, возможно решит эту задачу, но при этом возникает вторая проблема - в наличии этой самой книги в библиотеке у того, кто переходит по ссылке. скачивание из инета по запросу не предлагать, ибо вообще нонсенс и фантастика.
все-таки считаю, что маневры с переходом из одной книги в другую излишне усложнят всю конструкцию, и не будут надежно работать. хотя, при тесной интеграции каталогизатора и читалки в принципе можно попробовать. на всякий случай в спецификации добавлю пояснение на этот счет.
легко. только надо учесть, что написано под дельфи7 без vcl, с использованием GDI+. если всё ещё интересно - скинь личным письмом асю/жабу, сконтачим.
Отв: Формат NFB
Каюсь, действительно не вкурил про номера страниц :) Их надо сделать опционально отображаемыми.
А вот остальное и, в том числе, проблемы с лёгкой читалкой и серьёзным библиотекарем — надеюсь опишу. К сожалению у меня те же проблемы с работой, квартирой итд. Идей куча, а времени просто физически не хватает.
Но есть предложение :) Так как формат ушёл довольно далеко от «плоской» литературы — выбрать несколько эталонных книг, которые хотелось бы иметь в адекватном отображении (для начала без математики). И с ростом формата — увеличивать список :)
Отв: Формат NFB
демку я форматировал руками, но для серьезных по объему текстов это неприемлемо.
математика пока не поддерживается, планируется всё это отдать на откуп плагинам.
Отв: Формат NFB
До кучи :) Заголовок со сноской. Козьма Прутков сильно этим страдал :)
Отв: Формат NFB
>в любом случае, слово _должен_ тут неуместно. не привязывайте вражью капиталистическую >идеологию к данным обстоятельствам. никаких гарантий, явных или подразумеваемых, всё >исключительно на энтузиазме и любви к людям.
Очень рад от вас это слышать, хоть здесь коммунистические идеи побеждают.
>п.п.с. в ближайший день-два выложу 14 редакцию спецификации, статус "релиз". хватит уже в >кандидатах сидеть.
Здорово.
Отв: Формат NFB
в процессе написания парсера секции bookinfo в ум пришла и не уходит одна назойливая мысль: зачем я сделал разные ключи для названия одиночной книги и названия сборника?
по идее, само по себе наличие конструкции PART:000х ... ENDP: обоначает, что имеющийся файл содержит сборник. или же несколько самостоятельных частей - например собственно книгу, вступительную статью/предисловие, послесловие и т.п.
в итоге имеем: если это реально сборник, то его название и прочие регалии относятся именно к сборнику и каждая часть должны иметь свои реквизиты. если же это книга с допматериалами, то название относится к содержательной части книги, и нет смысла дублировать его в описателе секции (и в принципе само описание этой секции делать не за чем).
в результате имеем правило (уже указанное в спецификации): последний - верный. если для секции не указано наименование, автор, и прочие детали, то подразумевается, что эти реквизиты совпадают с указанными в начале.
таким образом исключается необходимость указывать повторно частные реквизиты, если они совпадают с общими.
решение - реквизит COLL переименовываем в TITL и всё становится ровно.
теперь вопрос такой: нужно ли отдельно указывать, что данный файл (книга) по сути является сборником?
теоретически этот факт можно обозначить в головном реквизите FORM: - форма произведения = сборник. вот как-то так.
я прав? или есть что-то, что я не заметил?
Отв: Формат NFB
Может я и ошибаюсь, но спорно.
COLL однозначно говорил что это многосоставная книга. И уже не так важно, сборник это или издание с кучей допов.
Я предлагаю другой вариант: разделить нынешний BookInfo на два раздела. BookInfo и PartInfo. И тогда в первую часть попадают выходные данные об издании и тип издания. А потом мы имеем энное количество частей. И тогда там, если в букинфо стоит «самостоятельное произведение» -- мы уже на EDIC, к примеру, внимания не обращаем. Бо для одного издания редакторско-корректорский коллектив, как правило не изменяется. За редким исключением «Печатается по изданию такому-то». Заодно это упрощает парсинг. Для чтения данных «одночастёвой» книги не надо будет пробегать весь файл.
Ах да, ну и разные издания — тоже проще парсить :) Тело книги читать не придётся.
Отв: Формат NFB
в догонку:
автор допматериалов в отдельном реквизите в данном случае тоже становится не нужным. то, чот это допматериалы также можно выяснить из частного реквизита FORM, указанного для соответствующей секции.
вот такой блин финал релиз...
готовлю 15-ю редакцию.
Отв: Формат NFB
Становится не совсем понятен смысл поля FORM. Для карты в допе это будет что? А для одной и той же статьи в журнале и в приложении? А когда это современная книжка и есть диск? Который вроде бы тоже часть книги? С ним как? :)
Отв: Формат NFB
«Каждый реквизит в секции должен завершаться парой символов CR+LF»
Тоже ни разу не хорошо. Win и местами symbian. Большинству остальных хватает LF :) Они не от печатных машинок произошли :)))
P. S. СерыйМыш, а нет желания или на адобовскую или на гугловскую площадку вынести обсуждение? С возможностью хотя бы коллективных комментариев к документу?
И коллективно в стиле rfc оформить.
Отв: Формат NFB
«Например:
LANG:RU
SRCL:EN
AUTH:Брэдбери, Рэй, Дуглас
AUTH:Bradbury, Ray, Douglas
TITL:Марсианские хроники
TITL:The Martian Chronicles»
Хм, а не так:
«LANG:RU
AUTH:Брэдбери, Рэй, Дуглас
TITL:Марсианские хроники
ISBN: x-xxxxx-xxx-x
SRCL:EN
AUTH:Bradbury, Ray, Douglas
TITL:The Martian Chronicles
ISBN: x-xxx-xxxxx-x»
Пока у нас LANG=RU -- наше всё. Остальное -- надо, скорее, для библиотекарского софта и поиска. Заодно блоком парсить проще, чем чётные и не очень строки. Я уж не говорю, про издания в которых имя автора даётся на языке оригинала, в англицкой транскрипции и в русском звучании.
А потом мы дойдём до того, что будем говорить о конкретной книге BOKL:RU, SRCL:EN. И добавлять кучу PNTL:XX для поиска по изданиям на других языках.
Отв: Формат NFB
Немного пропускаем и переходим к картинкам.
Я уже почти верю в коллективный разум, но когда-то найдётся гений, оформивший горизонтальную картинку межабзачного узора высотой в 15 строк. И при этом с шириной 30% и обтеканием справа. Кажется нужны более жёсткие правила.
Потом найдётся картинка, в которой подпись больше, чем графика. Собственно уже :) Я на досуге пытаюсь первую Тесловскую книжку во вменяемый вид из djvu перевести. Там такие есть :)
Бэг пардон, что наскоками и сумбурно :) Я в кои-то веки дома до компа добрался не заснув по дороге :)
Отв: Формат NFB
Случайно ткнулся в Серия в Либрусеке. Нужно что-то делать. и оху… мрачно.
Там, ближе к нынешней дате, даже таки звучат слова не мальчиков, но мужей :)
Надо срочно учиться на их ошибках :)
Отв: Формат NFB
отвечаю оптом:
насчет CR+LF согласен. вроде уже обсуждалось, однако почему-то в спецификации остался первоначальный вариант.
с реквизитом FORM надо поработать, но суть его не меняется. форма произведения вполне поддается классификации. а то что не поддается - сгибается по месту и классифицируется по общим правилам.
присобачивать диск внутрь файла с книгой - имхо перебор. пусть уже лежит отдельно.
касаемо серий - возможно, есть смысл ввести иерархические понятия - серия, цикл, и т.п., но кроме путаницы это вряд ли что-то даст. поэтому предлагаю всё, что относится к авторскому делению на серии вгонять в SEQU, всё что относится к издательским сериям - в PSEQ. при любом порядке следования этих реквизитов вполне можно определить, относится книга к той или иной, заранее известной серии, или нет.
с языками текста и оригинала, и определением, на каком языке задан реквизит, возникло некоторое затруднение. возможна ситуация, когда указаны, например, две издательские серии, каждая на двух языках - итого 4 одинаковых реквизита. как их тасовать и компоновать - не совсем очевидно.
делить список реквизитов на иерархические конструкции упорно не хочется, но похоже придётся. надо поиграть с разными вариантами компоновки и найти самое простое и красивое решение. xml в этом плане конечно рулит, но цель была как раз уйти от тяжеловесных программных реализаций.
наверное есть смысл пойти кривым, но общепринятым путем - сначала написать код, а потом по ходу дела, когда обнаружатся ошибки проектирования, поправить спецификацию, и уже после этого всё устаканивать.
Отв: Формат NFB
После 14-ой версии спецификации и ее годичного обсуждения так сделать уже не получится :).
Отв: Формат NFB
Эмм? А почему? Пользуемся мы-же браузерами или офисными пакетами. И там энная версия или год обсуждения — это просто очередной верстовой столбик на дороге.
Отв: Формат NFB
ещё как получится :)
на данный момент не существует ни одной программы, поддерживающей формат nfb, поэтому изменения никому не создадут проблем.
к тому же, конструктивных/идеологических изменений не будет, будет косметическая доработка по месту напильником.
по сути, задача сейчас разделилась на две - визуальная часть, относящаяся к отображению собственно книги, и информативная часть, относящаяся к реквизитам.
в первую очередь хочется заняться визуальной частью, потому что сразу будут видны все отличия от конкурирующих форматов.
информативную часть однозначно стоит проработать еще раз, обобщив все вновь поступившие и имеющиеся сведения. думаю, надо более детально покурить инфу о EPUB, чтобы по возможности сделать возможной конвертацию туда-обратно с минимальными потерями.
Страницы