Ошибки fb2.

Forums: 

Вот стало что-то мне интересно. Книжка http://royallib.ru/book/tublin_yakov/obraz_gizni.html лежит себе на сайте, и качается, и читается. Визуально при чтении тоже никаких проблем не видно. А Либрусек ее не приемлет, на ошибки ругается. Что это за ошибки такие, одному сайту мешают, другому нет?

Ну потому что структура файла нарушена. Кусок текста вынсен за пределы секций - вот и получается черти что.
Если надо, могу подправить файл.

(посмотрела) да там не только в куске текста дело... Структура как то на мой взгляд сильно усложнена... чистить? Нужно?

Книжку надо бы довести до ума. Средствами FBE, увы, не получается.

Получается-получается :)
Ща сделаю, в Вас кинуться, или выложить просто?

Просто выложить.

http://lib.rus.ec/b/299986

В файле, кстати, текстов сносок не было :( Оставила рыбу. Может, кто найдет...

SunnyCat написал:
Оставила рыбу. Может, кто найдет...
На вас не похоже. Протухла что ли рыба-то?

(пошевелила усами) да вообще какая то непонятная... :)) Давненько свежей не показывали! :)))

Текст сносок добавил. Окончательный вариант книги - http://lib.rus.ec/b/299995

О! Говорила ж, надо было Вам кидать :) Спасибо :)

Я в первом варианте и не заметил, что там какие-то сноски должны быть.

Я так и не поняла, как можно было такой файл сделать - руками такого не сделаешь, тут помошник нужен :) Говорят, литресовский... Но похоже, его попытались доработать...

Что за машина такая "Litres Downloader"? Очень часто попадаются такие файлы. Как правило, файл исковеркан и иногда невалиден.

(развела лапами) представления не имею. Я тоже их много раз встречала, правда, без особых проблем, но все требовали доработки напильником...

Аватар пользователя s_Sergius

Алексей_Н написал:
Что за машина такая "Litres Downloader"?

Я так подозреваю, это хитрая штука, умеющая считывать файлы с litres, которые от этого как раз защищены. То есть, самый что ни на есть пиратский инструмент.
Конкретно с Litres Downloader дел не имел, а вот с его аналогами eBookDownloader и FBReadOnlyDownloader приходилось. Файлы, скачанные с их помощью, требуют обязательной ручной доводки.

Мне нет. Собственно интересно как раз, почему на другом сайте неправильная структура не мешает. Да и в читалке как-то не отображаются последствия ошибок. Отчего бы это?

Аватар пользователя s_Sergius

Алмис написал:
Да и в читалке как-то не отображаются последствия ошибок.

Смотря в какой. НaaliReader, например, не открывает книгу вообще.

Так таки не мешается? :) Спешу сообщить, что тот кусок, который нарушает валидность, на сайте не отображается. Так что судя по всему, на сайте для чтения онлайн идет вовсе не fb2... :) Подозреваю, что в читалках он тоже не отобржается. К тому же, я могу загрузить и сюда невалидный файл. Но зачем делать плохо, когда можно сделать хорошо?....

Ага, так вот где собака порылась. Кусок текста не читается, понятненько.
Ну, добро, но вряд ли это во всех случаях так. Вот похожий пример: http://www.e-reading.org.ua/book.php?book=111315. Только здесь онлайн-читалка не встроена, но в Олридере все прекрасно отображается. Не похоже, чтобы текст был неполный. В чем же здесь такая серьезная проблема, что Либрусек сомневается, что это fb2, а другой сайт спокойно переваривает? Да и визуально последствий ошибок не видно.

Алмис написал:
Ага, так вот где собака порылась. Кусок текста не читается, понятненько.
Ну, добро, но вряд ли это во всех случаях так. Вот похожий пример: http://www.e-reading.org.ua/book.php?book=111315. Только здесь онлайн-читалка не встроена, но в Олридере все прекрасно отображается. Не похоже, чтобы текст был неполный. В чем же здесь такая серьезная проблема, что Либрусек сомневается, что это fb2, а другой сайт спокойно переваривает? Да и визуально последствий ошибок не видно.
Другой сайт, видимо, переваривает не полностью валидный (не полностью соответствующий схеме fb2) документ. У нас специально прикручен "придирчивый" валидатор, и это хорошо и правильно - невалидные файлы, да еще в огромном количестве, ухудшают работу движка библиотеки, а открываются не всеми читалками. Не надо их нам. Надо только валидные полностью.

Дык эта... В чем же там такая катастрофическая ошибка-то?
На вид вполне себе приличная книжка. Замечательно читается и выглядит прекрасно. Может, тоже специализированые читалки родной формат не откроют (ну и читалки, зачем тока нужны такие...)? Из-за этого валидатор на нее плюется? Как-то возникает сомнение, а не слишком ли валидатор придирчив? Пусть бы висела, многие люди могли бы прочитать. Все же лучше, чем вообще ее нет.
Или я чего-то не понимаю?

А что тут непонятного: движок заточен под обработку fb2, если он считает файл fb2, то и обрабатывает его как fb2, а не как какой-либо еще. Поскольку схема fb2 нарушена, то движок глючит. Если таких файлов много, движок глючит сильно. Оно нам не надо. Валидатор потому в итоге и прикрутили. И придирчив он не слишком. Если эта книга так нужна, то лучше заливать не невалидный fb2, а doc (и он на том сайте есть). Специализированные читалки родной формат как раз откроют, но невалидный fb2 потому и невалидный, что fb2 не является. Из-за нарушения схемы. Читалки же нужны разные по разным причинам разным читателям.

А, нарушение схемы, тогда понятненько. А про doc я как-то не подумал. Ну что ж, разумно. Спасибо за ответ.

Дело в том, что При заливке книги Либрусек проверяет валидность файла довольно серьёзной программой-валидатором http://code.google.com/p/fb2utils/downloads/list
Другие сайты этого не делают. Чтение на сайте происходит не средствами ФБ2, а HTML/
АлРидер файл откроет и прочитает, он и doc и тхт прочитает. Это не показатель ))) Читалки заточенные только под чтение ФБ2 файла, этот файл не откроют вообще

А как насчёт этого файла http://lib.rus.ec/b/292037?
Он нормальный или нет?

Нет.
Как минимум
ERROR: Line 3047: not linked image: img_2.png
ERROR: Line 4791: not linked image: img_6.png
ERROR: Line 4792: not linked image: img_7.png
ERROR: Line 4793: not linked image: img_8.png
ERROR: Line 4794: not linked image: img_9.png
ERROR: Line 4795: not linked image: img_10.png
ERROR: Line 4796: not linked image: img_11.png
ERROR: Line 4797: not linked image: img_12.png
ERROR: Line 4798: not linked image: img_13.png
ERROR: Line 4799: not linked image: img_14.png
ERROR: Line 4800: not linked image: img_15.png
ERROR: Line 4801: not linked image: img_16.png
ERROR: Line 4802: not linked image: img_17.png
ERROR: Line 4803: not linked image: img_18.png
ERROR: Line 4804: not linked image: img_19.png
ERROR: Line 4805: not linked image: img_20.png
ERROR: Line 4806: not linked image: img_21.png
ERROR: Line 4807: not linked image: img_22.png
ERROR: Line 4808: not linked image: img_23.png
ERROR: Line 4809: not linked image: img_24.png
ERROR: Line 6473: not linked image: img_27.png
ERROR: Line 6474: not linked image: img_28.png
ERROR: Line 6475: not linked image: img_29.png
ERROR: Line 6476: not linked image: img_30.png
ERROR: Line 8314: not linked image: image017.jpg
ERROR: Line 9804: not linked image: image021.jpg
ERROR: Line 10609: not linked image: image023.jpg

И + к этому он у меня попросту не открывается ВООБЩЕ. Сейчас буду ковырять...

Аватар пользователя Миррима

Его CR-2 открывает и читает - а FBE ругательски ругается и самоликвидируется, не открыв. Ну и чЮдеса...

У меня открывается, но очень глючно. Показывает только код (без текста) и описание.

Но что туда понапихали, вот вопрос... Пошла разбираться с исходником...

Все понял. Это был очень фигово распознанный djvu. Сверстанный очень странно :(
Там еще половина тире в прямой речи отсутствуют...

palla написал:
А как насчёт этого файла http://lib.rus.ec/b/292037?
Он нормальный или нет?

Цитата:
1. Validation of file C:\Documents and Settings\Admin\Рабочий стол\1Сканы\Averbah_O_chem_molchat_figuryi.292037.fb2
Try the DOM parser
xml validity check passed
Schema validation
fb2 validity check passed
Extra FB2 checkup
ERROR: not linked image: img_2.png
ERROR: not linked image: img_6.png
ERROR: not linked image: img_7.png
ERROR: not linked image: img_8.png
ERROR: not linked image: img_9.png
ERROR: not linked image: img_10.png
ERROR: not linked image: img_11.png
ERROR: not linked image: img_12.png
ERROR: not linked image: img_13.png
ERROR: not linked image: img_14.png
ERROR: not linked image: img_15.png
ERROR: not linked image: img_16.png
ERROR: not linked image: img_17.png
ERROR: not linked image: img_18.png
ERROR: not linked image: img_19.png
ERROR: not linked image: img_20.png
ERROR: not linked image: img_21.png
ERROR: not linked image: img_22.png
ERROR: not linked image: img_23.png
ERROR: not linked image: img_24.png
ERROR: not linked image: img_27.png
ERROR: not linked image: img_28.png
ERROR: not linked image: img_29.png
ERROR: not linked image: img_30.png
ERROR: not linked image: image017.jpg
ERROR: not linked image: image021.jpg
ERROR: not linked image: image023.jpg
Some errors found
Т.е. в смысле fb2-схемы и проблем для движка - ошибок нет, а ссылки на иллюстрации, которых 60 штук, кривые. Соответственно, они и не показываются (или не во всех читалка показываются). Ну и отформатирован он плохо очень.
Аватар пользователя Isais

Загадочная картинка рисуется в FBE.
Дано: новый баг роботокачалки с Литреса делает все титлы файла в одной секции.
Требуется: разрезать одну секцию на много мелких в соответствии с титлами.
Решение:
1) вручную гнать просмотр через весь файл и разрезать около.
Недостаток: медленно, долго, утомительно.
2) в сорцах тупо менять <title> на </section><section><tltle>. По задумке - убрать первое вхождение в файл и будет более-менее полуфабрикат с секциями.
Недостаток: не понять, что на что меняет редактор на странице Source, но в одном файле замен было сделано 64 тысячи с хвостом, в другом 65 тысяч с большим лишком (оба раза нечетные числа).
!!! Там столько абзацев <p></p> нету, сколько FBE титлов нашел!
За-га-доч-на-я картинка, я и говорю.
ЧСХ, решение №2 безупречно работает в Notepad++.

Аватар пользователя s_Sergius

Да, FBE тупо циклит при такой замене, поэтому я такие дела делаю в AkelPad.

Цитата:
2) в сорцах тупо менять на . По задумке - убрать первое вхождение в файл и будет более-менее полуфабрикат с секциями.

́
Я так и делаю с галкой "Только слова целиком" - всё ок))
́
Кстати, эта качалка все рисунки обрамляет тегом р, тоже убираю
́
Для примечаний (они идут в конце без деления на секции)
1 - делаю такую замену (регэкспы) в сорсе
(<p>)([0-9]{1,3})(</p>)
на
</section><section id="n_$2"><title><p>$2</p></title>
2 - все номера примечаний в тексте уже есть в [] - запускаю скрипт "Примечания из []"
3 - вместо сформированных секций примечаний вставляю полученное на шаге 1.
́
еще эта качалка все cite и poem переделывает в epigraph, причем перед cite вставляет <subtitle>...</subtitle>
прикол, да?
Если много стихов вперемешку с цитатами, то только руцями править
Аватар пользователя Isais

Ага, значит. "Слова целиком" я не отмечал, думал, обойдется.
Ну да Notepad++ работает, и слава богу.

Цитаты и стихи - давно известный "прикол". Особенно красиво смотрятся сборники стихов. Т.к. зачастую они плоды графоманиии в чистом виде, на стихи уже не реагирую.

Аватар пользователя s_Sergius

Еще в этих качалкиных творениях напрочь отсутствуют выходные данные. Неплохо было бы их добавлять при допиливании. А найти их можно на Альдебаране, например.

Если нужно править код, удобнее всего это сделает Ворд. При этом не угробит тэги, форматирование, спецсимволы и даже иллюстрации (хотя их можно и не копировать).

Alt+F3, Ctrl-A, Ctrl-C и вставляем всё в Ворд. Меняем хоть ручками, хоть скриптом и Ctrl-V обратно, пока страничка кода открыта и FBE не рвётся проверять структуру. Есть много старых файлов FB2, где весь текст вообще стихами (stanza) оформлен - бог знает, чем его так парсили, но факт что есть. Там и абзацы не с Р, а с V начинаются, какая уж там структура. Связка Ворд+FBE это безобразие превращает в человека за минуту!

Аватар пользователя Isais

Studentomori написал:
Если нужно править код, удобнее всего это сделает Ворд. ...
Вы ошибаетесь.

Studentomori написал:
Есть много старых файлов FB2, где весь текст вообще стихами (stanza) оформлен - бог знает, чем его так парсили, но факт что есть. Там и абзацы не с Р, а с V начинаются, какая уж там структура.

Следы программы Any2fb2. Говорят, что программа удобная. Но она создавалась "для себя и понимающих друзей" - нет ни внятного интерфейса, ни внятной инструкции. Использовать ее не стоит, однокнопочное применение превращает прозу в поэзию.

sd написал:

Следы программы Any2fb2. Говорят, что программа удобная. Но она создавалась "для себя и понимающих друзей" - нет ни внятного интерфейса, ни внятной инструкции. Использовать ее не стоит, однокнопочное применение превращает прозу в поэзию.
Удобная, когда приноровишься (пробуешь, смотришь результат, снова пробуешь). Например, может собрать книжку по файлу оглавления из распакованного chm-файла или по странице содержания прямо с Милитеры. Только параметры конвертирования нужно задать правильные и отключать галки "распознавать стихи" и "распознавать эпиграфы".

Практика - критерий истины. Попробуйте сами...
Формат FB2 - это формат XML. Желающий может просто переименовать *.FB2 в *.HTM или *.HTML и открыть файл в любом браузере (иллюстрации не откроются).
Формат MS-Office - тоже XML. Желающий может открыть *.DOC или *.DOCX с помощью WinRar, распаковать в папку и достать оттуда чистый незамутнённый XML.
Таким образом, что поддерживает FBE, то поддержит и Ворд.

Аватар пользователя s_Sergius

Вы знаете, я люблю Word и активно его использую для первоначальной подготовки текста перед конвертированием его в fb2.
Но вот редактировать им готовый fb2 как-то не представляется целесообразным.

И еще, DOC не XML. DOCX — да, а DOC — нет.

Ок, сабж был о "выпрямлении" fb2-файлов. Я поделился способом исправления, который успешно практикую сам.
Дело сугубо ваше: брать мой опыт на заметку или пройти мимо. О форматах упомянул говоря про сохранность данных при переносе туда-сюда. Офтоп разводить смысла не вижу.

Studentomori написал:
Ок, сабж был о "выпрямлении" fb2-файлов. Я поделился способом исправления, который успешно практикую сам.
Дело сугубо ваше: брать мой опыт на заметку или пройти мимо. О форматах упомянул говоря про сохранность данных при переносе туда-сюда. Офтоп разводить смысла не вижу.
Был уже такой же "вумный", как Вы сейчас, он ещё говорил, что он XML изучил ещё когда вы (вампиры-Либрусеки) под стол пешком ходили и поэтому недостойны того, чтобы ему указания давать, и вапще у его файлов недельных скачиваний набралось 7Г. Короче, невменяемый был типус, а скачиваний его файлов было охуенное количество потому, что он плодил дубли со страшной силой, пытаясь залить XML вместо FB2.
Кстати, насчет XML: всякая селедка — рыба, но не всякая рыба — селедка. Так ыот, FB2 является весьма специфичным подвидом XML, но он не является селедкой тем видом XML, с которым успешно работает Ворд. Что же касается Вашего бреда о том, чтобы открывать FB2 в браузере: кто Вам сказал такую чушь? Открывать в браузере можно только через движок сайта, например, Либрусека или Флибусты или другого сайта, который перетранслирует fb2 в нечто удобопоказываемое для браузера.

Zadd написал:
Открывать в браузере можно только через движок сайта, например, Либрусека или Флибусты или другого сайта, который перетранслирует fb2 в нечто удобопоказываемое для браузера.

?? У меня Хромом так:

Файл взят здесь же. Переименован в htm. По заголовку окна несложно определить браузер (сорри, хром не использую). Имя файла читается в строке адреса.

Studentomori написал:
Файл взят здесь же. Переименован в htm. По заголовку окна несложно определить браузер (сорри, хром не использую). Имя файла читается в строке адреса.
Эт у те спец. Мозилловский плагин для чтения fb2.
А что, он ещё и править умеет?
Сирамно FBE лучче!
Учи матчасть, FBE, мать твою!
Аватар пользователя Isais

wotti написал:
Zadd написал:
Открывать в браузере можно только через движок сайта, например, Либрусека или Флибусты или другого сайта, который перетранслирует fb2 в нечто удобопоказываемое для браузера.

?? У меня Хромом так:


И в FF то же самое (проверил). Именно если читать не с сайта, а оффлайн, с винта. Потому что XML.

Isais написал:
И в FF то же самое (проверил). Именно если читать не с сайта, а оффлайн, с винта. Потому что XML.
Эт птмучто у тя нет спецплагина для FF для чтения fb2. Тока зачем переименовывать в HTML сирамно откроет и покажет fb2 с плагином, тока непонятно, зачем? Наверно, для тех, кто не подозревает о существовании читалок(Haali, AlReader, CoolReader) или кто настолько засел по́уши в FF, что не хочит иснево вылизать дажи для чтенейа кникк.
Или любит книшшки четадь тока в FF, но НЕ онлайн.
Аватар пользователя Isais

Zadd написал:
Isais написал:
И в FF то же самое (проверил). Именно если читать не с сайта, а оффлайн, с винта. Потому что XML.
Эт птмучто у тя нет спецплагина для FF для чтения fb2. Тока зачем переименовывать в HTML сирамно откроет и покажет fb2 с плагином, тока непонятно, зачем? Наверно, для тех, кто не подозревает о существовании читалок(Haali, AlReader, CoolReader) или кто настолько засел по́уши в FF, что не хочит иснево вылизать дажи для чтенейа кникк.
Или любит книшшки четадь тока в FF, но НЕ онлайн.

...Что это было??!
Очень медленно. По слогам.
В Windows XP есть такая функция: обработка щелчка правой кнопкой мыши. Если выделить какой-то файл и нажать правую кнопку мышки, откроется контекстное меню. В списке этого меню есть опция "Открыть с помощью". Если выбрать эту опцию, откроется новое окошко - выбор программ, которыми можно открыть выделенный файл. Можно установить постоянную ассоциацию программы с файлом, можно открыть разово чем-то исключительным.
Я не слишком сложно объясняю?
Ознакомьтесь:

Так вот, я выбрал эту опцию и указал открыть FB2-файл программой-браузером. Их у меня 4. Результат не отличает от того, что привел wotti. О каких переименованиях Вы толкуете?

Isais написал:
...Что это было??!
Очень медленно. По слогам.
В Windows XP есть такая функция: обработка щелчка правой кнопкой мыши. Если выделить какой-то файл и нажать правую кнопку мышки, откроется контекстное меню. В списке этого меню есть опция "Открыть с помощью". Если выбрать эту опцию, откроется новое окошко - выбор программ, которыми можно открыть выделенный файл. Можно установить постоянную ассоциацию программы с файлом, можно открыть разово чем-то исключительным.
Я не слишком сложно объясняю?
Ознакомьтесь:
Так вот, я выбрал эту опцию и указал открыть FB2-файл программой-браузером. Их у меня 4. Результат не отличает от того, что привел wotti. О каких переименованиях Вы толкуете?
А Studentomori постом выше Вашего открыл >>FB2-файл программой-браузером и, поскольку в его Лисе установлен плагин для чтения fb2, то результат весьма отличный от Вашего.
Компрене? Андестэнд?
Собственно, я по этому поводу и разъясняю, что любит человек книщщки четадь обязательно через FF с плагином для чтения fb2, при этом зачем-то ещё переименовывает расширение файла в HTML.
Чудак-человек, одним словом.
Приглядывай за его заливками, черт его знает, какую хадость он зальет таким методом.

wotti написал:
Zadd написал:
Открывать в браузере можно только через движок сайта, например, Либрусека или Флибусты или другого сайта, который перетранслирует fb2 в нечто удобопоказываемое для браузера.

?? У меня Хромом так:

Что и требовалось доказать! С гораздо большим успехом можно открыть в текстовом редакторе, например, в АкелПаде или в vim, там по крайней мере, править можно, а тут видишь то же самое, что и обычный текстовый редактор, но правитьь ничего нельзя.
Смысл?
FBE рулит!

Страницы

X