V479698 Кто загружает ущербные файлы ?

В последнее время кто-то умудряется грузить невалидные книги,
надо бы с этим разобраться библиотекарям !!!
В книге 10 мифов о КГБ много ошибок.
В книге Позор Кремля. Как Путин унижает Россию много ошибок.
В книге Роксолана-Хуррем и ее «Великолепный век». много ошибок.
и т.д.

Кто делает и заливает эти книги не знаю, но на пробу скачал и посмотрел Роксолану. Нет разбивки на секции и несколько цитат вставлены как эпиграфы. Исправил. Перезаливать?

AllexOld написал:
Кто делает и заливает эти книги не знаю, но на пробу скачал и посмотрел Роксолану. Нет разбивки на секции и несколько цитат вставлены как эпиграфы. Исправил. Перезаливать?

А эта книга - вообще двойник книге Роксолана и султан

Aleks_Sim написал:
AllexOld написал:
Кто делает и заливает эти книги не знаю, но на пробу скачал и посмотрел Роксолану. Нет разбивки на секции и несколько цитат вставлены как эпиграфы. Исправил. Перезаливать?

А эта книга - вообще двойник книге Роксолана и султан

Это разные книги

Аватар пользователя s_Sergius

AllexOld написал:
Нет разбивки на секции и несколько цитат вставлены как эпиграфы. Исправил. Перезаливать?

Исправили, перезаливайте.

Заменил на исправленную

Aleks_Sim написал:

В книге Позор Кремля. Как Путин унижает Россию много ошибок.

Ошибка одна - сама книга.
Аватар пользователя s_Sergius

Aleks_Sim написал:
В последнее время кто-то умудряется грузить невалидные книги,
надо бы с этим разобраться библиотекарям !!!

Это книги с litres’a, стянутые некой качалкой, но до ума не доведенные.
Они далеко не в последнее время тут появились. И появляются дальше.
С некоторыми заливщиками удалось договориться, чтобы не добавляли такие недоделки, но время от времени находятся новые "активисты" и тащат, например, с Флибусты, где их пруд пруди.

s_Sergius написал:
Aleks_Sim написал:
В последнее время кто-то умудряется грузить невалидные книги,
надо бы с этим разобраться библиотекарям !!!

Это книги с litres’a, стянутые некой качалкой, но до ума не доведенные.
Они далеко не в последнее время тут появились. И появляются дальше.
С некоторыми заливщиками удалось договориться, чтобы не добавляли такие недоделки, но время от времени находятся новые "активисты" и тащат, например, с Флибусты, где их пруд пруди.
Заколдованный круг. А на Флибусте говорят, что тащат с Либрусека, типо, на Флибусту автоматом заливается то, что на Либрусек приносят любители "пользы".
Аватар пользователя s_Sergius

Zadd написал:
А на Флибусте говорят, что тащат с Либрусека, типо, на Флибусту автоматом заливается то, что на Либрусек приносят любители "пользы".

Это не совсем так. В нашем механизме синхронизации видно, что там их добавляется по десятку, если не больше, каждый день. Но так как они все невалидные, то робот это сразу определяет, без заливки, так что библиотекари их просто игнорируют.
Другое дело пользователь, стремящийся принести "пользу". Увидел, что там книга есть, а тут нет, раз и готово! А что уж там внутри, разбирайтесь сами.

Upd.

s_Sergius написал:
Это книги с litres’a, стянутые некой качалкой, но до ума не доведенные.

А какой именно? LitresDownloader вроде бы сейчас не актуален, вручную слишком долго и муторно, если только скрипт какой самописный использовать?
Поподробнее, пожалуйста, чем можно на данный момент корректно сграбить файл с литреса?
Корректно - это с сохранением всего текста, без потери пустых строк и разрывов абзацев, желательно с болдом и курсивом, ну и со сносками. Формирование адекватного fb2 не обязательно, это с "правильным" исходным материалом можно и вручную сделать.
Аватар пользователя s_Sergius

michhka написал:
s_Sergius написал:
Это книги с litres’a, стянутые некой качалкой, но до ума не доведенные.

А какой именно? LitresDownloader вроде бы сейчас не актуален, вручную слишком долго и муторно, если только скрипт какой самописный использовать?
Поподробнее, пожалуйста, чем можно на данный момент корректно сграбить файл с литреса?
Корректно - это с сохранением всего текста, без потери пустых строк и разрывов абзацев, желательно с болдом и курсивом, ну и со сносками. Формирование адекватного fb2 не обязательно, это с "правильным" исходным материалом можно и вручную сделать.

Да кто его знает, какой именно. В fb2 ничего не написано, а заливщики такой информацией не поделились.(
Аватар пользователя Isais

Как я понимаю по виду дескрипшна и боди этих файлов, есть минимум две разных качалки. Или одна, но по-разному настроенная. ХЗ.

А чё там невалидного? http://flibusta.net/b/358735/read с сайта прекрасно читается, да и дескрипшен оформлен, пе6ревод с русского на русский, ISBN даже есть, чё ещё надо?
Она точно невалидная?

Аватар пользователя s_Sergius

Zadd написал:
А чё там невалидного? http://flibusta.net/b/358735/read с сайта прекрасно читается, да и дескрипшен оформлен, пе6ревод с русского на русский, ISBN даже есть, чё ещё надо?
Она точно невалидная?

Это легко проверить любым валидатором. Или открыть его ради интереса в FBE.
Вопрос на засыпку: если fb2 содержит 64 заголовка <title>, то сколько в нем должно быть секций? Как минимум?

Zadd написал:
А чё там невалидного? http://flibusta.net/b/358735/read с сайта прекрасно читается, да и дескрипшен оформлен, пе6ревод с русского на русский, ISBN даже есть, чё ещё надо?
Она точно невалидная?

Точно. Разбивки на секции нет. Странно, что на сайте содержание книги показывает, кулридер его не видит, и не он один.

Сейчас samlib предлагает скачивание fb2. FBE текста не видит

Лом написал:
Сейчас samlib предлагает скачивание fb2. FBE текста не видит
Так вот откуда ветер дует…
Аватар пользователя remembecoventry

Лом написал:
Сейчас samlib предлагает скачивание fb2. FBE текста не видит

У самлибовских файлов отсебятинка в дескрипшен.
Самлибовский: <FictionBook xmlns="http://www.gribuser.ru/xml/fictionbook/2.1" xmlns:genre="http://www.gribuser.ru/xml/fictionbook/2.1/genres" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xs="http://www.w3.org/2001/XMLSchema">
Стоит поменять на стандартный — сразу всё чудесно открывается.
Стандартный: <FictionBook xmlns="http://www.gribuser.ru/xml/fictionbook/2.0" xmlns:l="http://www.w3.org/1999/xlink">

remembecoventry написал:
У самлибовских файлов отсебятинка в дескрипшен.
Самлибовский: <FictionBook xmlns="http://www.gribuser.ru/xml/fictionbook/2.1" xmlns:genre="http://www.gribuser.ru/xml/fictionbook/2.1/genres" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xs="http://www.w3.org/2001/XMLSchema">
Стоит поменять на стандартный — сразу всё чудесно открывается.
Стандартный: <FictionBook xmlns="http://www.gribuser.ru/xml/fictionbook/2.0" xmlns:l="http://www.w3.org/1999/xlink">
Вон оно как! Ну тогда это НЕ отсебятина, а глюк FBE. Фактически, самлибовские файлы получается, сделаны на более новый стандарт 2.1, в отличие FBE, который ссылается на стандарт 2.0.

AllexOld написал:
Zadd написал:
А чё там невалидного? http://flibusta.net/b/358735/read с сайта прекрасно читается, да и дескрипшен оформлен, пе6ревод с русского на русский, ISBN даже есть, чё ещё надо?
Она точно невалидная?

Точно. Разбивки на секции нет. Странно, что на сайте содержание книги показывает, кулридер его не видит, и не он один.


Самое забавное, что титлы прописаны, а секции нет, в FB editor книга выглядит вполне нормально, если не смотреть структуру документа, я даже не знал что так можно. На сайте при чтении считывается титл и визуально всё нормально, опять же и содержание...

А нельзя ли сделать, чтобы робот при попытке залить такое, на ходу пресекал?

X