Вы здесьПроверка валидности fb2-файла при загрузке ???
Опубликовано ср, 27/08/2008 - 05:42 пользователем Ghost mail
Forums: Сложно ли добавить автоматическую проверку валидности книг перед их загрузкой на сайт и "не пропускать" невалидные файлы ???
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
edvud RE:Подайте бедному копеечку на книжку с литреса... 4 часа
bmusanov Оплатил, но абонемент не отображается 1 день holla RE:Багрепорт - 2 2 дня sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 дня konst1 RE:Файнридер для Win11 5 дней larin RE:Оплатил, но абонемент не отображается 1 неделя sem14 RE:Книжная серия «Сlio» издательства "Евразия" 1 неделя Isais RE:Национальный конкурс на лучшее литературное произведение... 1 неделя Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 неделя sem14 RE:Современная корейская литература. Книжная серия... 1 неделя sem14 RE:«Морской роман» — книжная серия Калининградского книжного... 1 неделя larin RE:Оплатил,но абонемент не отображается 1 неделя sd RE:Fishing 2 недели Алексей111111111111 RE:Оплатила,но абонемент не отображается 2 недели sd RE:Доступ 27 2 недели kopak RE:Беженцы с Флибусты 2 недели Isais RE:Вадим Иванович Туманов - Всё потерять - и вновь начать с... 3 недели Isais RE:Семейственность в литературе 3 недели Впечатления о книгах
dolle про Мусаниф: Другие грабли. Том 3 [СИ] (Альтернативная история, Боевик, Попаданцы, Самиздат, сетевая литература)
05 08 Можно прочесть вбоквелл физрука. Можно и не читать , ничего не потеряете. Оценка: хорошо
дядя_Андрей про Азимов: Я люблю маленькую киску (Юмористическая фантастика)
04 08 А почему "морально устаревший"? Вполне милый рассказец в духе раннего Марка Твена. Главному герою, конечно нужно посочувствовать. Но не меньшее сочувствие вызывает и Киска. А в целом вполне читабельно и вызывает улыбку. Оценка: отлично!
decim про Азимов: Я люблю маленькую киску (Юмористическая фантастика)
04 08 Необязательный рассказец, морально устаревший лет уж 50 назад. Оценка: плохо
obivatel про Волшебник
04 08 Читабельно, ненапряжно, завлекательно. Причин развала страны масса, не указано ни одной, это типичная "окопная правда". Ну и пусть: это не историческая работа, я "благие пожелания автора из его окопа", я не против. С учетом ………
DiSp про Лорд Системы
03 08 Хорошая серия. Любителям почитать, как герои-попаданцы с нуля налаживают быт, а потом развивают себя и общество до высот, о которых сперва и мечтать не могли - самое то. Слог хороший, юморной. И нет излишней жести и жестокости. ГГ удаётся остаться человеком.
udrees про Лей: Инвазия 3 (Боевая фантастика, Ужасы, Фантастика: прочее, Самиздат, сетевая литература)
03 08 Наверное это завершение трилогии про новых ксеноморфов. Вторая книга растянулась на две части. Вот в этой книге автор описывает продолжение борьбы с монстрами. Получается плохо, несмотря на все технические навороты, наличие ……… Оценка: неплохо
udrees про Вальтер: Точка невозврата (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
03 08 Я так понял это завершение трилогии про Элпис. Мне казалось, что третья книга будет еще слабее чем вторая, но надо сказать, что получилось наоборот. Описания достаточно красочные, до самого конца сюжет кажется предсказуемым, ……… Оценка: хорошо
udrees про Михайлов: Ярость бога [повесть] (ЛитРПГ)
03 08 Прикольный рассказ из мира Вальдиры. Короткий, смешной, увлекательный. Оценка: хорошо
udrees про Михайлов: Кроу [СИ] (ЛитРПГ, Самиздат, сетевая литература)
03 08 Хорошо написанная книга в жанре литРПГ, не сильно перегруженная статами персонажа и эффектами от артефактов. Да и вообще в книге совсем мало боевых эпизодов и приключений, как ни странно. Можно даже сказать, что это симулятор ……… Оценка: хорошо
udrees про Варламова: С ума сойти! Путеводитель по психическим расстройствам для жителя большого города (Психология, Психотерапия и консультирование)
03 08 Хорошая книга, написанная популярным языком про основные психические заболевания, можно многое почерпнуть про самые различные состояния, какие у них симптомы, кому грозит «шиза» и как ее лечить. Из книги я узнал, что шизофрения ……… Оценка: хорошо
Barbud про Ланцов: Железный лев (Альтернативная история, Социальная фантастика, Попаданцы, Самиздат, сетевая литература)
02 08 Тетушки, в первой половине XIX века употребляющие названия "ацетон" и "серная кислота" - явный анахронизм, тогда эти вещества назывались по-другому. А так вообще - типичная махровая ланцовщина. ГГ круче каленых яиц, всяких ……… Оценка: плохо
mysevra про Блэквуд: Вендиго [сборник litres] (Ужасы, Фэнтези, Городское фэнтези)
02 08 Чувствуется несовременность текста: деликатность в описании, сдержанность и отсутствие показной кровожадности. Оценка: хорошо |
Отв: Проверка валидности fb2-файла при загрузке.
Сложно ли вам, Ghost mail, указать в своем сообщении утилиту для "проверки валидности" fb2, которую вы предлагаете ???
Отв: Проверка валидности fb2-файла при загрузке.
Однако, эти редакторы-утилиты для работы с командной строки, а нужна проверка на php, которая бы работала на веб-сервере перед загрузкой файла книги.
В-действительности, прежде всего этот вопрос нужно решить "политически" - нужно или не нужно 8-)
Мое личное мнение,- нужно. Лучше пусть будет немного меньше книг, но они будут "качественнее" (будут соответствовать стандарту FB2)
Отв: Проверка валидности fb2-файла при загрузке.
Предлагаете "прикрутить" FBE? Или fb2fix? :)
Идеально "валидных" fb2-файлов на сегодня не существует, как и программы, которая бы это определяла - и все благодаря "стандарту FB2". За работой скриптов приходится убирать вручную, валидность книги - определять "на глазок".
От "политического" решения ничего не изменится - кроме громких фраз: программа не появится, вычитка файлов не улучшится. Кроме того, найдя незакрытый тег в fb2-книге - гораздо легче его закрыть, чем брезгливо отбросить этот файл и отсканировать книгу по-новой.
Отв: Проверка валидности fb2-файла при загрузке ???
И файл может быть невалидным, но содержать полный текст, и другого в библиотеке может не быть. Невалидность мы поправим.
Отв: Проверка валидности fb2-файла при загрузке ???
Не пропускать невалидные файлы - это вряд ли реально нужно, а вот некая пометка, позволяющая невалидников обнаружить - не помешала бы.
Отв: Проверка валидности fb2-файла при загрузке ???
А кто-нибудь более-менее формально описать процедуру валидации может?
Разобрать XML, проверить возможность тэгов и словарно-кодируемых полей?
Всё?
Если всё, я в свой скрипт могу это добавить (XML-разбор там уже есть)...
Он, правда, не на ПХП, а на Питоне, но не думаю, что это нынче проблема для большинства хостингов.
Отв: Проверка валидности fb2-файла при загрузке ???
Формализовать процедуру "исправления" невалидного файла, чтобы он стал валидным, почти невозможно. Можно только пытаться проверять и исправлять набор часто встречаемых ошибок (как-то : неправильный порядок тегов 'title' и 'epigraph'; тег 'title' в середине текста; оформление стихов в тексте тегом 'epigraph' и так далее).
Однако задавая вопрос в теме топика я имел в виду : проверять валидность перед загрузкой на сервер и в случае ошибок,- сообщать пользователю об этом и не загружать невалидный файл. Подразумевается, что после этого пользователь потратит еще 1-2 минуту на исправление своего файла, и загрузит этот файл исправленным 8-)
Отв: Проверка валидности fb2-файла при загрузке ???
>тег 'title' в середине текста
А это из чего следует что невалидно? это допускает схема, и, более того, явно присуствует в примерах на fictionbook.org.
Это какой-то тогда не XML уже получается, а некий формат издалека напоминающий XML :-)
Отв: Проверка валидности fb2-файла при загрузке ???
title должно быть в начале секции. Это переводится как заголовок, если вы не в курсе. В середине секции title быть не может.
Правильно:
<section>
<title></title>
<p></p>
<p></p>
</section>
Не правильно:
<section>
<p></p>
<title></title>
<p></p>
</section>
Отв: Проверка валидности fb2-файла при загрузке ???
Отв: Проверка валидности fb2-файла при загрузке ???
Проверка валидности очень не помешала бы.
В некоторых файлах, (в них сказано что сделаны они в "LibRusEc kit") пометки, сноски, перевод разных понятий заключены в знаки < >,хотя по спецификации XML они должны быть в виде
< >
соответственно, также иногда попадается знак & (амперсанд) хотя и он должен быть написан не прямо, а специально вот так&
Из-за таких нарушений формата разметки XML некоторые файлы не возможно читать программами которые четко следуют спецификации XML
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Проверка валидности при загрузке fb2-файлов от автора "LibRusEc kit" - хорошая шутка, спасибо :)
Если серьезно - дайте ссылки на книги, а еще лучше - давайте исправим их вместе.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Я могу сгенерить список. Только, боюсь, в нем будет несколько десятков тысяч (не несколько тысяч, а несколько десятков тысяч) книг. И што мы будем с ими делать?
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Точнее, 47 642 : http://lib.rus.ec/stat/document-author .
Проверить на другие варианты файла - скачать - открыть - поиск символов с автозаменой - сохранить - залить на Либрусек.
repeat
Всего по 23 821 на рыло.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
:) Да, рыла могут треснуть.
На самом деле немножко меньше: у меня готовятся что-то в районе четырех тысяч книг с Алдебарана/Литреса, которые будут заменой Либрусек-Киту. Но пока никак не приспособлюсь чтобы залить их без ручных разборок с дублями... :((
С другой стороны - супротив 47-ми тысяч оно не то чтобы совсем уж мертвому припарки... но и ненамного больше.