Вы здесьНеправильные книги
Опубликовано пн, 30/03/2009 - 21:01 пользователем Marked
Решил вот заменить свою библиотеку, скачанную оттуда-отсюда, на fb2 файлы... Смотрю на Либрусеке (по алфавиту, как у меня книги в папках лежат): Айзек Азимов "Тупик". Здесь вместо него лежит рассказ Генри Каттнера "Порочный круг". Следующая папка - Кевин Андерсон, серия "Сага Семи Солнц". Первые две книги здесь на либрусеке поменяны местами. (названия правильные, текст неправильный). Эта ошибка распространенная, так как в астовском издании в серии "Золотая библиотека фантастики" они тоже поменяны местами. На фензине, кстати, лежит аналогично... Следующая книга Пол Андерсон "Орион взойдет". Скачал, открываю - там только "от автора" и полторы строчки текста... и все.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
nehug@cheaphub.net RE:DNS 17 часов
нэнси RE:Подайте бедному копеечку на книжку с литреса... 18 часов Dead_Space RE:Беженцы с Флибусты 1 день Саша из Киева RE:Приключения белочки Рыжки 2 недели alex-from RE:Оплатил два раза, но абонемента нет 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 недели Kiesza RE:На 78-м году жизни скончался советский и российский... 2 недели Paul von Sokolovski RE:Бушков умер. 3 недели lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 4 недели mig2009 RE:Багрепорт - 2 1 месяц Isais RE:Издательство "Медуза" 1 месяц babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 1 месяц Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 месяц sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц Isais RE:Игорь Северянин - Том 2. Поэзоантракт 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц sem14 RE:Семейственность в литературе 1 неделя Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 2 месяца Впечатления о книгах
su24i про Поселягин: Кровь Архов. Книга первая [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
20 11 Лютая поселягинщина. Сдался после 80-й страницы. Оценка: нечитаемо
Лысенко Владимир Андреевич про Москаленко: Юный бастард. Книга 5 [СИ] (Боевая фантастика, Фэнтези, Самиздат, сетевая литература)
20 11 Очень хорошая книга. Жду продолжения. Оценка: отлично!
Дей про Останин: Жнец [СИ] (Детективная фантастика, Юмористическая фантастика, Городское фэнтези, Самиздат, сетевая литература)
19 11 Очень неплохо. Жаль, что автор не настроен на продолжение. Оценка: отлично!
Олег Макаров. про Земляной: Волшебник [СИ] (Альтернативная история, Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
18 11 Полная непонимание автором проблем и причин развала советского союза. Глубочайшая экономическая безграмотность Возможно дальше будет интересно но я бросил в самом начале Оценка: нечитаемо
Анни-Мари про Петросян: Дом, в котором... (Современная проза, Магический реализм)
18 11 Книга странная. Необычная и ни на что не похожая. Собственно, хоть какие-то параллели я лично смогла провести только с книгой "Мастер и Маргарита". И вовсе не потому, что они похожи. Просто в обеих книгах присутствует то, ………
Лысенко Владимир Андреевич про Богдашов: Реинкарнация архимага 3 (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
18 11 Прочитал все книги серии, написано неплохо. Оценка: хорошо
Nicout про Резанова: Чудо и чудовище (Историческое фэнтези)
18 11 дурацкий знак качества" Давно, во времена совка, прошел международный конгресс детективов. Утром выясняется, что около кровати председателя конгресса кто-то насрал. Начинают допрашивать делегации. Французы говорят - это ………
alexk про Резанова: Чудо и чудовище (Историческое фэнтези)
18 11 дурацкий знак качества и мания величия isais, ничего не поправить, ничего не дополнить
mazay про Arladaar
18 11 Жеке сегодня, как минимум, под 70. Так что Аня могла бы быть Жекиной внучкой. Тем более, что писал, всё-таки, мужчина. Или диктовал!
Олег Макаров. про Максимушкин: Бомбардировщики (Альтернативная история)
17 11 строители коммунизма и последователи национал-социализма решили объединиться" ... вот это аттракицон срывания всех и всяческих масок Удивительно, что автор не привлечён до сих пор ни по какой статье
mysevra про Панов: Яр(к)ость [litres] (Социальная фантастика)
17 11 Хорошо, но преследует ощущение, что это компиляция старых текстов и идей, вплоть до того, что начинаешь заранее узнавать ещё не прочитанные диалоги и сюжетные повороты. Продолжение не заинтересовало. Оценка: хорошо |
Комментарии
Отв: Неправильные книги
НЕ СКАЧИВАЙТЕ КНИГИ-FB2 В ФОРМАТЕ TXT !!!
Отв: Неправильные книги
Интересно... А зачем тогда в выпадающем списке есть txt? Для красоты? Или "шоб было"?
...Не поверю, что из fb2 так трудно сделать текст автоматом.
Отв: Неправильные книги
Сделать нетрудно.
Текущий конвертор использует встроенный в пых парсер XML, который молча падает на любой ошибке.
Всё никак не соберусь переписать.
Отв: Неправильные книги
А-а. Так вот оно почему не стреляет - не заряжено...
Илья, я вскоре всё равно для одной затеи буду писать на Перле "извлекатель текста из fb2". Без парсера, конечно. Если тебя Перл устроит, можно будет сделать перловую тхт-конвертилку.
Отв: Неправильные книги
Лучше бы перловую xml-проверялку, а в идеале и чинилку.
Глянь parcer.inc, туда встроить внешнюю утилиту будет непросто.
Отв: Неправильные книги
Не, это я точно не потяну :(
Отв: Неправильные книги
Эээ... не замечал. Но в принципе - могу помочь. К тому же - в PHP больше одного xml-парсера.
Другой путь получения txt - выбросить всю разметку регулярным выражением.
Отв: Неправильные книги
Перловому можно сказать, что ошибки XML нужно игнорировать.
Есть ли такое решение для пыха? Если есть - это было бы идеально, мне проще поменять парсер, чем писать его самому.
Получение txt - побочный результат.
Основные задачи, решаемые парсером:
1. Вытаскивание оглавления и обложки
2. Онлайн-чтение
3. Генерация html для выкачки
4. Генерация txt.
Отв: Неправильные книги
Я скачивал в формате fb2 :) А также открывал онлайн. Одинаково - только одна строчка...
Отв: Неправильные книги
Файл книги "Орион взойдет" - 1082 K. Это при том, что он текстовый, без обложки, иллюстраций и прочих изображений. Подумайте, могут ли полторы строчки текста весить больше мегабайта? Откройте в любом текстовом редакторе, включая "блокнот" - и убедитесь в том, что кроме второй строчки текста есть и третья.
Невалидный, с точки зрения fb2, символ в 42-й строке файла - это, согласитесь, отличается от неполного текста книги.
Отв: Неправильные книги
Правильно, а также с точки зрения программ, fb2 читающих...
Отв: Неправильные книги
Насчет текста - скачивается зип размером 1.22 Кбайта. Почему - Ларин уже ответил, "недостаток конструкции", как говорили в известном фильме :)
Но зип с fb2 скачивается вполне "нормальный" - размером 460 Кбайт. Хотя... Его действительно не могут открыть FBReader и CoolReader, но AlReader все же открывает. Что-то не так...
Отв: Неправильные книги
В данном случае - да, файл полный. Однако нормально его прочитать проблематично. Тот кто делал файл, видимо, не осознал, что теги <> - зарезервированы в XML. В файле в галочки выделены комментарии переводчика. Отсюда и ошибки при открытии - программы думают, что это тег. В любом случае - это ошибка, просто другая. Так что все равно нужно проверять, что создается и заливается...
Отв: Неправильные книги
Файл сделан с помощью LibRusEc kit. Все претензии к злобному тупому компьютеру :)
Отв: Неправильные книги
Ну, тогда уж к программисту. Надо учесть знаки <> в исходном файле (если не html/xml) и заменять их при конвертации на другие скобки... Попробую заменить скобки вручную и перезалить...
Отв: Неправильные книги
Может, кто и Агатой Кристи займется? У нее в половине книг используются знаки <>...
Отв: Неправильные книги
Точно не я, у меня к детективам весьма негативное отношение(кроме Маклина). Вот фантастика и фэнтези - это пожалуйста...
Отв: Неправильные книги
Потихоньку делаю, но никак не соберусь сделать всё и сразу...
Отв: Неправильные книги
Сделал больше половины файла "ориона", а тут уже выложили нормальную версию... Вот так вот, хочешь сделать, а все равно не дадут. В следующий раз промолчу :)
Отв: Неправильные книги
Конечно, это обидно. Но если бы Вы в названии файла, который взялись починять, добавили бы слово "правка" или "вычитка", то вероятность пересечения с кем-либо еще все таки сильно уменьшилась бы.
Отв: Неправильные книги
Гм, не знал, не знал...
Отв: Неправильные книги
Можно попробывать прогнать тексты через FB2Fix. Большая часть невалидных файлов исправляется, правда я не уверен, что он что либо важное в структуре документа не гробит.
Отв: Неправильные книги
Не гробит. У rusec-файлов нет структуры. У других файлов правда тоже не гробит ;) Оччень полезная программка.
Отв: Неправильные книги
Попробовал на старой версии "Ориона" - действительно помогло. Правда, программка консольная (по крайней мере та версия, что я скачал). Кстати, в той версии файла, что там появился, нет этих самых примечаний переводчика. Хотя в плане разметки она лучше. Думаю, стоит выложить рядом еще одну версию.