Вы здесьНеполные файлы в формате txt
Опубликовано ср, 23/07/2008 - 13:11 пользователем foxm
Я скачиваю книги в формате txt (мне так удобнее). Но вот сейчас скачал Карамзина "История государства Российского" и обнаружил, что первые два тома:
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
DGOBLEK RE:Прошу переформатировать, распознать, etc... 1 час
DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 2 часа Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 14 часов Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 день konst1 RE:Ух, как я не люблю спамеров! 3 дня tvv RE:DNS 2 недели sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 3 недели larin RE:Заблокирован 1 месяц konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц fixel RE:Пропал абонемент 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 2 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 3 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 3 месяца tvv RE:faq brainstorm =) 3 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 3 месяца larin RE:абонемент не обновлен 3 месяца Впечатления о книгах
Олег Макаров. про Фаберже
02 05 Первые две книги серии читал с интересом, на третьей остановился Надоело. Постоянные описания «технологии изготовления» и рутина затмевают ту немногую движуху, которая всё-таки есть
Олег Макаров. про Шоу: Молодые львы [litres] (Классическая проза)
02 05 Очень хорошо написано. Глубокая вещь Но блин... Как же грустно Оценка: отлично!
Олег Макаров. про Старый: Наставникъ (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
02 05 Фуфло. Шовинизм, учитель истории, ненавидящий всех иностранцев и т.д. Z литература, хотя и другое время
Олег Макаров. про Алатова: Тетушка против [СИ] (Любовная фантастика, Самиздат, сетевая литература)
02 05 Слишком стилизована история под Лопе де Вегу или что-то такое. Неинтересно Оценка: плохо
Олег Макаров. про Ангел: Бессмертные [СИ] (Альтернативная история, Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
02 05 Очень безграмотно написано. Долго не вытерпеть Оценка: нечитаемо
Олег Макаров. про Тыналин: Криминалист (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература)
02 05 Очень очень очень занудно. Наверное так получается когда человек не умеет писать. хочет, старается, но не умеет Оценка: нечитаемо
Олег Макаров. про Назимов: Отставникъ (Альтернативная история, Фантастика: прочее, Самиздат, сетевая литература)
02 05 Нечитаемо: автор пишет историю в выдуманном мире чтобы не заморачиваться фактами но забывает о том что даже в выдуманном мире должна быть логика Ну и пишет откровенно слабо Оценка: нечитаемо
Олег Макаров. про Морале: Газонокосильщик (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
02 05 Ненене это ужасно Не читать его вообще больше Оценка: нечитаемо
Олег Макаров. про Парсиев: Корпорация попаданцев (Детективная фантастика, Юмор: прочее, Попаданцы, Самиздат, сетевая литература)
02 05 В начале неплохо, а потом становится как-то нелепо. не дочитал в итоге. Оценка: плохо
Олег Макаров. про Аянский: Аберрант. Пробуждение (Боевая фантастика, Постапокалипсис, Самиздат, сетевая литература)
02 05 Очень хорошо. И стиль, и идея и продуманность, и вообще всё на 5 баллов Оценка: отлично!
DGOBLEK про Йейтс: Кельтские сумерки: рассказы (Классическая проза, Мифы. Легенды. Эпос)
02 05 Огромное спасибо! Вот видно что мастер файл с руками которые растут откуда надо переводил в FB2, хорошо на 4, были бы интервалы в поэзии (строфные пробелы) после каждой 4 строки (несколько стихов таких) - тогда бы совсем идеал! ……… |
Комментарии
Отв: Неполные файлы в формате txt
Если я правильно понимаю, то книги в Либрусеке не хранятся в разных форматах. Скачать книги в txt можно в двух случаях:
1). Книга на Либрусеке лежит изначально в txt. Тогда возле неё будет линк "(скачать txt)" и не будет линка "(читать)".
2). Книга на Либрусеке лежит в fb2, возле неё линк "(читать)" и "(скачать)" , и только при скачивании выбирается формат txt из пулл-даун меню. Если не ошибаюсь, при этом txt генерируется из fb2 на лету неким скриптом-конвертером.
У Вас, как я понимаю, второй случай. Тогда подозрение падает не только на на простой "недокач", что нередко бывает, но и на скрипт-конвертер из fb2 в txt.
Для того чтобы убедиться, что проблема не в недокаче (оборванном посередине сенасе скачивания), а в конвертере, я бы на Вашем месте сделал так:
1. Скачал в txt одну и ту же (хранящуюся в fb2) книгу раз пять-шесть.
2. Если во всех случаях текст обрывается строго на одном и том же месте - на подозрении конвертер, надо писать Ларину.
3. Если текст обрывается на разных местах, то это, скорее всего, недокач. Ничем помочь не смогу...
Отв: Неполные файлы в формате txt
Думаю, что недокач тут ни при чем, потому что я скачивал все 12 томов СРАЗУ, выделив их галочкой и нажав кнопку "Выкачать все выбранное". Я так понимаю, что прим этом вся обработка идет на сервере, а мне отправляется архив из уже сформированных книг, который скачался нормально.
Если я понимаю это неправильно, готов попробовать, как Вы сказали...
Отв: Неполные файлы в формате txt
Оп-па... тогда да, Вы все правильно написали, всё происходит на сервере, значит это не недокач... значит, fb2-to-txt конвертер глючит. Я бы на Вашем месте завел тему в форуме "Функциональность", детально описал происходящее (обязательно указать какие именно книги и точную последовательность Ваших действий - для отлова бага Ларину непременно нужна воспроизводимость), а потом написал Ларину в личку с просьбой обратить внимание на этот багрепорт.
(подумав) Но, честно говоря, на мгновенную реакцию я бы не очень рассчитывал. Все-таки основной формат - это fb2... и он таки несравнимо удобнее, чем txt. В общем, я бы на Вашем месте подумал - а не перейти ли на fb2.
Отв: Неполные файлы в формате txt
Ещё может быть невалидный fb2. В некоторых случаях, когда непорядок с тегами <р>, книгу невозможно дочитать до конца (в онлайн-читалке).
Отв: Неполные файлы в формате txt
Возможно... хотя упомянутые А.А.Васильев История Византийской империи. Т.1 и Т.2
http://lib.rus.ec/b/74044
http://lib.rus.ec/b/74045
fb2 - валидны... по крайней мере по мнению FBE. Я как-то заметил, что файл на который FBI ругался, прошел валидацию в FBE. Бог его знает кто из них прав.
Отв: Неполные файлы в формате txt
IMHO, больше достоин доверия FBI.
Отв: Неполные файлы в формате txt
Проверил FBI-ем - тоже валидны, са-б-баки...
Отв: Причина найдена??
Если просмотреть фб2 файл в текстовом редакторе, то можно заметить, что текстовый файл заканчивается аккурат в том месте, где начинается кусок текста на греческом.
То есть, скрипт обламывается при поптытке вставить в txt юникодные символы.
Отв: Причина найдена??
О. Это уже очень хороший задел Ларину для поиска бага.
Отв: Причина найдена??
Точно, каждый из закаченных файлов обрывался на юникодовском символе.
А вот здесь 10501 закачалось полностью. Нет юникода - нет проблем.
Отв: Неполные файлы в формате txt
Вот сейчас обнаружил, что у А.А.Васильева История Византийской империи. Т.1 и Т.2
http://lib.rus.ec/b/74044
http://lib.rus.ec/b/74045
в формате txt тоже только кусок текста.
Отв: Неполные файлы в формате txt
О_о
У меня вообще не получается скачать txt, только fb2. Это глюк браузера?
Опера 9.24 (джаваскрипт - вкл)
Отв: Неполные файлы в формате txt
А у меня Опера 9.51. И в целом скачивается.
Отв: Неполные файлы в формате txt
Обновил версию.
Все - ок.
Текстовые файлики действительно какие-то мелкие.
26кб против 562кб у Византийской Империи.
=/
Отв: Неполные файлы в формате txt
почему можно помочь,
скачать книгу в fb2, а затем из неё сделать тхт
Отв: Неполные файлы в формате txt
Ну в данном конкретном случае я так и сделал, но хотелось бы обойтись без лишних телодвижений...
Отв: Неполные файлы в формате txt
Проверил на нескольких файлах разного размера и "валидности". Похоже, что редко закачивают в форматах отличных от фб, иначе бы давно заметили, что не один баг, а два.
Первый: текстовой файл обрезается во время подготовки файла. Остается 1/5 - 1/3 часть.
Второй: html генерируется полностью, только с тем же недостатком, что был раньше у читалки: открытый тег H3 остается незакрытым, поэтому весь текст идет как один большой заголовок.
Последнее проверил только на двух файлах, может на других все тип-топ.