вычитка #4 (2009-II)

Аватар пользователя soshial
архив: 1. 2008-I 2. 2008-II — 2009-I 3. 2009-II 4. 2009-II (эта тема) таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA .

Прошу прощения за оффтоп, но что-то не сообразил хмурым утром куда правильнее тиснуть багрепорт: эта книга не скачивается в FB2, приходит пустой архив.

http://lib.rus.ec/b/146991

Аватар пользователя golma1

Постить сюда - http://lib.rus.ec/node/128849.
Архив у меня скачался полностью.

Аватар пользователя golma1

Уважаемые желающие поучаствовать в проекте "Вычитка"!

Тем, кто не знаком с форматом fb2, рекомендую вначале заглянуть в эту книгу. Здесь в популярной форме даются описания и разъяснения основных моментов этого формата. Если вдруг что-то окажется непонятным, всегда можно обратиться с вопросом в форум, вам обязательно помогут. Нужные для работы с fb2-файлами программы вы найдёте здесь.

Книги, сделанные в fb2 и нуждающиеся в вычитке, следует и вычитывать в этом формате. При конвертировании файла в текстовый формат неизбежно теряются ценные детали форматирования, восстановить которые впоследствии если и возможно, то очень трудоёмко.

Под вычиткой подразумевается:
1. Исправление ошибок OCR.
2. Форматирование текста:
- разбиение текста на части, главы, подглавы (секции и вложенные секции, тэги title и subtitle)
- выделение жирным и наклонным шрифтом (тэги strong и emphasis)
- проставление разделений в тексте (тэг empty-line)
- проверка скриптами
3. Заполнение дескриптора (обложка, аннотация, выходные данные книги)
4. При необходимости конвертирование в fb2-формат.

Для вычитки можно пользоваться читалкой AlReader Vobis Edition или редактором FictionBookEditor. Ссылки на обе программы были даны выше.
В самом крайнем случае, файл fb2 можно открыть текстовым редактором, сохраняя при этом все тэги. В этом случае, если изменения вносятся только в текст, форматирование сохраняется.

Убедительная просьба - не конвертировать fb2-файлы в текстовый формат. Не забывайте, что fb2 является предпочтительным форматом нашей библиотеки и книги следует заливать, по возможности, в нём. И уж во всяком случае, не стоит заменять формат fb2 другим форматом.

Если почему-то вам не хочется разбираться в формате fb2, берите на вычитку книги, представленные в библиотеке в текстовом формате. Их можно заливать в том виде, в каком вы их скачали.
Также можно брать файлы в форматах djvu или pdf и распознать их в текстовый формат. Однако это касается преимущественно художественной литературы, т.е. произведений, состоящих в основном из текста. Книги с множеством иллюстраций, таблиц, формул лучше оставить в том виде, в каком они есть.

Если я что-то упустила или невнятно сформулировала, спрашивайте. :)

Аватар пользователя soshial

хорошие вводные слова.
ещё бы объяснить, что такое вычитка)
чуть доработать текст, и я буду вставлять его в каждую новую тему о вычитке)

Аватар пользователя golma1

Я добавила о вычитке. Если считаешь, что всё ОК, внеси этот текст в первый постинг, а остальные можно удалить. ;)

Аватар пользователя fantazёrka

Фридрих Август фон Хайек "Индивидуализм" - вычитано, куда заливать?

Аватар пользователя golma1

fantazёrka написал:
Фридрих Август фон Хайек "Индивидуализм" - вычитано, куда заливать?

Подождите немного или пришлите на почту библиотекарей bibliotekar.librusec (][) gmail.com.

Я читаю на смартфоне.
Соответственно, только rtf и без картинок.
Рука автоматически правит ошибки ocr и т.д.
Но правленый текст в rtf никому не нужен?

Аватар пользователя Tanja45

Глеб Бузало написал:
Я читаю на смартфоне.
Соответственно, только rtf и без картинок.
Рука автоматически правит ошибки ocr и т.д.
Но правленый текст в rtf никому не нужен?

Если текст был до того в FB2, то его опять нужно будет переводить из RTF обратно - это довольно заморочно, только если уж очень много ошибок, имеет смысл это делать.:(
А если он и был в библиотеке в RTF, то очень даже нужен - все равно конвертировать.

Хотела бы помочь с вычиткой книги "Обзор Ветхого Завета" (http://lib.rus.ec/b/139286) Книгу скачала, fb2 редактор тоже. Но не совсем ясно, что означает в данном случае фраза из гугл-дока "сравнить с оригиналом и тщательно вычитать, добавляя пропущенный текст". Где находится оригинал - по вышеприведенной линке? Пишите! Как только разберусь - поставлю соответствующую отметку в документе о том, что начата вычитка.
Спасибо :)

Аватар пользователя Zoycha

Здравствуйте!
У меня есть несколько вычитанных книг - вычитывала для себя, не претендуя на общественное признание. Просто ужасно не люблю читать неаккуратный «расхристанный» текст. А потом подумала, что добро зря пропадает.
Вас это может заинтересовать?

Зоя.

Аватар пользователя golma1

Zoycha написал:
Здравствуйте!
У меня есть несколько вычитанных книг - вычитывала для себя, не претендуя на общественное признание. Просто ужасно не люблю читать неаккуратный «расхристанный» текст. А потом подумала, что добро зря пропадает.
Вас это может заинтересовать?

Может заинтересовать. :)
В каком виде находятся вычитанные Вами книги? Если в fb2, то нет вопросов: заливайте или присылайте библиотекарям.
Если в другом варианте, а на сайте есть fb2, то надо смотреть каждую книгу - насколько значительны изменения.

Аватар пользователя Zoycha

FB2.
A кому присылать, куда заливать? Не хочется плодить лишние сущности.

Аватар пользователя golma1

Zoycha написал:
FB2.
A кому присылать, куда заливать? Не хочется плодить лишние сущности.

На странице редактирования книги внизу есть линк "заменить на другую версию". Воспользуйтесь им. (Кстати, не забудьте в fb2 увеличить версию на 0.1).
После заливки, если предыдущая книга автоматически не заменилась, воспользуйтесь там же линком "объединить с другой книгой". Очень важно не просто удалить предыдущий вариант, а заменить его.
Попробуйте на одной какой-то книге, если не получится, сообщите о проблеме. :)
Аватар пользователя Zoycha

Попробовала на одной книге и сообщаю о проблеме :)))
Загрузка валится где-то в середине процесса.

Аватар пользователя golma1

Zoycha написал:
Попробовала на одной книге и сообщаю о проблеме :)))
Загрузка валится где-то в середине процесса.

Расскажите чуть подробнее. ;)

Что за книга, какого размера?

Аватар пользователя Zoycha

Эммануил Казакевич. Весна на Одере. :)))
Размер FB2 файла 851 кВ. Размер zip-архива 340 кВ.
В общем ничего экстраординарного :)))
Я понимаю, что эта книга не самый хит сезона :))), но как я уже говорила, я вычитывала ее для себя - вдруг захотелось перечитать такую древность :)))

Аватар пользователя golma1

Zoycha написал:
Эммануил Казакевич. Весна на Одере. :)))
Размер FB2 файла 851 кВ. Размер zip-архива 340 кВ.

Попробуйте залить на этой страничке: http://lib.rus.ec/a/17897 (Эммануил Казакевич - алиас).
И попробуйте не паковать файл, а заливать сразу fb2.

Сначала попробуйте здесь http://lib.rus.ec/b/26161/edit выбрать "заменить на другую версию".
Если почему-то не получится, попробуйте залить здесь: http://lib.rus.ec/a/17897/addbook/. Книги должны объединиться автоматически. Если нет, будем дальше думать. :)

Аватар пользователя Zoycha

Сейчас попробовала залить с работы. Ситуация несколько изменилась :)
Теперь я получаю вот такой экран ошибок:

Вы уверены что это FB2? Fatal Error 76: Opening and ending tag mismatch: document-info line 4 and id in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4 Fatal Error 76: Opening and ending tag mismatch: description line 3 and history in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4 Fatal Error 76: Opening and ending tag mismatch: FictionBook line 2 and document-info in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4 Fatal Error 5: Extra content at the end of the document in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4 Найдены ошибки! Error 1872: The document has no document element. on line 0 Плохой, негодный файл Файл прошел валидацию в FictionBook Editor и в fb2validator из fb2utils-0.6.0.

Аватар пользователя golma1

Zoycha написал:
Сейчас попробовала залить с работы. Ситуация несколько изменилась :)

Пришлите мне файл на мэйл. Адрес сообщу Вам в личку.
Мы его всё равно зальём. ;)
Аватар пользователя golma1

golma1 написал:

Мы его всё равно зальём. ;)

Хммм... Не получилось.
Ошибки:

Цитата:
Fatal Error 76: Opening and ending tag mismatch: document-info line 4 and id in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4
Fatal Error 76: Opening and ending tag mismatch: description line 3 and history in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4
Fatal Error 76: Opening and ending tag mismatch: FictionBook line 2 and document-info in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4
Fatal Error 5: Extra content at the end of the document in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4
Найдены ошибки!
Error 1872: The document has no document element. on line 0

Просмотрела все тэги, всё, вроде, на месте. FBI ошибок тоже не находит.
Для желающих посмотреть файл и найти ошибки:
http://rapidshare.com/files/320224468/Kazakevich_Vesna_na_Odere.26161.fb2.html

Исправил - http://lib.rus.ec/b/176122

Аватар пользователя golma1

Алексей_Н написал:
Исправил - http://lib.rus.ec/b/176122

Спасибо.
Но интересно знать, в чём там было дело.

Честно скажу, не до конца и сам понял. В FBE файл признавался как валидный. Но поскольку валидатор Либрусека сопротивлялся, начал файл перекраивать. После заливки версии 1.2, вдруг обнаружилось, что некорректно проставлены сноски.
По-моему, это проделки FBTools, с помощью которого был сделан fb2.

Аватар пользователя Zoycha

Алексей_Н написал:
=По-моему, это проделки FBTools, с помощью которого был сделан fb2.

Не-а... В оригинальном fb2 файле сносок не было вообще :))) Я их ручками расставляла. Так что может что-то и накосячила :))), хотя читалка все воспринимала нормально.

А вообще - большое спасибо за помощь. Это был мой первый блин, и что-то он оказался уж очень комом :(((

Аватар пользователя golma1

Zoycha написал:
Это был мой первый блин, и что-то он оказался уж очень комом :(((

Не давайте себя сбить с толку. ;) Вы сделали отличный файл. А глюки у каждого бывают.
Кроме того, с нашими знатоками Вы не пропадёте. :)))
Аватар пользователя Zoycha

Перезалила «Дом на площади». На этот раз получилось с первого раза :)
В общем, процесс пошел. :) У меня еще мноооооооооооооого чего завалялось :)

Аватар пользователя Tanja45

Zoycha написал:
Перезалила «Дом на площади». На этот раз получилось с первого раза :)
В общем, процесс пошел. :) У меня еще мноооооооооооооого чего завалялось :)
Вы - молодец, Zoycha! Так держать!
Аватар пользователя Tanja45

golma1 написал:
Для желающих посмотреть файл и найти ошибки:
http://rapidshare.com/files/320224468/Kazakevich_Vesna_na_Odere.26161.fb2.html

Цитата:
You want to download the following file:
http://rapidshare.com/files/320224468/Kazakevich_Vesna_na_Odere.26161.fb2 | 1538 KB

This file can only be downloaded by becoming a Premium member

There are no more download slots available for free users right now. If you don't want to become a premium member, you might want to try again later.

Аватар пользователя golma1

Tanja45 написал:

This file can only be downloaded by becoming a Premium member

Очень странно. :-о
Аватар пользователя s_Sergius

Zoycha написал:
Файл прошел валидацию в FictionBook Editor и в fb2validator из fb2utils-0.6.0.

А вы заливаете fb2 или zip?
Подобные сообщения у меня были когда у архива тип ZIP был написан большими буквами, если же исправить на zip, то всё проходило нормально.

Аватар пользователя Zoycha

Я заливала fb2.
Мне уже помогли залить этот первый блин :)
Там была какая-то проблема со сносками, как выяснилось.
Но в любом случае большое спасибо за желание помочь :)

Аватар пользователя LS0905

Не понимаю, как можно поправить название и номер серии. При попытке добавить серию - сообщение: "слишком много вариантов", ранообразные варианты ввода имели тот же результат. Номер книги в серии поправить можно, но кнопки "сохранить" не вижу. Подскажите пожалуйста, как это сделать (систематизирую свою библиотеку, заодно бы и всем пользу принесла), не перезаливать же из-за такой ерунды.

Аватар пользователя Ronja_Rovardotter

Чтобы разговор был более предметным - какой сериал и куда именно вы хотите добавить?

Аватар пользователя LS0905

Сахаров Андрей Николаевич - Александр III (серия: Романовы. Династия в романах № 12 ) - это только в качестве примера.

Аватар пользователя Ronja_Rovardotter

Если серия уже есть (как в вашем случае), то сначала нажимаете линк "удалить", а потом заново прописываете название сериала и номер - кнопку сохранить тоже увидите.

апд А вы уверены в номере? В серии под №12 значится "Петр III".

Аватар пользователя LS0905

Спасибо, попробую. Номер у этой книги 19, прошу прощения за опечатку.

Уважаемые господа!
У меня есть книга известного писателя Владимира Короткевича. Но она в виде вордовских файлов по главам. Можно ли выслать куда нибудь эти файлы, чтобы умные люди сделали из них нормальную книгу FB2, а то я далек от программирования и т.п. А книга безумно интересная и поистине гениальная "Колосья под серпом твоим".

Ответьте мне, лучше в личку. Извините, если это глупый вопрос

Аватар пользователя golma1

crum написал:
Уважаемые господа!
У меня есть книга известного писателя Владимира Короткевича. Но она в виде вордовских файлов по главам. Можно ли выслать куда нибудь эти файлы, чтобы умные люди сделали из них нормальную книгу FB2, а то я далек от программирования и т.п. А книга безумно интересная и поистине гениальная "Колосья под серпом твоим".
Ответьте мне, лучше в личку. Извините, если это глупый вопрос

Нормальный вопрос. :)
Соберите главы в один файл и выложите в формате doc. Кто-нибудь обязательно переконвертирует.

Аватар пользователя botsad

Можете скачать наши две книги про БОТАНИЧЕСКИЙ САД (http://bogard.isu.ru/books/bgisu_resources_2005.pdf) и про САДОВУЮ ТЕРАПИЮ (http://bogard.isu.ru/books/ht_2006.pdf).

1) Кузеванов В.Я., Сизых С.В. Ресурсы Ботанического сада Иркутского государственного университета: научные, образовательные и социально-экологические аспекты. Иркутск: Изд-во Ирк. гос. ун-та, 2005.- 243 с. (на русском языке)
http://bogard.isu.ru/books/bgisu_resources_2005.pdf (5 Mb, полная электронная русская версия)

2) Сизых С.В., Кузеванов В.Я., Белозерская С.И., Песков В.П.
Садовая терапия: Использование ресурсов ботанического сада для социальной адаптации и реабилитации. Справочно-методическое пособие. Иркутск: Изд-во Ирк. гос. ун-та, 2006.- 48 с. (на русском языке)
http://bogard.isu.ru/books/ht_2006.pdf (2 Mb)

Автор

Народ, у меня есть архив библиотеки в текстовом формате (происхождение точно неизвестно, где то слил с какого-то сюдюка). В ней множество книг, думаю многие из них отсутствуют в библиотеки и представляют интерес. Но как уже говорил - недостаток, это обычный TXT (в koi-8). Я так понимаю тут много энтузиастов, готовых взяться за достойное оформление книг в FB2 (я к сожалению не распологаю достаточным временем и опытом для этого). Объем архива - около 10 гб в распакованном виде, 2 гб - в архиве RAR.

Вот тут - http://azlab.org/download/list.rar

лежит список ПАПОК присутствующих в архивах. Имена папок в основном - это фамилии авторов, внутри каждой папки куча TXT (в иных, десятки тысяч файлов). Если кого то интересует, маякните на почту или в личку, выложу на сайт (частями). Архивы - разбиты по буквам (то есть, в архиве "А" - авторы на букву "А")

мдя... у меня электронная библиотека около гигабайта - файлы в архивированном виде. Часть разобрана пофамильно. Читаю при помощи программы ice book reader - читает почти все (не сочтите за рекламу, пожалуйста). С кем делиться? :-)

Аватар пользователя TaF

Хотел взять на вычитку А.Розова "Чужая в чужом море", но файл http://lib.rus.ec/b/159006 8.08.2009 г. заменен на http://lib.rus.ec/b/160984. Как он по качеству? Может быть уже вычитан?
Ведь объем у него 4771К,а это немало... Если что-то из фантастики появится на вычитку, напишите в личку...

Прошу прощения, если обращаюсь не по адресу (где лучше спросить, в таком случае?).
Пробую сконвертировать книгу из pdf в fb2.
В pdf файле внизу каждой страницы - номер страницы и заголовок главы.
Есть ли способ автоматом их убрать в процессе конвертации или только вручную?

Аватар пользователя rr3

azcore написал:
Прошу прощения, если обращаюсь не по адресу (где лучше спросить, в таком случае?).
Пробую сконвертировать книгу из pdf в fb2.
В pdf файле внизу каждой страницы - номер страницы и заголовок главы.
Есть ли способ автоматом их убрать в процессе конвертации или только вручную?

Есть. Настройте шаблоном размер "область распознавания текста" в FR таким образом, чтобы номер страницы и заголовок главы в эту область не попадали. Перед применением проверьте правильность "подхвата текста" на нескольких страницах из разный частей книги.

Если будете использовать что-то вроде abby pdf transformer - после сохранения в doc уберите нижний колонитул на всех страницах.

Спасибо!

Основная проблема была в том, что я не знал, что это называется колонтитулы. :)
В finereader нашёл даже опцию - сохранять без колонтитулов.

Начал вычитку книги Роулинг "Гарри Поттер и Дары смерти"

У Розова неправильно оформлен цикл "Конфедерация Меганезия" (http://lib.rus.ec/s/4494), перепутаны вторая и третья книги. То есть, "Созвездие Эректуса" - это вторая книга. Поправьте, пожалуйста, кто знает как. Я что-то не нашел, как можно править циклы...

Да, по поводу поста TaF. Я читаю "Чужую в чужом море" и по ходу - правлю. А что касается того, что их две - это надо связь разорвать, но я этого делать не рискну, лучше бы это сделал тот, кто исправлял или библиотекари...

Аватар пользователя Trinki

А кто занимается вычиткой серии "Сто великих"? Могу я взять на вычитку "100 великих книг" http://lib.rus.ec/b/126346 ? Хочу прочитать книжку с пользой для общества :)

Аватар пользователя golma1

Trinki написал:
А кто занимается вычиткой серии "Сто великих"? Могу я взять на вычитку "100 великих книг" http://lib.rus.ec/b/126346 ? Хочу прочитать книжку с пользой для общества :)

Конечно, берите. Только замените "требует вычитки" на "вычитывается". ;)
А можете после этого сконвертировать в fb2?

Страницы

X