Вычитка #5 (2010-I)

Теперь главная тема по вычитке здесь.

Архив тем:
1. 2008-I
2. 2008-II — 2009-I
3. 2009-II
4. 2009-III

таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA

Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: Книги из этого списка нуждаются в доработке: форматировании и вычитке.

Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе.

Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования.

Присоединяйтесь к нам! :)
Обращение golma1'ы:

golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"!

Тем, кто не знаком с форматом fb2, рекомендую вначале заглянуть в эту книгу. Здесь в популярной форме даются описания и разъяснения основных моментов этого формата. Если вдруг что-то окажется непонятным, всегда можно обратиться с вопросом в форум, вам обязательно помогут. Нужные для работы с fb2-файлами программы вы найдёте здесь.

Книги, сделанные в fb2 и нуждающиеся в вычитке, следует и вычитывать в этом формате. При конвертировании файла в текстовый формат неизбежно теряются ценные детали форматирования, восстановить которые впоследствии если и возможно, то очень трудоёмко.

Под вычиткой подразумевается:
1. Исправление ошибок OCR.
2. Форматирование текста:
- разбиение текста на части, главы, подглавы (секции и вложенные секции, тэги title и subtitle)
- выделение жирным и наклонным шрифтом (тэги strong и emphasis)
- проставление разделений в тексте (тэг empty-line)
- проверка скриптами
3. Заполнение дескриптора (обложка, аннотация, выходные данные книги)
4. При необходимости конвертирование в fb2-формат.

Для вычитки можно пользоваться читалкой AlReader Vobis Edition или редактором FictionBookEditor. Ссылки на обе программы были даны выше.
В самом крайнем случае, файл fb2 можно открыть текстовым редактором, сохраняя при этом все тэги. В этом случае, если изменения вносятся только в текст, форматирование сохраняется.

Убедительная просьба - не конвертировать fb2-файлы в текстовый формат. Не забывайте, что fb2 является предпочтительным форматом нашей библиотеки и книги следует заливать, по возможности, в нём. И уж во всяком случае, не стоит заменять формат fb2 другим форматом.

Если почему-то вам не хочется разбираться в формате fb2, берите на вычитку книги, представленные в библиотеке в текстовом формате. Их можно заливать в том виде, в каком вы их скачали.
Также можно брать файлы в форматах djvu или pdf и распознать их в текстовый формат. Однако это касается преимущественно художественной литературы, т.е. произведений, состоящих в основном из текста. Книги с множеством иллюстраций, таблиц, формул лучше оставить в том виде, в каком они есть.

Если я что-то упустила или невнятно сформулировала, спрашивайте. :)

Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
Они помогут Вам разобраться в пользовании самой распространённой программой FBE.
Всем привет! :)

Алексей_Н написал:
Цитата:
В бумажном варианте было проще - там эта часть книги просто дается уменьшенным шрифтом.

Уменьшенный шрифт можно делать при помощи тегов sub или sup.
А вот этого не надо! Смотрится мерзко. Оставить цитатой, а если сильно хочется, чтобы было именно уменьшено, - использовать stylesheet. Пример - ну хотя бы вот тут, если интересно подробнее - прошу ко мне в личку.

Цитата:
Смотрится мерзко.

И в чем мерзость?..
Всё зависит от читалки: какие-то вообще проигнорируют, в каких-то смотрится вполне прилично.

Алексей_Н написал:
Цитата:
Смотрится мерзко.

И в чем мерзость?..
Строки широкие, буквы маленькие и вплотную прижаты к предыдущему или следующему абзацу. И конвертировать его потом будет ооооочень приятно. А уж если в выделенном таким манером тексте будут ещё и свои верхние/нижние индексы - то вааще.
Я б так не делал бы. Если речь идёт про то, чтобы книга выглядела, то CSS как раз для этого.

Это какой вы читалкой пользуетесь? Сколько таких текстов встречал, нигде ничего подобного не видел.

Алексей_Н написал:
Это какой вы читалкой пользуетесь?
Прошу прощения, но из контекста непонятно, к кому и о чём вопрос, но можно предположить, что ко мне (а "древовидным списком" не пользуюсь по техническим причинам - где-то что-то на шлюзе в локалку не так фильтруется, и "древовидный" режется :-( ).
CoolReader 3 на LBook V3. Ну, и FBE2, если приходится править. CR3 понимает CSS, FBE2 - нет.
Алексей_Н написал:
Сколько таких текстов встречал, нигде ничего подобного не видел.
Нуу... ИМХО одна из основных нехорошестей FB2 - то, что тэги структурирования книги (которые нужны для описания предназначения фрагмента и внешний вид читатель волен назначать сам: цитаты, заголовки, стихи, эпиграфы с подписями... те же верхние и нижние индексы) смешаны с тэгами отображения (курсив, жирность, зачёркнутость (ИМХО нафиг никому не нужная - а подчёркивания и разрядки нет :-( ) плюс, натурально, style - назначение которых как раз в том, чтобы фрагмент выделялся как задумано). Соответственно, возникает соблазн выделить цитату или стих курсивом, а отструктурировать мелкий шрифт индексом. :(
С другой стороны, в FB2 есть такая сильная штука, как тэг style: вкупе с CSS-описанием (тэг stylesheet) он позволяет чёрта нарисовать, не то что с размером и расположением фрагмента поиграться. Но, с третьей стороны, до фига читалок CSS-стили не рюхает вообще; с четвёртой - имеющиеся описания использованию CSS и тэга style - крайне невнятны (Кондратович, ау!); с пятой - либрусековская онлайн-читалка вообще удаляет фрагмент внутри тэга style...
Для себя нашёл компромиссное решение: в stylesheet'е использую комбинации тэгов (напр., "cite > emphasis { font-size: 85% }" - уменьшать курсив в цитате; "p[id] > strong { letter-spacing: 0.2em; font-weight: inherit }" - жирность в абзаце с меткой давать не жирным, а вразрядку, и т.д.), при этом выстраивать тэги так, чтобы на читалках, не поддерживающих CSS, текст выглядел пусть "обезличенно", но всё ж структурно-понятно и не хуже, чем до попытки дополнительного выделения. Рекомендую.
Ещё примеры передачи колорита отдельных книг:
- Радек Йон "Memento" - очень широкие пустые строки и эпиграфы во всю ширину страницы курсивом нормального размера, последующий текст с новой страницы; без CSS - обычные пустые строки и обычные эпиграфы;
- Копит "Конец света..." - имена персонажей вразрядку, реплики без абзацных отступов, ремарки уменьшенным шрифтом; без CSS - имена жирные, реплики как обычные абзацы, ремарки курсивом;
- Савченко "За перевалом" (1985 г.) - эпиграфы широкие курсивом нормального размера, часть заголовков вразрядку, некоторые слова выделены разрядкой, "шапки" объявлений по всемирной сети выравнены вправо, надпись на цоколе памятника - красным цветом; без CSS - эпиграфы обычные, выделенные слова жирные, шапки объявлений обычным текстом, надпись на памятнике жирная цитатой;
- Стась "Зелена пастка" - выделенные слова в примечаниях вразрядку; без CSS - выделены курсивом.
В вашем случае (все цитаты уменьшенным шрифтом), наверно, подойдёт что-то вроде "cite { font-size: 85% }"; если не все цитаты уменьшенным шрифтом - "cite[id] { font-size: 85% }" и отметить нужные цитаты id'ами; если в пределах цитаты может быть абзац таким шрифтом, абзац этаким - "cite > p[id] { font-size: 85% }" и метить id'ами нужные абзацы. Разумеется, на читалке, CSS не поддерживающей, эффекта не будет :-( - текст потеряет свою похожесть на именно это издание, станет похожим на "среднеиздательский". Но попробуйте! :-)

Тигра! Вы делаете все чтобы отпугнуть желающих нАчать:) Это конечно тоже хорошо, но все это можно обяснить человеческим языком, гораздо проще:)

Igorek67 написал:
хорошо, но все это можно обяснить человеческим языком, гораздо проще:)
А как? Хочу поделиться, а у меня не получается. :-(

Цитата:
CR3 понимает CSS

Только cr3 и понимает. Не самый лучший вариант читалки.
Так что пока ваши доводы неубедительны.

Алексей_Н написал:
Цитата:
CR3
Не самый лучший вариант читалки.
Из пары (CR3, fbreader), доступной для LBook V3, - таки самый.
Алексей_Н написал:
ваши доводы неубедительны
Даже не собирался убеждать...

Взял на конвертацию в FB2 и вычитку Фукидид, История. http://lib.rus.ec/b/136635 Исходник в txt, при первом взгляде кажется более-менее нормального качества вычитки, но конвертацию в fb2 делать не совсем просто. Я попробую, но это может занять неделю и более, с учетом того, что я работаю и др.

Сейчас пересмотрел по-быстрому. Увы, имеются совершенно поврежденные куски, которые нельзя восстановить, не имея перед глазами исходного изображения. Так что качество fb2 очень высоким не будет.

Возьму "Хайку" Исса.
Отметьте, плз.
Вставка иллюстраций не возбраняется?

Вычитала, залила, старую заменила. Поправьте в таблице.

cvt написал:
Возьму "Хайку" Исса.
Отметьте, плз.
Вставка иллюстраций не возбраняется?
Вычитала, залила, старую заменила. Поправьте в таблице.

Оперативно! Спасибо.

Заменил вычитанную "Кэрри" Стивена Кинга: http://lib.rus.ec/b/181619. Со второго правда раза, но добавил. Выправил все, что возможно было выправить.

Тэг "цитата", который так бурно сейчас здесь обсуждается, также оставил.

Старался максимально возможно приблизить оформление электронной версии к бумажной.

По обложке: был очень удивлен скудости вариантов в интернете (в первую очередь по размерам). Поэтому, не меняя шило на мыло, оставил обложку, которая шла в предыдущей версии книги.

Беру на вычитку серию "Братья Харди" Диксона http://lib.rus.ec/a/57907 Там почти все файлы в doc, конвертирую в fb2 и исправляю опечатки. Еще попытался придумать аннотации, которых не смог найти в сети :) Вроде даже получилось. Это, кстати, не возбраняется?

Еще я тут недавно сделал и залил "Каникулы кота Егора" http://lib.rus.ec/b/180646 У меня где-то был бумажный вариант, в котором, насколько я помню, были иллюстрации. Как его разыщу, отсканирую. И что будет лучше, заменить текстовую версию на версию с иллюстрациями, или пусть будет две?

Аватар пользователя s_Sergius

bschepan написал:
Еще попытался придумать аннотации, которых не смог найти в сети :) Вроде даже получилось. Это, кстати, не возбраняется?

Я думаю, что не возбраняется. И подпись под аннотацией не помешала бы.

bschepan написал:
И что будет лучше, заменить текстовую версию на версию с иллюстрациями, или пусть будет две?

Лучше пусть будет две: с иллюстрациями и без. Скорость доступа у всех разная, читают на разных устройствах и т.д.

-

Подпись под аннотацией? Хм, зачем? В крайнем случае, можно в теге history написать, что это я ее придумал, а светить прямо в тексте, я думаю, ни к чему...

Цитата:
Лучше пусть будет две: с иллюстрациями и без.

Вот я тоже склонялся к этой мысли, спасибо за внесение ясности :)
Аватар пользователя s_Sergius

bschepan написал:
Подпись под аннотацией? Хм, зачем? В крайнем случае, можно в теге history написать, что это я ее придумал, а светить прямо в тексте, я думаю, ни к чему...

Я имел в виду то, что желательно ставить подпись автора аннотации, чтобы отличать ее от издательской. Примерно как это делают на фантлабе, типа http://fantlab.ru/work3661. Подписывайтесь ником, паспортных данных же никто не требует.

Окей, понял.

bschepan написал:
Беру на вычитку серию "Братья Харди" Диксона http://lib.rus.ec/a/57907 Там почти все файлы в doc, конвертирую в fb2 и исправляю опечатки.

А я ее потихоньку делаю с конца (т.к. сначала ее делал TaKir), но с удовольствием брошу все на Вас. :)))

Договорились :)

з.ы. вы посмотрите, если не сложно, все ли у меня правильно с оформлением книжек, а именно служебной информации о книгах. Это, я думаю, можно в личку. Я просто fb2 "для общего пользования" начал делать только недавно, раньше только для себя и никуда не выкладывал :)

bschepan написал:
з.ы. вы посмотрите, если не сложно, все ли у меня правильно с оформлением книжек, а именно служебной информации о книгах. Это, я думаю, можно в личку.

Написала в личку.
UPD
Ага, обложки Вы все же стараетесь добавить, что замечательно!:)

Добрый день.
Отметьте пож.в таблице - Орлов "Смело мы в бой пойдем..."- вычитана.В базу библиотеки исправленую версию занес.
Беру на вычитку - Герман Гессе "Игра в бисер".На стр.книги - отметился.Спасибо.

Хочу взять на вычитку из таблицы книгу Стивена Фрая "Теннисные мячики небес" , но в комментариях не сказано, в какой обработке она нуждается. Я только недавно работаю с форматом FB2, и хотелось бы заранее оценить свои возможности.

Tramell написал:
Хочу взять на вычитку из таблицы книгу Стивена Фрая "Теннисные мячики небес" , но в комментариях не сказано, в какой обработке она нуждается. Я только недавно работаю с форматом FB2, и хотелось бы заранее оценить свои возможности.

Скорее всего, речь идёт об ошибках ОСR. Возможно, небольшое форматирование - например, стихи или цитаты.
Дерзайте! :)

Запишите, пожалуйста, Стивена Фрая за мной. Не пойму, как ее скачать. Наверное у меня еще нет льготного абонемента.

Цитата:
Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе.

Уточните еще, пожалуйста, где находится эта страница.

Tramell написал:
Запишите, пожалуйста, Стивена Фрая за мной. Не пойму, как ее скачать. Наверное у меня еще нет льготного абонемента.

Пришлите мне в личку свой мэйл, я вышлю Вам книгу.

Tramell написал:
Цитата:
Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе.

Уточните еще, пожалуйста, где находится эта страница.

Линк "исправить" на странице книги.

Хочу Роулинг "Гарри Поттер и Дары смерти" вычитать. Как возможно скачать книжку для вычитки?

nina73 написал:
Хочу Роулинг "Гарри Поттер и Дары смерти" вычитать. Как возможно скачать книжку для вычитки?

Пришлите мне в личку свой мэйл, я Вам вышлю.

Читаю книги с librusec я давно, хотелось бы помочь любимой библиотеке делом. Могу вычитывать (русский язык хороший). Могу попытаться перевести, но пока что мне приходилось переводить только техническую литературу с английского языка. Будет ли что-то из моих познаний полезным для клуба ? Дайте мне знать, пожалуйста. С учетом того, что форматировать книги мне никогда не приходилось (но я обучаема!). :-)

agatata написал:
Читаю книги с librusec я давно, хотелось бы помочь любимой библиотеке делом. Могу вычитывать (русский язык хороший). Могу попытаться перевести, но пока что мне приходилось переводить только техническую литературу с английского языка. Будет ли что-то из моих познаний полезным для клуба ? Дайте мне знать, пожалуйста. С учетом того, что форматировать книги мне никогда не приходилось (но я обучаема!). :-)

Добро пожаловать! :)
Если хотите себя попробовать в верстании книг, почитайте Кондратовича. Программу FBE для проб и ошибок (а куда ж без них на первых порах? ;) ) можно взять здесь: http://lib.rus.ec/soft.
В этой книге доступно и подробно объяснена работа с форматом.

Если есть желание, можно брать интересные Вам книги в формате doc, rtf, txt (см. здесь) и вычитывать их: исправлять ошибки, выделять заголовки, стихи и другие элементы текста. После этого можно связаться с кем-нибудь из верстальщиков на предмет конвертирования в fb2. Или самой(-ому) попробовать. ;)

У меня вот такой вопрос. Вот недавно выложили в библиотеку несколько очень толковых файлов в doc-формате. Я взялся их переводить в fb2, но вот как отметить эти самые файлы, что они в обработке? Полазил по свойствам, ничего особо не нашёл. Книги вот эти:

http://lib.rus.ec/b/181685
http://lib.rus.ec/b/181353

На странице книги - линк "исправить", а там сделать пометку в поле "доп.инф.:".

Посмотрите как сделано для первой книги.

Понял, спасибо.

Неплохо было бы внести в список на вычитку книгу "Спин" Роберта Чарльза Уилсона, там много ошибок допущено при сканировании, местами даже желательна сверка с оригиналом. Читается легко, не вычитал сам - нет оригинала.
И может кто-то взялся бы за перевод второй книги серии "Спин" (Axis), английский оригинал в fb2 есть здесь же на Либрусеке. Это был бы королевский подарок библиотеке. Объем сравнительно небольшой - 620 килобайт. Зарядить в Promt или Sokrat, а дальше "напильником"... Я вот пока Сократом пользуюсь, но так коряво...
-----------------------------------------------------------------------------------------------------------------
Может agatata заинтересуется фантастикой???

TaF написал:
Неплохо было бы внести в список на вычитку книгу "Спин" Роберта Чарльза Уилсона, там много ошибок допущено при сканировании, местами даже желательна сверка с оригиналом.

Сделано.

Подрихтую Мумона....Отметочку в таблице сделайте , пожалуйста...

XtraVert написал:
Подрихтую Мумона....Отметочку в таблице сделайте , пожалуйста...

Сделано.

Есть у вас такая книжка: http://lib.rus.ec/a/37620
Дэвид Лэнг - Армяне, народ-созидатель

она у меня есть в бумажном варианте, если хотёте, могём помочь ))

triceratops написал:
Есть у вас такая книжка: http://lib.rus.ec/a/37620
Дэвид Лэнг - Армяне, народ-созидатель
она у меня есть в бумажном варианте, если хотёте, могём помочь ))

Хотим. А в чём Вы хотите помочь? ;)

Полный OCR

только беда: я с фб2 не дружу (( могу и в пдф и в джву залить...

triceratops написал:
Полный OCR
только беда: я с фб2 не дружу (( могу и в пдф и в джву залить...

Ну, в pdf она на сайте есть. Разве что распознать. Можете? :)
Чтобы получился doc, желательно вычитанный.

Ну вот это пжалста! Тогда вы там в этом списке отметьте пжалста, а то я не разобрался как туда заносить....

Мумон здесь - http://lib.rus.ec/b/183194
взгляните...может замечания, или советы будут?
Кстати Оссиана можно попробовать?

XtraVert написал:
Мумон здесь - http://lib.rus.ec/b/183194
взгляните...может замечания, или советы будут?
Кстати Оссиана можно попробовать?

Оперативно. :)
Записываю Оссиана за Вами.

А что делать, если FB2 Editor выдает вот такое окошко? В документе, вроде, все правильно, тегов таких нет - но и не должно быть...

Dmitry Ermolaev написал:
А что делать, если FB2 Editor выдает вот такое окошко? В документе, вроде, все правильно, тегов таких нет - но и не должно быть...

Это значит, что файл невалидный. Проверяйте при помощи F8: при этом курсор станет на "проблемное" место в режиме сорцов.

golma1 написал:
Проверяйте при помощи F8: при этом курсор станет на "проблемное" место в режиме сорцов.

Попробую вечером... Но Алридер и читалка ПокетБук этот файл нормально читают...

Dmitry Ermolaev написал:
golma1 написал:
Проверяйте при помощи F8: при этом курсор станет на "проблемное" место в режиме сорцов.

Попробую вечером... Но Алридер и читалка ПокетБук этот файл нормально читают...

Работает! Нашел лишнюю секцию. Чем она помешала... 8-) В общем, спасибо, сейчас все нормально.

Страницы

X