Вычитка #5 (2010-I)

Аватар пользователя soshial

Теперь главная тема по вычитке здесь.

Архив тем:
1. 2008-I
2. 2008-II — 2009-I
3. 2009-II
4. 2009-III

таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA

Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: http://lib.rus.ec/stat/document-author/rusec. Книги из этого списка нуждаются в доработке: форматировании и вычитке.

Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе.

Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке http://lib.rus.ec/stat/tot и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования.

Присоединяйтесь к нам! :)
Обращение golma1'ы:

golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"!

Тем, кто не знаком с форматом fb2, рекомендую вначале заглянуть в эту книгу. Здесь в популярной форме даются описания и разъяснения основных моментов этого формата. Если вдруг что-то окажется непонятным, всегда можно обратиться с вопросом в форум, вам обязательно помогут. Нужные для работы с fb2-файлами программы вы найдёте здесь.

Книги, сделанные в fb2 и нуждающиеся в вычитке, следует и вычитывать в этом формате. При конвертировании файла в текстовый формат неизбежно теряются ценные детали форматирования, восстановить которые впоследствии если и возможно, то очень трудоёмко.

Под вычиткой подразумевается:
1. Исправление ошибок OCR.
2. Форматирование текста:
- разбиение текста на части, главы, подглавы (секции и вложенные секции, тэги title и subtitle)
- выделение жирным и наклонным шрифтом (тэги strong и emphasis)
- проставление разделений в тексте (тэг empty-line)
- проверка скриптами
3. Заполнение дескриптора (обложка, аннотация, выходные данные книги)
4. При необходимости конвертирование в fb2-формат.

Для вычитки можно пользоваться читалкой AlReader Vobis Edition или редактором FictionBookEditor. Ссылки на обе программы были даны выше.
В самом крайнем случае, файл fb2 можно открыть текстовым редактором, сохраняя при этом все тэги. В этом случае, если изменения вносятся только в текст, форматирование сохраняется.

Убедительная просьба - не конвертировать fb2-файлы в текстовый формат. Не забывайте, что fb2 является предпочтительным форматом нашей библиотеки и книги следует заливать, по возможности, в нём. И уж во всяком случае, не стоит заменять формат fb2 другим форматом.

Если почему-то вам не хочется разбираться в формате fb2, берите на вычитку книги, представленные в библиотеке в текстовом формате. Их можно заливать в том виде, в каком вы их скачали.
Также можно брать файлы в форматах djvu или pdf и распознать их в текстовый формат. Однако это касается преимущественно художественной литературы, т.е. произведений, состоящих в основном из текста. Книги с множеством иллюстраций, таблиц, формул лучше оставить в том виде, в каком они есть.

Если я что-то упустила или невнятно сформулировала, спрашивайте. :)

Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
Они помогут Вам разобраться в пользовании самой распространённой программой FBE.
Всем привет! :)

Цитата:
Смотрится мерзко.

И в чем мерзость?..
Всё зависит от читалки: какие-то вообще проигнорируют, в каких-то смотрится вполне прилично.

Алексей_Н написал:
Цитата:
Смотрится мерзко.

И в чем мерзость?..
Строки широкие, буквы маленькие и вплотную прижаты к предыдущему или следующему абзацу. И конвертировать его потом будет ооооочень приятно. А уж если в выделенном таким манером тексте будут ещё и свои верхние/нижние индексы - то вааще.
Я б так не делал бы. Если речь идёт про то, чтобы книга выглядела, то CSS как раз для этого.

Это какой вы читалкой пользуетесь? Сколько таких текстов встречал, нигде ничего подобного не видел.

Алексей_Н написал:
Это какой вы читалкой пользуетесь?
Прошу прощения, но из контекста непонятно, к кому и о чём вопрос, но можно предположить, что ко мне (а "древовидным списком" не пользуюсь по техническим причинам - где-то что-то на шлюзе в локалку не так фильтруется, и "древовидный" режется :-( ).
CoolReader 3 на LBook V3. Ну, и FBE2, если приходится править. CR3 понимает CSS, FBE2 - нет.
Алексей_Н написал:
Сколько таких текстов встречал, нигде ничего подобного не видел.
Нуу... ИМХО одна из основных нехорошестей FB2 - то, что тэги структурирования книги (которые нужны для описания предназначения фрагмента и внешний вид читатель волен назначать сам: цитаты, заголовки, стихи, эпиграфы с подписями... те же верхние и нижние индексы) смешаны с тэгами отображения (курсив, жирность, зачёркнутость (ИМХО нафиг никому не нужная - а подчёркивания и разрядки нет :-( ) плюс, натурально, style - назначение которых как раз в том, чтобы фрагмент выделялся как задумано). Соответственно, возникает соблазн выделить цитату или стих курсивом, а отструктурировать мелкий шрифт индексом. :(
С другой стороны, в FB2 есть такая сильная штука, как тэг style: вкупе с CSS-описанием (тэг stylesheet) он позволяет чёрта нарисовать, не то что с размером и расположением фрагмента поиграться. Но, с третьей стороны, до фига читалок CSS-стили не рюхает вообще; с четвёртой - имеющиеся описания использованию CSS и тэга style - крайне невнятны (Кондратович, ау!); с пятой - либрусековская онлайн-читалка вообще удаляет фрагмент внутри тэга style...
Для себя нашёл компромиссное решение: в stylesheet'е использую комбинации тэгов (напр., "cite > emphasis { font-size: 85% }" - уменьшать курсив в цитате; "p[id] > strong { letter-spacing: 0.2em; font-weight: inherit }" - жирность в абзаце с меткой давать не жирным, а вразрядку, и т.д.), при этом выстраивать тэги так, чтобы на читалках, не поддерживающих CSS, текст выглядел пусть "обезличенно", но всё ж структурно-понятно и не хуже, чем до попытки дополнительного выделения. Рекомендую.
Ещё примеры передачи колорита отдельных книг:
- Радек Йон "Memento" - очень широкие пустые строки и эпиграфы во всю ширину страницы курсивом нормального размера, последующий текст с новой страницы; без CSS - обычные пустые строки и обычные эпиграфы;
- Копит "Конец света..." - имена персонажей вразрядку, реплики без абзацных отступов, ремарки уменьшенным шрифтом; без CSS - имена жирные, реплики как обычные абзацы, ремарки курсивом;
- Савченко "За перевалом" (1985 г.) - эпиграфы широкие курсивом нормального размера, часть заголовков вразрядку, некоторые слова выделены разрядкой, "шапки" объявлений по всемирной сети выравнены вправо, надпись на цоколе памятника - красным цветом; без CSS - эпиграфы обычные, выделенные слова жирные, шапки объявлений обычным текстом, надпись на памятнике жирная цитатой;
- Стась "Зелена пастка" - выделенные слова в примечаниях вразрядку; без CSS - выделены курсивом.
В вашем случае (все цитаты уменьшенным шрифтом), наверно, подойдёт что-то вроде "cite { font-size: 85% }"; если не все цитаты уменьшенным шрифтом - "cite[id] { font-size: 85% }" и отметить нужные цитаты id'ами; если в пределах цитаты может быть абзац таким шрифтом, абзац этаким - "cite > p[id] { font-size: 85% }" и метить id'ами нужные абзацы. Разумеется, на читалке, CSS не поддерживающей, эффекта не будет :-( - текст потеряет свою похожесть на именно это издание, станет похожим на "среднеиздательский". Но попробуйте! :-)
Аватар пользователя Igorek67

Тигра! Вы делаете все чтобы отпугнуть желающих нАчать:) Это конечно тоже хорошо, но все это можно обяснить человеческим языком, гораздо проще:)

Igorek67 написал:
хорошо, но все это можно обяснить человеческим языком, гораздо проще:)
А как? Хочу поделиться, а у меня не получается. :-(

Цитата:
CR3 понимает CSS

Только cr3 и понимает. Не самый лучший вариант читалки.
Так что пока ваши доводы неубедительны.

Алексей_Н написал:
Цитата:
CR3
Не самый лучший вариант читалки.
Из пары (CR3, fbreader), доступной для LBook V3, - таки самый.
Алексей_Н написал:
ваши доводы неубедительны
Даже не собирался убеждать...

Взял на конвертацию в FB2 и вычитку Фукидид, История. http://lib.rus.ec/b/136635 Исходник в txt, при первом взгляде кажется более-менее нормального качества вычитки, но конвертацию в fb2 делать не совсем просто. Я попробую, но это может занять неделю и более, с учетом того, что я работаю и др.

Сейчас пересмотрел по-быстрому. Увы, имеются совершенно поврежденные куски, которые нельзя восстановить, не имея перед глазами исходного изображения. Так что качество fb2 очень высоким не будет.

Возьму "Хайку" Исса.
Отметьте, плз.
Вставка иллюстраций не возбраняется?

Вычитала, залила, старую заменила. Поправьте в таблице.

Аватар пользователя golma1

cvt написал:
Возьму "Хайку" Исса.
Отметьте, плз.
Вставка иллюстраций не возбраняется?
Вычитала, залила, старую заменила. Поправьте в таблице.

Оперативно! Спасибо.

Аватар пользователя papamuller

Заменил вычитанную "Кэрри" Стивена Кинга: http://lib.rus.ec/b/181619. Со второго правда раза, но добавил. Выправил все, что возможно было выправить.

Тэг "цитата", который так бурно сейчас здесь обсуждается, также оставил.

Старался максимально возможно приблизить оформление электронной версии к бумажной.

По обложке: был очень удивлен скудости вариантов в интернете (в первую очередь по размерам). Поэтому, не меняя шило на мыло, оставил обложку, которая шла в предыдущей версии книги.

Беру на вычитку серию "Братья Харди" Диксона http://lib.rus.ec/a/57907 Там почти все файлы в doc, конвертирую в fb2 и исправляю опечатки. Еще попытался придумать аннотации, которых не смог найти в сети :) Вроде даже получилось. Это, кстати, не возбраняется?

Еще я тут недавно сделал и залил "Каникулы кота Егора" http://lib.rus.ec/b/180646 У меня где-то был бумажный вариант, в котором, насколько я помню, были иллюстрации. Как его разыщу, отсканирую. И что будет лучше, заменить текстовую версию на версию с иллюстрациями, или пусть будет две?

Аватар пользователя s_Sergius

bschepan написал:
Еще попытался придумать аннотации, которых не смог найти в сети :) Вроде даже получилось. Это, кстати, не возбраняется?

Я думаю, что не возбраняется. И подпись под аннотацией не помешала бы.

bschepan написал:
И что будет лучше, заменить текстовую версию на версию с иллюстрациями, или пусть будет две?

Лучше пусть будет две: с иллюстрациями и без. Скорость доступа у всех разная, читают на разных устройствах и т.д.

Аватар пользователя Tanja45

-

Подпись под аннотацией? Хм, зачем? В крайнем случае, можно в теге history написать, что это я ее придумал, а светить прямо в тексте, я думаю, ни к чему...

Цитата:
Лучше пусть будет две: с иллюстрациями и без.

Вот я тоже склонялся к этой мысли, спасибо за внесение ясности :)
Аватар пользователя s_Sergius

bschepan написал:
Подпись под аннотацией? Хм, зачем? В крайнем случае, можно в теге history написать, что это я ее придумал, а светить прямо в тексте, я думаю, ни к чему...

Я имел в виду то, что желательно ставить подпись автора аннотации, чтобы отличать ее от издательской. Примерно как это делают на фантлабе, типа http://fantlab.ru/work3661. Подписывайтесь ником, паспортных данных же никто не требует.

Окей, понял.

Аватар пользователя Tanja45

bschepan написал:
Беру на вычитку серию "Братья Харди" Диксона http://lib.rus.ec/a/57907 Там почти все файлы в doc, конвертирую в fb2 и исправляю опечатки.

А я ее потихоньку делаю с конца (т.к. сначала ее делал TaKir), но с удовольствием брошу все на Вас. :)))

Договорились :)

з.ы. вы посмотрите, если не сложно, все ли у меня правильно с оформлением книжек, а именно служебной информации о книгах. Это, я думаю, можно в личку. Я просто fb2 "для общего пользования" начал делать только недавно, раньше только для себя и никуда не выкладывал :)

Аватар пользователя Tanja45

bschepan написал:
з.ы. вы посмотрите, если не сложно, все ли у меня правильно с оформлением книжек, а именно служебной информации о книгах. Это, я думаю, можно в личку.

Написала в личку.
UPD
Ага, обложки Вы все же стараетесь добавить, что замечательно!:)

Добрый день.
Отметьте пож.в таблице - Орлов "Смело мы в бой пойдем..."- вычитана.В базу библиотеки исправленую версию занес.
Беру на вычитку - Герман Гессе "Игра в бисер".На стр.книги - отметился.Спасибо.

Аватар пользователя Tramell

Хочу взять на вычитку из таблицы книгу Стивена Фрая "Теннисные мячики небес" , но в комментариях не сказано, в какой обработке она нуждается. Я только недавно работаю с форматом FB2, и хотелось бы заранее оценить свои возможности.

Аватар пользователя golma1

Tramell написал:
Хочу взять на вычитку из таблицы книгу Стивена Фрая "Теннисные мячики небес" , но в комментариях не сказано, в какой обработке она нуждается. Я только недавно работаю с форматом FB2, и хотелось бы заранее оценить свои возможности.

Скорее всего, речь идёт об ошибках ОСR. Возможно, небольшое форматирование - например, стихи или цитаты.
Дерзайте! :)
Аватар пользователя Tramell

Запишите, пожалуйста, Стивена Фрая за мной. Не пойму, как ее скачать. Наверное у меня еще нет льготного абонемента.

Цитата:
Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе.

Уточните еще, пожалуйста, где находится эта страница.
Аватар пользователя golma1

Tramell написал:
Запишите, пожалуйста, Стивена Фрая за мной. Не пойму, как ее скачать. Наверное у меня еще нет льготного абонемента.

Пришлите мне в личку свой мэйл, я вышлю Вам книгу.

Tramell написал:
Цитата:
Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе.

Уточните еще, пожалуйста, где находится эта страница.

Линк "исправить" на странице книги.

Хочу Роулинг "Гарри Поттер и Дары смерти" вычитать. Как возможно скачать книжку для вычитки?

Аватар пользователя golma1

nina73 написал:
Хочу Роулинг "Гарри Поттер и Дары смерти" вычитать. Как возможно скачать книжку для вычитки?

Пришлите мне в личку свой мэйл, я Вам вышлю.

Читаю книги с librusec я давно, хотелось бы помочь любимой библиотеке делом. Могу вычитывать (русский язык хороший). Могу попытаться перевести, но пока что мне приходилось переводить только техническую литературу с английского языка. Будет ли что-то из моих познаний полезным для клуба ? Дайте мне знать, пожалуйста. С учетом того, что форматировать книги мне никогда не приходилось (но я обучаема!). :-)

Аватар пользователя golma1

agatata написал:
Читаю книги с librusec я давно, хотелось бы помочь любимой библиотеке делом. Могу вычитывать (русский язык хороший). Могу попытаться перевести, но пока что мне приходилось переводить только техническую литературу с английского языка. Будет ли что-то из моих познаний полезным для клуба ? Дайте мне знать, пожалуйста. С учетом того, что форматировать книги мне никогда не приходилось (но я обучаема!). :-)

Добро пожаловать! :)
Если хотите себя попробовать в верстании книг, почитайте Кондратовича. Программу FBE для проб и ошибок (а куда ж без них на первых порах? ;) ) можно взять здесь: http://lib.rus.ec/soft.
В этой книге доступно и подробно объяснена работа с форматом.

Если есть желание, можно брать интересные Вам книги в формате doc, rtf, txt (см. здесь) и вычитывать их: исправлять ошибки, выделять заголовки, стихи и другие элементы текста. После этого можно связаться с кем-нибудь из верстальщиков на предмет конвертирования в fb2. Или самой(-ому) попробовать. ;)

У меня вот такой вопрос. Вот недавно выложили в библиотеку несколько очень толковых файлов в doc-формате. Я взялся их переводить в fb2, но вот как отметить эти самые файлы, что они в обработке? Полазил по свойствам, ничего особо не нашёл. Книги вот эти:

http://lib.rus.ec/b/181685
http://lib.rus.ec/b/181353

На странице книги - линк "исправить", а там сделать пометку в поле "доп.инф.:".

Посмотрите как сделано для первой книги.

Понял, спасибо.

Аватар пользователя TaF

Неплохо было бы внести в список на вычитку книгу "Спин" Роберта Чарльза Уилсона, там много ошибок допущено при сканировании, местами даже желательна сверка с оригиналом. Читается легко, не вычитал сам - нет оригинала.
И может кто-то взялся бы за перевод второй книги серии "Спин" (Axis), английский оригинал в fb2 есть здесь же на Либрусеке. Это был бы королевский подарок библиотеке. Объем сравнительно небольшой - 620 килобайт. Зарядить в Promt или Sokrat, а дальше "напильником"... Я вот пока Сократом пользуюсь, но так коряво...
-----------------------------------------------------------------------------------------------------------------
Может agatata заинтересуется фантастикой???

Аватар пользователя golma1

TaF написал:
Неплохо было бы внести в список на вычитку книгу "Спин" Роберта Чарльза Уилсона, там много ошибок допущено при сканировании, местами даже желательна сверка с оригиналом.

Сделано.
Аватар пользователя XtraVert

Подрихтую Мумона....Отметочку в таблице сделайте , пожалуйста...

Аватар пользователя golma1

XtraVert написал:
Подрихтую Мумона....Отметочку в таблице сделайте , пожалуйста...

Сделано.
Аватар пользователя triceratops

Есть у вас такая книжка: http://lib.rus.ec/a/37620
Дэвид Лэнг - Армяне, народ-созидатель

она у меня есть в бумажном варианте, если хотёте, могём помочь ))

Аватар пользователя golma1

triceratops написал:
Есть у вас такая книжка: http://lib.rus.ec/a/37620
Дэвид Лэнг - Армяне, народ-созидатель
она у меня есть в бумажном варианте, если хотёте, могём помочь ))

Хотим. А в чём Вы хотите помочь? ;)
Аватар пользователя triceratops

Полный OCR

только беда: я с фб2 не дружу (( могу и в пдф и в джву залить...

Аватар пользователя golma1

triceratops написал:
Полный OCR
только беда: я с фб2 не дружу (( могу и в пдф и в джву залить...

Ну, в pdf она на сайте есть. Разве что распознать. Можете? :)
Чтобы получился doc, желательно вычитанный.
Аватар пользователя triceratops

Ну вот это пжалста! Тогда вы там в этом списке отметьте пжалста, а то я не разобрался как туда заносить....

Аватар пользователя XtraVert

Мумон здесь - http://lib.rus.ec/b/183194
взгляните...может замечания, или советы будут?
Кстати Оссиана можно попробовать?

Аватар пользователя golma1

XtraVert написал:
Мумон здесь - http://lib.rus.ec/b/183194
взгляните...может замечания, или советы будут?
Кстати Оссиана можно попробовать?

Оперативно. :)
Записываю Оссиана за Вами.

А что делать, если FB2 Editor выдает вот такое окошко? В документе, вроде, все правильно, тегов таких нет - но и не должно быть...

Аватар пользователя golma1

Dmitry Ermolaev написал:
А что делать, если FB2 Editor выдает вот такое окошко? В документе, вроде, все правильно, тегов таких нет - но и не должно быть...

Это значит, что файл невалидный. Проверяйте при помощи F8: при этом курсор станет на "проблемное" место в режиме сорцов.

golma1 написал:
Проверяйте при помощи F8: при этом курсор станет на "проблемное" место в режиме сорцов.

Попробую вечером... Но Алридер и читалка ПокетБук этот файл нормально читают...

Dmitry Ermolaev написал:
golma1 написал:
Проверяйте при помощи F8: при этом курсор станет на "проблемное" место в режиме сорцов.

Попробую вечером... Но Алридер и читалка ПокетБук этот файл нормально читают...

Работает! Нашел лишнюю секцию. Чем она помешала... 8-) В общем, спасибо, сейчас все нормально.

Аватар пользователя kivi

Здравствуйте!
Отметьте пожалуйста в таблице, что Иван Бунин Дневники 1939-1945 годов вычитаны и выложены.

Хотелось бы взять на доработку Арнольд Джозеф Тойнби Статьи из книги 'Цивилизация перед судом истории'

Страницы

X