Вычитка #5 (2010-I)

Теперь главная тема по вычитке здесь.

Архив тем:
1. 2008-I
2. 2008-II — 2009-I
3. 2009-II
4. 2009-III

таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA

Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: http://lib.rus.ec/stat/document-author/rusec. Книги из этого списка нуждаются в доработке: форматировании и вычитке.

Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе.

Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке http://lib.rus.ec/stat/tot и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования.

Присоединяйтесь к нам! :)
Обращение golma1'ы:

golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"!

Тем, кто не знаком с форматом fb2, рекомендую вначале заглянуть в эту книгу. Здесь в популярной форме даются описания и разъяснения основных моментов этого формата. Если вдруг что-то окажется непонятным, всегда можно обратиться с вопросом в форум, вам обязательно помогут. Нужные для работы с fb2-файлами программы вы найдёте здесь.

Книги, сделанные в fb2 и нуждающиеся в вычитке, следует и вычитывать в этом формате. При конвертировании файла в текстовый формат неизбежно теряются ценные детали форматирования, восстановить которые впоследствии если и возможно, то очень трудоёмко.

Под вычиткой подразумевается:
1. Исправление ошибок OCR.
2. Форматирование текста:
- разбиение текста на части, главы, подглавы (секции и вложенные секции, тэги title и subtitle)
- выделение жирным и наклонным шрифтом (тэги strong и emphasis)
- проставление разделений в тексте (тэг empty-line)
- проверка скриптами
3. Заполнение дескриптора (обложка, аннотация, выходные данные книги)
4. При необходимости конвертирование в fb2-формат.

Для вычитки можно пользоваться читалкой AlReader Vobis Edition или редактором FictionBookEditor. Ссылки на обе программы были даны выше.
В самом крайнем случае, файл fb2 можно открыть текстовым редактором, сохраняя при этом все тэги. В этом случае, если изменения вносятся только в текст, форматирование сохраняется.

Убедительная просьба - не конвертировать fb2-файлы в текстовый формат. Не забывайте, что fb2 является предпочтительным форматом нашей библиотеки и книги следует заливать, по возможности, в нём. И уж во всяком случае, не стоит заменять формат fb2 другим форматом.

Если почему-то вам не хочется разбираться в формате fb2, берите на вычитку книги, представленные в библиотеке в текстовом формате. Их можно заливать в том виде, в каком вы их скачали.
Также можно брать файлы в форматах djvu или pdf и распознать их в текстовый формат. Однако это касается преимущественно художественной литературы, т.е. произведений, состоящих в основном из текста. Книги с множеством иллюстраций, таблиц, формул лучше оставить в том виде, в каком они есть.

Если я что-то упустила или невнятно сформулировала, спрашивайте. :)

Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
Они помогут Вам разобраться в пользовании самой распространённой программой FBE.
Всем привет! :)

Bibliofile написал:
Нужна помощь.
Павел Мурузи Александра Федоровна. Последняя русская императрица
Распознал книгу из от сканированных изображений,но как не пробовал конвертировать в fb2 все ерунда получается,нужно из txt сконвертировать,чтобы мог вычитать. Сноски расставлены. Нужно выправить текст по ширине,у меня не получилось и оформить главы и под-главы.
Возьмется кто нибудь?

Давайте я сделаю. Сканы мне тоже будут нужны (или другой графический материал, из чего Вы её распознавали). Правильно ли я понимаю, что речь идёт о http://lib.rus.ec/b/364806?

Вычитывать не буду. Только сделаю fb2.

Конвертнул в FB2
дежавюшную книгу http://lib.rus.ec/b/364806
Павел Мурузи Александра Федоровна. Последняя русская императрица

Получилось вот это. У файла - чёрная метка. Требуется вычитка.
http://lib.rus.ec/b/365942

Спасибо. Не успел материал FR дать. :)

VolgoDon,спасибо за помощь.
Книгу вычитал,исправил ошибки,расставил и оформил примечания и сноски.

Это Вас надо благодарить, а не меня. Вы сделали б́ольшую часть работы.

P.S. Кстати, я бы рекомендовал Вам обратиться к библиотекарям за советом, как теперь лучше поступить с *.DJVU версией этой книги. Лично моё мнение - её надо заменить (объединить) со сделанной Вами *.fb2 версией.

Bibliofile написал:
VolgoDon,спасибо за помощь.
Книгу вычитал,исправил ошибки,расставил и оформил примечания и сноски.

В книге 5 сносок. Ни одной не нашел.

izekbis написал:
В книге 5 сносок. Ни одной не нашел.

Давайте сначала удостоверимся, что мы говорим об одной и той же версии.
http://lib.rus.ec/b/366036

Там не 5, а целых 6 примечаний-сносок.
Если я не прав - подскажите, где на Ваш взгляд отсутствуют сноски.

С уважением,
VolgoDon

примечания есть, титл: автор+название книги - йок

Там не 5, а целых 6 примечаний-сносок.
Если я не прав - подскажите, где на Ваш взгляд отсутствуют сноски.

Извините. Я видно смотрел предыдущую версию. Она до сих пор присутствует.

Не въезжаю. Извините.

Цитата:
титл: автор+название книги - йок

Смотрю: fb2-info.
Тэг title-info - указанная Вами информация заполнена (русский автор + русское название книги + переводчик)
Тэг src-title-info - заполнено. (французский автор и француское название)
Тэг publish-info - заполнено название книги.

Что Вы конкретно имеете в виду? Поясните, пожалуйста, мне недотёпе.

</description>
<body>
  <section>
   <title>
    <p>I</p>
   </title>

</description>
<body>
<title>
<p>avtor</p>
<p>nazvanie</p>
</title>

  <section>
   <title>
    <p>I</p>
   </title>

Так. Давайте ещё раз сверимся. Я обсуждаю эту книгу http://lib.rus.ec/b/366036. Вы тоже?
Если да, то я вижу:

<description>
  <title-info>
   <genre>prose_history</genre>
   <genre>nonf_biography</genre>
   <author>
    <first-name>Павел</first-name>
    <last-name>Мурузи</last-name>
    <id>113966</id>
   </author>
   <book-title>Александра Федоровна. Последняя русская императрица</book-title>
   <annotation>
    <p>Документальный роман-биография известного французского писателя, драматурга, поэта, журналиста Павла Мурузи рассказывает о жизни императрицы Александры Федоровны, жены последнего российского императора Николая II. Годы царствования Николая II оказались отнюдь не радужными не только для дома Романовых, но и для всей России. Несмотря на очевидные экономические успехи, страна стремительно катилась в пропасть, подталкиваемая внутренними и внешними врагами. Первая мировая война, Февральский и Октябрьский перевороты привели к гибели империи, жестокой расправе с царской семьей, братоубийственной гражданской войне. На этом фоне писатель показывает жизненный путь Александры Федоровны, ее становление как личности и как монархини, ее женскую судьбу — радости и горести невесты, жены, матери, ее переживания за безнадежно больного сына-наследника и мужа, "хозяина Земли Русской".</p>
   </annotation>
   <date>01 Jan 2006</date>
   <coverpage>
    <image l:href="#AlFed.jpg"/></coverpage>
   <lang>ru</lang>
   <src-lang>fr</src-lang>
   <translator>
    <first-name>Л.</first-name>
    <middle-name>Д.</middle-name>
    <last-name>Каневский</last-name>
   </translator>
  </title-info>
  <src-title-info>
   <genre>prose_history</genre>
   <genre>nonf_biography</genre>
   <author>
    <first-name>P.</first-name>
    <last-name>Mourousy</last-name>
   </author>
   <book-title>Alexandra Feodorovna. La dernière tsarine.</book-title>
   <date>1986</date>
   <lang>fr</lang>
  </src-title-info>
  <document-info>
   <author>
    <first-name></first-name>
    <last-name>VolgoDon</last-name>
   </author>

напишу вечером с русской клавой или перепишемся в личке
а по сути: вы показываете дескрипшен, а я намекаю, что отсутствует титл в Боди
а это две большие разницы

да и VolgoDon я поставил бы в ник

sem14 написал:
я намекаю, что отсутствует титл в Боди

Тут я Вас понял.

Цитата:
да и VolgoDon я поставил бы в ник

А вот тут не понял.
По Вашему предложению - продолжим через личку.

Добрый день.
Начала читать книгу "Машина пророчеств" Гудкайнда (http://lib.rus.ec/b/336235).
Читается тяжело, потому что текст структурирован с ошибками. Да и перевод, кажется, не всегда литературный.
Скорее всего, для себя буду править.
Подскажите, пожалуйста, нужны ли такие правки для библиотеки?
Тогда попробую освоить формат fb2 (сама читаю в word), потому что с ним никогда не работала.
Спасибо за ответ

1) Ошибки орфографии и пунктуации, являющиеся следствием ошибок оптического распознавания текста (OCR) имеет смысл исправлять. Если ошибки единичны (т.е. есть вероятность, что это вовсе не ошибки) - то очень желательно при этом, чтобы Вы предварительно сверились с оригиналом.

2) Правки перевода лучше не делать. Однако из этого правила есть два исключения: (а) это когда Вы готовы перевести всю книгу заново и самостоятельно (в этом случае Ваш перевод начнёт самостоятельную и независимую жизнь от других переводов); и (б) когда в переводе допущена грубая, явная логическая ошибка. Например, вместо фразы к счастью написано к несчастью. Для того, чтобы вносить такие правки Вы должны иметь текст на языке оригинала, и Вы должны заручиться мнением лица, хорошо знающего этот язык.

Если я не прав, пусть кто нибудь из библиотекарей меня поправит.

По-моему косяки перевода лучше оставлять на совести переводчика. Уж больно дорожка эта скользкая.
Хотя организм иногда вопиет и требует, это да.

J_Blood написал:
По-моему косяки перевода лучше оставлять на совести переводчика. Уж больно дорожка эта скользкая.
Хотя организм иногда вопиет и требует, это да.

Когда у меня вопиет, собираю эти вопия и пишу во впечатлениях, что переводчик козёл и привожу конкретные примеры
http://lib.rus.ec/b/302646

J_Blood написал:
По-моему косяки перевода лучше оставлять на совести переводчика. Уж больно дорожка эта скользкая.
Хотя организм иногда вопиет и требует, это да.

Если уж совсем не удаётся усидеть на руках, можно сделать сноску - "прим. верстальщика".
Но лучше усидеть. В-)

golma1 написал:
J_Blood написал:
По-моему косяки перевода лучше оставлять на совести переводчика. Уж больно дорожка эта скользкая.
Хотя организм иногда вопиет и требует, это да.

Если уж совсем не удаётся усидеть на руках, можно сделать сноску - "прим. верстальщика".
Но лучше усидеть. В-)

Да усиживаю... На БСЧ как-то цитату приводил про распоротый кинжалом рукав (!) безрукавки (!). И ничё, зубы стиснул... :))
Аватар пользователя Isais

J_Blood написал:
Да усиживаю... На БСЧ как-то цитату приводил про распоротый кинжалом рукав (!) безрукавки (!). И ничё, зубы стиснул... :))
А некоторые такие ляпсусы стали хрестоматийными.
Все помнят этот пример: Робинзон Крузо разделся донага, чтобы доплыть до корабля, а на корабле набил карманы сухарями. И 300 лет переиздают книгу с этими кенгурячьими карманами.
Аватар пользователя s_Sergius

Но в данном случае речь идет о любительском переводе (http://lib.rus.ec/b/336235), так что дополнительное редактирование совсем не помешает. Мне так кажется.

VolgoDon, спасибо за ответ.
Текст на английском здесь тоже есть, именно на него собираюсь ориентироваться.
Видимо, это всё произошло потому, что на русском книга ещё не издавалась.

Про ошибки поняла, попробую оценить их масштабы.

Что за м...к перетаскивал книгу "Седьмой сын" с HL ?
Как-то умудрился поменять местами фамилию с именем автора, и главное зачем?
Неплохо бы библиотекарям сделать товарищу внушение...
Пришлось перезалить.

И второе - первый раз столкнулся с тем что UID книги сгенерированный автоматически, продублировался.
UID 5FAD5AE8-0C0C-49E6-9771-320342C7C435
оказался в двух книгах:
http://lib.rus.ec/b/366450
http://lib.rus.ec/b/366239

Потом программы-библиотекари будут спотыкаться (моя уже споткнулась).
Вообще-то, по моему, сервер не должен давать заливать дубли UID-ов.

Цитата:
И второе - первый раз столкнулся с тем что UID книги сгенерированный автоматически, продублировался.
UID 5FAD5AE8-0C0C-49E6-9771-320342C7C435
оказался в двух книгах:
http://lib.rus.ec/b/366450
http://lib.rus.ec/b/366239

Потом программы-библиотекари будут спотыкаться (моя уже споткнулась).
Вообще-то, по моему, сервер не должен давать заливать дубли UID-ов.

Сорри, это я случайно, вручную прописывала тэги для дискрипшн и не изменила ID.
Сознаю свою вину, меру, степень, глубину! Впредь подобного обязуюсь не совершать! ))) Спасибо, что исправили.
ЗЫ А Седьмого сына выкладывала не я, так что тут я ни при чем!

Так я не понял, Id-то откуда взялся? Вы же его не вручную прописывали?
Вроде бы в системе не должен сгенерироваться одинаковый id.
Расскажите подробнее, что и как делали.
Мне просто интересно стало.

Ответ в личке.

Человек, который правил вот эту книгу: http://lib.rus.ec/b/366623, сказал, что она всё ещё требует доработки (ещё одна вычитка, "слипшиеся" абзацы и другое - по его словам), но её карточки в группе сканирования и вычитки я не нашла. Как подать заявку?

macovea написал:
Человек, который правил вот эту книгу: http://lib.rus.ec/b/366623, сказал, что она всё ещё требует доработки (ещё одна вычитка, "слипшиеся" абзацы и другое - по его словам), но её карточки в группе сканирования и вычитки я не нашла. Как подать заявку?

Тут не надо подавать заявку, берёте файл и вычитываете, пометив на сайте в доп.поле названия книги "вычитка_macovea" - во вкладке "исправить" это делается. Сам файл можно взять у заливщика вместе со сканами, а как же еще делить на абзацы-то, без сканов? Но штука в том, что готовый файл надо вычитывать в FBE уже, его не следует в ворд переводить. Так что придется вам таки разбираться тогда с FBE. Такая уж наша жизнь.(

Tanja45 написал:
Тут не надо подавать заявку, берёте файл и вычитываете, пометив на сайте в доп.поле названия книги "вычитка_macovea" - во вкладке "исправить" это делается. Сам файл можно взять у заливщика вместе со сканами, а как же еще делить на абзацы-то, без сканов? Но штука в том, что готовый файл надо вычитывать в FBE уже, его не следует в ворд переводить. Так что придется вам таки разбираться тогда с FBE. Такая уж наша жизнь.(

Да разберусь, ничего страшного. Вопрос в том, где взять ник сканировщика?..
Ладно, будем дальше копать... как гномы из известной игры... :)

macovea написал:
Tanja45 написал:
Тут не надо подавать заявку, берёте файл и вычитываете, пометив на сайте в доп.поле названия книги "вычитка_macovea" - во вкладке "исправить" это делается. Сам файл можно взять у заливщика вместе со сканами, а как же еще делить на абзацы-то, без сканов? Но штука в том, что готовый файл надо вычитывать в FBE уже, его не следует в ворд переводить. Так что придется вам таки разбираться тогда с FBE. Такая уж наша жизнь.(

Да разберусь, ничего страшного. Вопрос в том, где взять ник сканировщика?..
Ладно, будем дальше копать... как гномы из известной игры... :)

А кто правил файл, Вы же знаете. Как он вычитывал без сканов? У него должны быть. Если у него нету, тогда их может и не быть. Тогда такую книгу может вычитать только тот, у кого есть бумажная. Ник сканировщика можно найти в дескрипшене fb2, но вот найти его самого, да еще если он не с Либрусека... не факт, что получится. Без ссылки на книгу точно ничего сказать нельзя.

Нету в дескрипшене ничего, книга от дружественных по синхронизации...
Запущено и запутано...

macovea написал:
Вопрос в том, где взять ник сканировщика?

Нет его, так как не было сканирования. Это любительский перевод, сразу выкладывался на какой-то сайт. Не нашел на какой. На нотабенойде перевод неполный, да и тот ли?
Поэтому исправляйте откровенные ошибки и опечатки, в спорных случаях лучше ничего не менять.

Спасибо, тогда так и сделаю. Только надо разобраться с форматом fb2 - и вперёд, на амбразуры!

А кстати, вопрос по ходу - если я открою этот формат в Ворде, поправлю (только текстовую часть!), а потом сохраню в fb2 же - он правильный формат сделает? Или он (Ворд) только открывать их умеет, а потом какие-то свои изменения в структуру файла вносит и, соответственно, формат получается неправильный?

А вот не знаю. На 2007-м получалось, но только если трогать один текст. Склеивание разорванных строк уже представляло проблему. А вот с 2010-м вообще не смог сохранить, чтоб не искорежить. Может кто другой подскажет.

Аватар пользователя s_Sergius

macovea написал:
А кстати, вопрос по ходу - если я открою этот формат в Ворде, поправлю (только текстовую часть!), а потом сохраню в fb2 же - он правильный формат сделает?

Не делает Ворд нормальных fb2. Увы.
Используйте FB Editor. Редактировать текст в нем не сложнее, чем в Ворде, а проблем с ненужным двойным преобразованием форматов просто не возникнет.
Да и номер версии потом изменить и строчку-другую в предысторию добавить ничего сложного не составит.

Спасибо. Буду осваивать FBE. :)

s_Sergius написал:

Не делает Ворд нормальных fb2. Увы.

Делает, однако. Вот пример (program-used, естественно, липовый) http://lib.rus.ec/b/210955
Но только если использовать его как текстовый редактор с ручным редактированием структуры, вводом за'mim-ленных картинок и т. п. Затем проверка валидатором... Да, и все эти утилитки тоже нужно иметь...

Не, если 2-3 буквы поправить, то просто лучше взять нормальный текстовый редактор, а если посерьезнее -- однозначно FBE.

UPD. Нет, я не извращенец, просто на том компьютере не было возможности поставить FBE ;-))

Аватар пользователя s_Sergius

kozlenok написал:
s_Sergius написал:

Не делает Ворд нормальных fb2. Увы.

Делает, однако. Вот пример (program-used, естественно, липовый) http://lib.rus.ec/b/210955
Но только если использовать его как текстовый редактор с ручным редактированием структуры, вводом за'mim-ленных картинок и т. п. Затем проверка валидатором... Да, и все эти утилитки тоже нужно иметь...

Вот я и говорю, что не делает. Нахрена эти пляски с бубном, когда есть FBE?
Не сбивайте новичков с толку, пожалуйста.

macovea написал:
Спасибо, тогда так и сделаю. Только надо разобраться с форматом fb2 - и вперёд, на амбразуры!

А кстати, вопрос по ходу - если я открою этот формат в Ворде, поправлю (только текстовую часть!), а потом сохраню в fb2 же - он правильный формат сделает? Или он (Ворд) только открывать их умеет, а потом какие-то свои изменения в структуру файла вносит и, соответственно, формат получается неправильный?

Если это делать, то четырежды аккуратно.
Потому что нужно соблюсти очень многие хитрости при сохранении, в первую очередь кодировку.
Плюс к тому, Word (и блокнот тоже) при сохранении в кодировке UTF-8 дописывают в начало файла три лишних байта (метка, что файл в UTF-8, в принципе, это не мешает, большинство программ все понимает правильно, но все же зачем они, пусть лучше не будет).
Если подробнее, то в личку.

Поэтому лучше использовать для подобных целей любой продвинутый текстовый редактор, корректно работающий с кодировкой UTF-8 (Notepad+ и т.п.).

Но все то же самое можно сделать и в FBE, да и понятней это как-то считается...

Добрый день!
Уже дня три как вычитываю вот эту книгу http://lib.rus.ec/node/390034
Своевременно отметила в карточке и верстку, и вычитку, и распознавание. А сегодня зохожу в карточку, а там прописан в распознавании и вычитке еще и dmitr23.
Вот теперь сижу и думаю: или это ошибка, или кто-то из нас делает лишнюю и ненужную работу (не буду говорить кто, так как половина книги мной уже вычитана)!
Написала товарищу в личку - пока молчок.

крымчанка написал:
...сегодня зохожу в карточку, а там прописан в распознавании и вычитке еще и dmitr23.

Такое впечатление, что некоторые просто мимоходом тычут, сколько раз такое же попадалось.
Цитата:
dmitr23: Время участия 4 недели 5 дней, Неподтверждённый пользователь

И не ответит он вам скорее всего.

J_Blood написал:
И не ответит он вам скорее всего.

Если не ответит и просто так тыркнул - эт фигня, обидно будет, если чувак ее действительно вычитывает!

крымчанка написал:

Если не ответит и просто так тыркнул - эт фигня, обидно будет, если чувак ее действительно вычитывает!

Я на этих "конкурентов" уже давно внимание не обращаю. Тыкают действительно абы тыкнуть и пропадают навсегда)))

Вот, кстати, я б таких банила - за "телефонное" хулиганство. Ибо нефиг тыцять в любую попавшуюся кнопку. Люди тут работают))))

Ergo80 написал:
Тыкают действительно абы тыкнуть и пропадают навсегда)))

Если чуть-чуть увеличить мощность паранойи, можно даже предположить, что копирастические наймиты это. Вот, к примеру, завели карточку 4 апреля - http://lib.rus.ec/node/390780 - и тут же зарегистрировался некто и тыцнул "сканирую". Всё! Все ждут и никто не покупает/сканит... Ну, теоретически.
(чивой-та подозрителен я седня) :))

дубель

Может быть кто-нибудь догадается, что это за слово. Подскажите.
"Времени у нас довольно — так я легкомысленно посчитал. И снова удивился гению Павла. Даже погибая, он ясяр. понимал, как спасти Жанну, — собственная гибель была лишь сознательным элементом расчета. Чтобы не дать хроноколебаниям разорвать..."
Или, может быть, в бумаге есть "В мире фантастики и приключений". Выпуск 10. Меньше-больше. Рассказ Сергея Снегова "Право на поиск". Начало абзаца.
Не хочется оставлять ошибку.

Evernet написал:
Может быть кто-нибудь догадается, что это за слово. Подскажите.
"Времени у нас довольно — так я легкомысленно посчитал. И снова удивился гению Павла. Даже погибая, он ясяр. понимал, как спасти Жанну, — собственная гибель была лишь сознательным элементом расчета. Чтобы не дать хроноколебаниям разорвать..."
Или, может быть, в бумаге есть "В мире фантастики и приключений". Выпуск 10. Меньше-больше. Рассказ Сергея Снегова "Право на поиск". Начало абзаца.
Не хочется оставлять ошибку.

По-моему, тут может быть только ясно.

"н" и "я" путаются очень часто, а для того, чтобы вместо "о" появилось "р", достаточно малейшей точки на странице (может быть, и грязь на сканере).

golma1 написал:
По-моему, тут может быть только ясно.
"н" и "я" путаются очень часто, а для того, чтобы вместо "о" появилось "р", достаточно малейшей точки на странице (может быть, и грязь на сканере).

Да и поиск по тексту находит другую редакцию:
Цитата:
И снова удивился гению Павла. Даже погибая, он четко оценил происходящее и понял, как спасти Жанну

- ясно-понятно, что "четко оценил" соответствует "ясно понимал" в этой версии

Спасибо большое.

Страницы

X