Вычитка #5 (2010-I)

Аватар пользователя soshial

Теперь главная тема по вычитке здесь.

Архив тем:
1. 2008-I
2. 2008-II — 2009-I
3. 2009-II
4. 2009-III

таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA

Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: http://lib.rus.ec/stat/document-author/rusec. Книги из этого списка нуждаются в доработке: форматировании и вычитке.

Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе.

Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке http://lib.rus.ec/stat/tot и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования.

Присоединяйтесь к нам! :)
Обращение golma1'ы:

golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"!

Тем, кто не знаком с форматом fb2, рекомендую вначале заглянуть в эту книгу. Здесь в популярной форме даются описания и разъяснения основных моментов этого формата. Если вдруг что-то окажется непонятным, всегда можно обратиться с вопросом в форум, вам обязательно помогут. Нужные для работы с fb2-файлами программы вы найдёте здесь.

Книги, сделанные в fb2 и нуждающиеся в вычитке, следует и вычитывать в этом формате. При конвертировании файла в текстовый формат неизбежно теряются ценные детали форматирования, восстановить которые впоследствии если и возможно, то очень трудоёмко.

Под вычиткой подразумевается:
1. Исправление ошибок OCR.
2. Форматирование текста:
- разбиение текста на части, главы, подглавы (секции и вложенные секции, тэги title и subtitle)
- выделение жирным и наклонным шрифтом (тэги strong и emphasis)
- проставление разделений в тексте (тэг empty-line)
- проверка скриптами
3. Заполнение дескриптора (обложка, аннотация, выходные данные книги)
4. При необходимости конвертирование в fb2-формат.

Для вычитки можно пользоваться читалкой AlReader Vobis Edition или редактором FictionBookEditor. Ссылки на обе программы были даны выше.
В самом крайнем случае, файл fb2 можно открыть текстовым редактором, сохраняя при этом все тэги. В этом случае, если изменения вносятся только в текст, форматирование сохраняется.

Убедительная просьба - не конвертировать fb2-файлы в текстовый формат. Не забывайте, что fb2 является предпочтительным форматом нашей библиотеки и книги следует заливать, по возможности, в нём. И уж во всяком случае, не стоит заменять формат fb2 другим форматом.

Если почему-то вам не хочется разбираться в формате fb2, берите на вычитку книги, представленные в библиотеке в текстовом формате. Их можно заливать в том виде, в каком вы их скачали.
Также можно брать файлы в форматах djvu или pdf и распознать их в текстовый формат. Однако это касается преимущественно художественной литературы, т.е. произведений, состоящих в основном из текста. Книги с множеством иллюстраций, таблиц, формул лучше оставить в том виде, в каком они есть.

Если я что-то упустила или невнятно сформулировала, спрашивайте. :)

Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
Они помогут Вам разобраться в пользовании самой распространённой программой FBE.
Всем привет! :)

Alexashka написал:
golma1 написал:

Вам следует скооперироваться со сканировщиками. Напишите здесь, что Вы берётесь распознавать книги.
Или здесь посмотрите книги в форматах pdf и djvu и займитесь их распознаванием и конвертированием. Разумеется, речь идёт, в первую очередь, о художественной литературе, поскольку большинство книг из "нехудожки" нецелесообразно конвертировать в fb.

Спасибо.
В теме про сканирование отписался.
А вот скачать книги в форматах odt, djvu и pdf не удаётся - я уже пытался. Видимо мой статус не позволяет :(

А FB2 позволяет?
Первые три дня нельзя ничего закачивать.
ODT откройте в OpenOffice(если не ошибаюсь, это его формат) и сохраните его как .doc, после чего можно(но не обязательно) закачивать на сайт, или можно сконвертировать с помощью OOOFBTools в FB2, НО после любой конвертации нужно результат править и только после этого выкладывать FB2, а не полуфабрикат.
Если DJVU и PDF превышают некий размер(конкретно- спрашивать библиотекарей), то он не будет принят библиотекой, хотя может остаться на FTP, "засоряя" его.
UPSИзвиняюсь, ответил не на то!
Подумал, что не можешь ЗАкачать, а ты оказывается, Скачать хочешь?
Скачивать можешь с зеркала(если конечно, на зеркале есть такой файл)

Да я разбираюсь в форматах файлов :).
Проблема не в том, что я не знаю чем открыть ODT.
Проблема в том, что, для того, чтобы начать помогать - надо иметь доступ к тем книгам, которые ещё не имеют должного вида. А доступ не дадут, пока ты не стал полезным для сайта. :)
Вот и пытаюсь решить данную диллему...
А где находится зеркало? :)

Аватар пользователя golma1

Alexashka написал:

А вот скачать книги в форматах odt, djvu и pdf не удаётся - я уже пытался. Видимо мой статус не позволяет :(

Не должно бы быть.
Напишите, какие книги Вы хотели бы скачать. Если они из ограниченного доступа, передам для работы по почте.

Зеркало (или, вернее, бывшее зеркало): http://www.flibusta.net

Ну на пробу хотел вот эту:
Большая энциклопедия кулинарного искусства.
Книга большая должна быть :)

Аватар пользователя golma1

Alexashka написал:
Ну на пробу хотел вот эту:
Большая энциклопедия кулинарного искусства.
Книга большая должна быть :)

Ок. Пришлите мне в личку Ваш мэйл.
Кстати, там есть и pdf-файл. Интересует? Для сличения и проверки, например.

Да, pdf-файл интересует, если он есть.

В Большой кулинарной энциклопедии уже перелопатил 48% страниц. Скоро начну осваивать Среднеазиатские кухни.
Самый большой затык в этой энциклопедии - это каждый рецепт надо внести в оглавление.

Энциклопедию на голодный желудок не рекомендую читать...

Аватар пользователя golma1

Alexashka написал:

Самый большой затык в этой энциклопедии - это каждый рецепт надо внести в оглавление.

???
Что Вы имеете в виду?

Ну в оригинале книги все рецепты есть в оглавлении - соответственно, чтобы они нормально распознались в формате FB2 - надо заголовок каждого рецепта соответственно отметить.
Было бы там три раздела и 20 глав - давно бы доделал...
А тут - несколько книжек в одной, сотни рецептов... :) по редактору - 1200 с лишним страниц.

Аватар пользователя Tanja45

Alexashka написал:
Самый большой затык в этой энциклопедии - это каждый рецепт надо внести в оглавление...

(подозрительно) О чём это Вы? Если названия рецептов оформлены заголовками, то они отобразятся в оглавлении сами собой. Оглавление в читалках автоматом формируется из заголовков с возможностью быстрого перехода по главам. Вы уверены, что Вы fb2 делаете?

Вот именно, что "...если названия рецептов оформлены заголовками..."
А если они как простой текст идут? :)

Alexashka написал:
Вот именно, что "...если названия рецептов оформлены заголовками..."
А если они как простой текст идут? :)

Если они идут как простой текст, то тут по обстоятельствам: либо, если рецепты короткие, то <subtitle> , либо, если каждый рецепт очень длинный, то тогда оформить его как </section><section><title>
subtitle делается так: курсор ставим на строку, которую нужно сделать подзаголовком и нажимаем Alt+S.

Zadd написал:
Alexashka написал:
Вот именно, что "...если названия рецептов оформлены заголовками..."
А если они как простой текст идут? :)

по обстоятельствам: либо, если рецепты короткие, то <subtitle> , либо, если каждый рецепт очень длинный, то тогда оформить его как </section><section><title>
Если надо, чтобы были в оглавлении, то увы - только title'ами. Технически: выделить строку (или несколько строк) с названием рецепта и нажать shft-Enter, выделенная строка превращается в title, соответственно обрамляются секции. Если до и/или после title образуются пустые строки - удалить, неча им там болтаться.
Аватар пользователя golma1

Рыжий Тигра написал:
Если до и/или после title образуются пустые строки - удалить, неча им там болтаться.

С этим отлично справляется скрипт "Заголовки, подзаголовки". ;)

golma1 написал:
Рыжий Тигра написал:
пустые строки - удалить

С этим отлично справляется скрипт
Дооолго... Добежать до пустой строки и нажать Del - быстрее. :-)

Перевод книги в формат FB2 произведён.
Осталось проверить корректность конвертации, уровни вложенности оглавлений, пройти валидацию - и тогда залью книжку :).

Аватар пользователя Roxana

Кстати, про флибусту. Все собираюсь спросить - те зменения, которые вношу здесь, нужно вносить и туда? или обновление идет автоматически?

Аватар пользователя Ronja_Rovardotter

Если хотите, чтобы книга была и на Флибусте, то нужно добавить ее туда самостоятельно (или ждать пока кто-нибудь добавит). Автоматическое обновление книг и в обеих библиотеках отсутствует.

Заменила книгу Андрея Лескова "Жизнь Николая Лескова". Отметьте в таблице, пожалуйтса.

Аватар пользователя golma1

abigam написал:
Заменила книгу Андрея Лескова "Жизнь Николая Лескова". Отметьте в таблице, пожалуйтса.

Сделано. Спасибо.

Хотела вычитать эту книгу, заодно могу создать к ней тэги. но скачать файл не получается. Если можно, скиньте на электронку.

marina.elets@mail.ru написал:
Хотела вычитать эту книгу, заодно могу создать к ней тэги. но скачать файл не получается. Если можно, скиньте на электронку.

Отправил
Аватар пользователя XtraVert

Привел в чувство русековского Шамиля(http://lib.rus.ec/b/186904)...Почти готовы "сарацины"(http://lib.rus.ec/b/185072)..."Песни Оссиана" все еще пьют мою кровь...

Аватар пользователя Tramell

Отметьте, пожалуйста, в таблице - Стивен Фрай "Теннисные мячики небес" вычитан, обновленная версия залита в базу библиотеки.

Хочу здесь же спросить: Как конвертировать в FB2 отсканированные страницы книги (формат PDF или WinDjView например)?

Аватар пользователя golma1

Tramell написал:
Отметьте, пожалуйста, в таблице - Стивен Фрай "Теннисные мячики небес" вычитан, обновленная версия залита в базу библиотеки.
Хочу здесь же спросить: Как конвертировать в FB2 отсканированные страницы книги (формат PDF или WinDjView например)?

Спасибо. Отметила.

pdf и djvu нужно сначала распознать (при помощи, например, FineReader), а потом сохранить результаты в текстовом виде. После этого конвертировать в fb2, заполнить дескриптор, отформатировать текст, оптимизировать иллюстрации, расставить (при необходимости) сноски и пр. и пр. и пр. ;)

Для pdf существуют конверторы. Некоторые платные ничего бывают.

Аватар пользователя XtraVert

Хотелось бы узнать, что означает название книги, подсвеченное красным...Спасибо

Аватар пользователя golma1

XtraVert написал:
Хотелось бы узнать, что означает название книги, подсвеченное красным...

Где?
Аватар пользователя XtraVert

в списке новинок...(http://lib.rus.ec/new)

Аватар пользователя golma1

XtraVert написал:
в списке новинок...

Это подсвечивается книга, которая была последней в Ваш предыдущий заход на страницу.
Аватар пользователя XtraVert

спасиб....А то я уже начал всякую фигню думать:)...Кстати, исправляя невалидные и либрусешые файлы, надо ли где отписываться, или будет достаточно пометок в самом файле, в истории изменений?

Аватар пользователя golma1

XtraVert написал:
спасиб....А то я уже начал всякую фигню думать:)...Кстати, исправляя невалидные и либрусешые файлы, надо ли где отписываться, или будет достаточно пометок в самом файле, в истории изменений?

Достаточно проставить себя автором документа в kit'овских файлах и отметиться в истории изменений.
Аватар пользователя Enton

Добрый день. Нет времени просматривать всю ветку в поисках ответа. Хотел бы добавить в библиотеку несколько книг собственного сканирования вычитки плюс кое что из других источников. Однако в конвертировании fb2 не силён - могу я прислать вычитанный текст для последующего конвертирования и добавления?

Аватар пользователя golma1

Enton написал:
Добрый день. Нет времени просматривать всю ветку в поисках ответа. Хотел бы добавить в библиотеку несколько книг собственного сканирования вычитки плюс кое что из других источников. Однако в конвертировании fb2 не силён - могу я прислать вычитанный текст для последующего конвертирования и добавления?

Конечно, да.
Можете, например, выложить всё одним архивом на файлообменник и дать ссылку.
Аватар пользователя Enton

Хорошо, вот здесь готовый файл книги + иллюстрации: "Скука Харухи Судзумии" Нагару Танигава, перевод с японского. На либрусеке уже имеется эта книга - но переведённая с английского. Разница достаточно существенная. Текст взят из свободного доступа.
http://depositfiles.com/files/vngmyatsh

Аватар пользователя golma1

Enton написал:
Хорошо, вот здесь готовый файл книги + иллюстрации: "Скука Харухи Судзумии" Нагару Танигава, перевод с японского. На либрусеке уже имеется эта книга - но переведённая с английского. Разница достаточно существенная. Текст взят из свободного доступа.
http://depositfiles.com/files/vngmyatsh

Спасибо. Скачала, сделаю.
Скажите, а в тексте есть метки, где должны быть иллюстрации? Что-то я их не вижу.
Аватар пользователя Enton

Мммм... Имена иллюстраций - это номера страниц, но они конечно же сместятся если ставить картинки в реальном размере. Может вы дадите мне мэйл, чтобы не возится с файлообменником, я вышлю текст с метками для иллюстраций.

Аватар пользователя golma1

Отправила в личку.

Аватар пользователя Enton

Всё, файл отправил. Спасибо за... содействие :-)

Аватар пользователя golma1

Enton написал:
Всё, файл отправил. Спасибо за... содействие :-)

Готово. :)
http://lib.rus.ec/b/187587
Аватар пользователя Enton

О, отлично!
Кстати... у меня работе есть еще несколько хороших книг. По завершении работы можно обращаться к Вам?

Аватар пользователя golma1

Enton написал:
О, отлично!
Кстати... у меня работе есть еще несколько хороших книг. По завершении работы можно обращаться к Вам?

Можно. :)

golma1 написал:
Enton написал:
О, отлично!
Кстати... у меня работе есть еще несколько хороших книг. По завершении работы можно обращаться к Вам?

Можно. :)

Подскажите пожалуйста нужно ли заливать Мир фантастики январь 2010 и март 2010, и если я их вам по почте отправлю вы сможете их залить?
просто я не знаю куда лучше в генезис или на либрусек?
И еще нужно ли вообще журналы заливать и если да то какой лучше тематики!
И еще подскажите пожалуйста почему не сделать отдельную тему Книги- ВОСТРЕБОВАНО!
и заливать туда названия книг которые многим нужны и их точно нет на либрусе и генезисе а то можно очень оконфузиться например я хотел залить книгу и обнаружил ее на генезисе но немного под другим названием узнал только из за автора и размера, но не всегда есть время открыть книгу и прочитать при заливке ориентируюсь прежде всего по названию!

Аватар пользователя golma1

_____555_______ написал:

Подскажите пожалуйста нужно ли заливать Мир фантастики январь 2010 и март 2010, и если я их вам по почте отправлю вы сможете их залить?
просто я не знаю куда лучше в генезис или на либрусек?

А какой формат и какой объём?

_____555_______ написал:

И еще нужно ли вообще журналы заливать и если да то какой лучше тематики!
И еще подскажите пожалуйста почему не сделать отдельную тему Книги- ВОСТРЕБОВАНО!

Сделайте.

_____555_______ написал:
например я хотел залить книгу и обнаружил ее на генезисе но немного под другим названием узнал только из за автора и размера, но не всегда есть время открыть книгу и прочитать при заливке ориентируюсь прежде всего по названию!

Это проблема. Но ответственный заливщик ;) непременно сначала проверит всеми доступными способами. Вы же ответственный заливщик, правда? :)

объем 95 mb каждый журнал!

Аватар пользователя golma1

_____555_______ написал:
объем 95 mb каждый журнал!

Точно не на сайт. А в каком формате у Вас получается такой громадный файл? Может быть, найдётся какая-то альтернатива.

В pdf просто нужно ли их в другой формат перегонять?

Аватар пользователя golma1

_____555_______ написал:
В pdf просто нужно ли их в другой формат перегонять?

Предполагаю, что пдф размером в 95 Мб можно значительно уменьшить.
Попробуйте поискать решение. Ключевые слова "уменьшить размер pdf". В Гугле 528.000 "попаданий". ;)

Пробовал, результат еще хуже, если интересно готов отдать на вы читку у меня комп слабый когда я ее зарядил в файн ридер 9 он очень на долго задумался и повис!!!
+ уже есть апрельский номер но пока не решился ? с этими номерами, я его скачивать не стал.

Можно подойти с другой стороны. сохранить все страницы в виде графики и пережать в Djvu.

Страницы

X