Проект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.

Форум пока очень неудобный для этого, так что пока будем обсуждать здесь... Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;) я предлагаю "сплочиться" =D просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.) Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет. СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ. FAQ: > Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу. Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =) что хотите то и выбираете) > С каким форматом предстоит работать? с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =) общая информация здесь и тут в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;) 1. общая информация о формате 2. описание тегов и простой пример книги. 3. как сделать книгу 4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только 5. несколько статей и инструкций по fb2 6. Создание электронных книг в формате FictionBook 2.1: практическое руководство > Условия, правила вычитки, форматирования? правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.) [quote]а теперь главное! в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]

Комментарии

golma1 Есть несколько орг. вопросов по вычитке, свяжись, плиз, со мной по почте: epaper.ru[собака]gmail.com

Добавлю вдогонку: если автор в библиотеке уже есть, лучше всего сохранять уже существующее написание (с отчеством или без, например).
Я сама на этом споткнулась с Гумилёвым.

Гм... Хоть я и не согласен с таким подходом (ИМХО, если было без отчества, но оно известно, то стоит отчество добавить), но на будущее - учту

Беру Барбара Хэмбли-Вампиры

В распознании висит две книги, после Вампиров, если никто не займёт, могу распознать.

Polarnik написал:
В распознании висит две книги, после Вампиров, если никто не займёт, могу распознать.

Насчёт распознавания я не в курсе. Нужно подождать soshial.
Всё остальное внесла в таблицу. :-)

эт две книги висят на ocr'e - кто-то отсканить должен.
а распознаваний пока нет, но если хочешь могу скинуть - правда, я не уверен, что ты возьмёшься за учебник польского))
да и не знаю, возможно ли это: из djvu одних картинок склепать pdf с нормальным текстом без слоя со сканом???

Аватар пользователя Captain Scarlett

soshial написал:
из djvu одних картинок склепать pdf с нормальным текстом без слоя со сканом???

Девятый файнридер вроде такое умеет: finereader.abbyy.com/?param=137522#Formats. Сама не пробовала.

Если задача из djvu в pdf (хорошее качество скана), думаю можно без распознавания. djvu открыть в IrfanView, затем печать в PDFCreator.
Как вариант сойдёт и 9-й Файнридер.
Скинь ссылки на djvu - посмотрю.

http://lib.rus.ec/b/104779
http://lib.rus.ec/b/104814
это те учебники, из которыхз надо бы удалить слой сканннинга и оставить текст (векторный, ну ты понимаешь ;))

и еще, я тут книгу одну собираюсь сканить... тебе можно будет ее кинуть в tiff'e?
за распознание возьмешся?

если да - то отвечай в личку.

Учебники в pdf будут под 20 Мб - нужны?

я думал, что если из них сделать ocr/pdf, то как наоборот весить они будут меньше...

Теперь можно и за Андрэ Нортон взяться... :)

AVB написал:
Теперь можно и за Андрэ Нортон взяться... :)

Да Вам фронт работ никак не обеспечить. ;-)
Всё отметила.

AVB написал:
Теперь можно и за Андрэ Нортон взяться... :)

Похоже, без "работы" Вы не останетесь. :-(
Сегодня у Нортон появилось ещё 3 книги в doc - см. серию "Повелитель животных".

golma1 написал:
Сегодня у Нортон появилось ещё 3 книги в doc - см. серию "Повелитель животных".

Так это же хорошо! :)

AVB написал:
golma1 написал:
Сегодня у Нортон появилось ещё 3 книги в doc - см. серию "Повелитель животных".

Так это же хорошо! :)

А как Вы относитесь к англоязычным книгам? Всё так же "одной левой"? ;-))))

golma1 написал:
Сегодня у Нортон появилось ещё 3 книги в doc - см. серию "Повелитель животных".

С Повелителем животных" все оказалось намного проще :)
Он был в моей библиотеке...
Залил на сайт :)

Ой-ой-ой... Я в этом ничего не понимаю.
Придётся мне пользоваться "стандартными" программами.

В любом случае, спасибо за разъяснения.

golma1 написал:

http://www.the-ebook.org/forum/viewtopic.php?t=7858
http://www.the-ebook.org/forum/viewtopic.php?p=124019#124019
Много всего вперемешку, но и про CSS хватает. Это только темы, которые навскидку нашлись.

Рыжий Тигра написал:

http://www.the-ebook.org/forum/viewtopic.php?t=7858
http://www.the-ebook.org/forum/viewtopic.php?p=124019#124019
Много всего вперемешку, но и про CSS хватает. Это только темы, которые навскидку нашлись.

Ага. Спасибо, я почитаю. Но, по-моему, ты слишком хорошо обо мне думаешь. В-)

Так у меня для Вас уже ого-го какой список. :-D
А тут всё добавляется и добавляется. ;-)))

привет, помнишь про мою просьбу? =)
*конспирируясь* спросила его? ;)

soshial написал:
привет, помнишь про мою просьбу? =)
*конспирируясь* спросила его? ;)

Нет. Забыла. :-Р

Английский у меня - со словарем :(
Поэтому могу "зевать" кучу ляпов :(

Думаю, к англоязычным книгам можно будет приступать, когда не останется русскоязычных :)

Слушай, тут книга эксклюзивная... нигде не мог найти - даже в мегараздачах на торрентсе.
В этом или прошлом году автор получил Путлицеровскую премию...

можно тебя попросить в fb2 перегнать?? пожалуйста.

http://lib.rus.ec/a/30558

soshial написал:
Слушай, тут книга эксклюзивная... нигде не мог найти - даже в мегараздачах на торрентсе.
В этом или прошлом году автор получил Путлицеровскую премию...

можно тебя попросить в fb2 перегнать?? пожалуйста.

http://lib.rus.ec/a/30558

ОК, перегоним :)

ух ты!!! спасибо тебе большое!!! =)

soshial написал:
ух ты!!! спасибо тебе большое!!! =)

Вот теперь - пожалуйста :)
Книга залита :)

ЗЫ Качество распознавания - паршивое :( Что смог - пофиксил

спасибо!!
много багов осталось, но их я вычитаю ;)
еще раз благодарю! =)

-

Барбара Хэмбли - Вампиры готова http://lib.rus.ec/b/105617

Polarnik написал:
Барбара Хэмбли - Вампиры готова

ОК, отметила.
Что-нибудь ещё себе присмотрели? ;-)

Собиратели осколков - вычитать? Или проверить на полноту книги?
На всякий случай скачал, почитаю, если что будет исправит - исправлю :-)

Polarnik написал:
Собиратели осколков - вычитать? Или проверить на полноту книги?
На всякий случай скачал, почитаю, если что будет исправит - исправлю :-)

Там какая-то странная книга. Я в неё заглянула, но не поняла: то ли это огромное количество опечаток, то ли автором так задумано.
Надеюсь, Вы сумеете разобраться. ;-)

Самое интересное

Цитата:
nickname - rusec -nickname
email -lib_at_rus.ec - email
author program-used - LibRusEc kit
date value="2013-06-11"

FBE пишет ошибку

Цитата:
a name was started with an invalid character/
Line: 152 char: 794
и всё, не открывает.

Вот-вот! Вычитываю Ле Гуин "Толкователи". Тоже nickname - rusec -nickname
email -lib_at_rus.ec - email
author program-used - LibRusEc kit
и 2013 год. Открылся только Букдизайнером.Интересно, а зачем rusec делает такие "инвалидные" книжки?Нечаянно?
Вручную пришлось прописывать тэги и стряпать валидный файл. Вроде получилось.
И что обидно, только я знаю, что это с моей стороны подвиг, т.к. тяжело болею компьютерным идиотизмом и обоеруколевостью.

Tanja45 написал:
Вот-вот! Вычитываю Ле Гуин "Толкователи". Тоже nickname - rusec -nickname
email -lib_at_rus.ec - email
author program-used - LibRusEc kit
и 2013 год. Открылся только Букдизайнером.Интересно, а зачем rusec делает такие "инвалидные" книжки?Нечаянно?
Вручную пришлось прописывать тэги и стряпать валидный файл. Вроде получилось.
И что обидно, только я знаю, что это с моей стороны подвиг, т.к. тяжело болею компьютерным идиотизмом и обоеруколевостью.

Это книги автоматом сконвертированные, с соответствующим качеством :-\ из txt (если не ошибаюсь, из библиотеки Мошкова), в самом начале работы либрусека. Наверное, только для первоначального привлечения.
Если находится такая книга, и есть "нормальный", не "автоматизированный", вариант, то желательно залить нормальный вариант в эту библиотеку.

Tanja45 написал:
Вот-вот! Вычитываю Ле Гуин "Толкователи". Тоже nickname - rusec -nickname
email -lib_at_rus.ec - email
author program-used - LibRusEc kit
и 2013 год. Открылся только Букдизайнером.Интересно, а зачем rusec делает такие "инвалидные" книжки?Нечаянно?
Вручную пришлось прописывать тэги и стряпать валидный файл. Вроде получилось.
И что обидно, только я знаю, что это с моей стороны подвиг, т.к. тяжело болею компьютерным идиотизмом и обоеруколевостью.

Практически все файлы, созданные "rusec", нуждаются в обработке. Так что нужно принять как данность и всё.
Как правильно заметил Cd_spb, проще всего заменять такие файлы. Ну, или править ручками, если нет другого варианта. :-(

Ну, а за подвиг - гран мерси! Мы все ценим. :-)

golma1 написал:

Как правильно заметил Cd_spb, проще всего заменять такие файлы. Ну, или править ручками, если нет другого варианта. :-(

Дык...нету другого варианта. Сделала ручками и залила.
И еще вот беда - как безумный дятел, правила дефисы на тире ФБ-Эдитором - боялась грозного и сурового soshial. В Хаали-ридере и в FBE получились тире, а в Либрусечной читалке и в моем АйсБукРидере - двойные дефисы! Это как? Это за что? Опять все править?!!!

Tanja45 написал:
Дык...нету другого варианта. Сделала ручками и залила.
И еще вот беда - как безумный дятел, правила дефисы на тире ФБ-Эдитором - боялась грозного и сурового soshial. В Хаали-ридере и в FBE получились тире, а в Либрусечной читалке и в моем АйсБукРидере - двойные дефисы! Это как? Это за что? Опять все править?!!!

Я уже увидела "Толкователей". Посмотрела в своих читалках - всё в порядке. :-)
Кстати, замену дефисов на тире в FBE можно делать как "заменить все". Только нужно выбрать [пробел-дефис-пробел] и, соответственно, [пробел-тире-пробел]. Потом можно пройтись ещё раз с комбинацией [дефис-пробел] заменить на [тире-пробел] - для реплик в диалоге.

Или в Investigator'e можно воспользоваться юникодами:
(uni32)(uni45)(uni32)
заменить на
(uni32)(uni151)(uni32).
И тоже выбрать "replace all".

golma1 написал:
Кстати, замену дефисов на тире в FBE можно делать как "заменить все". Только нужно выбрать [пробел-дефис-пробел] и, соответственно, [пробел-тире-пробел]. Потом можно пройтись ещё раз с комбинацией [дефис-пробел] заменить на [тире-пробел] - для реплик в диалоге.
Или в Investigator'e можно воспользоваться юникодами:
(uni32)(uni45)(uni32)
заменить на
(uni32)(uni151)(uni32).
Только, ради бога, не пробел! Перед тире, если вас не затруднит, ставьте неразрывный пробел, а в начале реплик после тире - тоже неразрывный. А то очень мерзко смотрится, когда в длинном диалоге на выровненном тексте тире стоят строем, а текст после тире отплясывает. Да и тире, оторвавшееся от предыдущего слова и улетевшее на следующую строку, изящества тексту не добавляет. :(

golma1 написал:
Кстати, замену дефисов на тире в FBE можно делать как "заменить все". Только нужно выбрать [пробел-дефис-пробел] и, соответственно, [пробел-тире-пробел]. Потом можно пройтись ещё раз с комбинацией [дефис-пробел] заменить на [тире-пробел] - для реплик в диалоге.
Или в Investigator'e можно воспользоваться юникодами:
(uni32)(uni45)(uni32)
заменить на
(uni32)(uni151)(uni32).

Только, ради бога, не пробел! Перед тире, если вас не затруднит, ставьте неразрывный пробел, а в начале реплик после тире - тоже неразрывный. А то очень мерзко смотрится, когда в длинном диалоге на выровненном тексте тире стоят строем, а текст после тире отплясывает. Да и тире, оторвавшееся от предыдущего слова и улетевшее на следующую строку, изящества тексту не добавляет. :(

А можно с помощью этих интересных символов найти и заменить следующее , (запятая) слово (-а), затем закрывающая скобка, на ((скобка) слова, слова) (скобка)?

Polarnik написал:
А можно с помощью этих интересных символов найти и заменить следующее , (запятая) слово (-а), затем закрывающая скобка, на ((скобка) слова, слова) (скобка)?

Попробуйте почитать Кондратовича, раздел Регулярные выражения (приложение Д).
Там много интересного. ;-)

Для меня это пока китайская грамота, м.б. сумею разобраться.

Аватар пользователя Captain Scarlett

Цитата:
Перед тире, если вас не затруднит, ставьте неразрывный пробел, а в начале реплик после тире - тоже неразрывный.

Не подскажете, как это сделать в FBE?

Ага, у меня уже тик начинается от "Собирателей осколков"

Polarnik написал:
Ага, у меня уже тик начинается от "Собирателей осколков"

Сочувствую.
Я только заглянула, и мне уже плохо стало.

При просмотре fb2 в AkelPade имеются куски текста - "Российская Федерация( Белоруссия и Украина( выступившие" - со скобками (не закрываются), такое можеть быть? Причём эти скобки идут по всему абзацу.

Страницы

X