Проект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.

Форум пока очень неудобный для этого, так что пока будем обсуждать здесь... Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;) я предлагаю "сплочиться" =D просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.) Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет. СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ. FAQ: > Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу. Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =) что хотите то и выбираете) > С каким форматом предстоит работать? с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =) общая информация здесь и тут в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;) 1. общая информация о формате 2. описание тегов и простой пример книги. 3. как сделать книгу 4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только 5. несколько статей и инструкций по fb2 6. Создание электронных книг в формате FictionBook 2.1: практическое руководство > Условия, правила вычитки, форматирования? правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.) [quote]а теперь главное! в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]

Комментарии

По ходу данными скобками заменены знаки препинания (пока нашёл на месте запятых).
Как хотите, но сделаю читабельно.

Polarnik написал:
По ходу данными скобками заменены знаки препинания (пока нашёл на месте запятых).
Как хотите, но сделаю читабельно.

Запишем Вас в герои Либрусека!

и все-таки они стремненькие))))))))))

Причина ошибки - троеточия, и одно слово были заключены в треугольные скобки "<>" - документ получался невалидный, и при просмотре в fb2 читалке не открывался полностью.

Polarnik написал:
Причина ошибки - троеточия, и одно слово были заключены в треугольные скобки "<>" - документ получался невалидный, и при просмотре в fb2 читалке не открывался полностью.

Я уже не первый раз встречаю эту ошибку - треугольные скобки. Исправить её получается только в Investigator'e: он и открывает, и указывает на ошибку.
Интересно, откуда она берётся?

Диверсанты наверно :-)

golma1 написал:

Я уже не первый раз встречаю эту ошибку - треугольные скобки. Исправить её получается только в Investigator'e: он и открывает, и указывает на ошибку.
Интересно, откуда она берётся?

Похоже, где-то что-то не так с кодовыми страницами и некоторыми специальными символами. А угловые скобки -- это испорченные типографские кавычки, аналогично и с многоточием, которое при неправильном конвертировании может превратиться в двоеточие ":".

golma1 написал:
Я уже не первый раз встречаю эту ошибку - треугольные скобки. [...] Интересно, откуда она берётся?
Из текстовых файлов при леворукой перегонке. Примечания, купюры, вставка потерянных (по мнению OCR'щика или корректора) слов...

Рыжий Тигра написал:
golma1 написал:
Я уже не первый раз встречаю эту ошибку - треугольные скобки. [...] Интересно, откуда она берётся?
Из текстовых файлов при леворукой перегонке. Примечания, купюры, вставка потерянных (по мнению OCR'щика или корректора) слов...

Дело в том, что речь, видимо, идет именно о треугольных (угловых) скобках, а не о квадратных.
Так вот, квадратные скобки действительно вылезают из недоделанных файлов, которые были в txt (например, ссылки, пропущенные места и т.п.), а угловые -- тоже криворукость перегонщика, только еще бОльшая. Например, (не надо так делать!) кто-то некорректно конвертировал *.doc в *.txt (пример: antiword -m cp866.txt file.doc > file.txt) или не совсем правильно сохранил текстовый файл (кстати, и fb2 тоже касается) в не совсем "правильном" редакторе, (пример -- редактор от FAR'а), и т.п., более подробно (с примерами) могу описАть...

kozlenok написал:
или не совсем правильно сохранил текстовый файл (кстати, и fb2 тоже касается) в не совсем "правильном" редакторе, (пример -- редактор от FAR'а)
У-уу!.. Я так не один fb2 изгадил, пока допёр... :(

беру Яна Алексеева Практикум по алхимии http://lib.rus.ec/b/105377 Вычитать, расставить ссылки

запишите меня

hagen написал:
беру Яна Алексеева Практикум по алхимии http://lib.rus.ec/b/105377 Вычитать, расставить ссылки
запишите меня

Done.

эта книга оказалась книгой "ученье свет", с серией вместо названия, я ее удалил. можете вычеркнуть.

hagen написал:
эта книга оказалась книгой "ученье свет", с серией вместо названия, я ее удалил. можете вычеркнуть.

Нет. В удалённой книге - 5 частей, тогда как в "Ученье - свет" только три, они вошли в "Практикум по алхимии". Поэтому, думаю, её стоить восстановить. Может быть, указать, что это - более полный вариант, что в неё вошла книга "Ученье - свет".

Кстати, только что увидела, что "Ученье - свет" присутствует дважды. Не знаете случайно, дубли ли это?

edti: Разобралась. Однозначно дубль. Причём более ранняя версия была залита позже. :-( Я её удалила. Думаю, стоит восстановить "Практикум по алхимии" и написать "полная версия". В неё вошли и первая, и вторая книги цикла и добавлена ещё одна часть. Сделаете?

не нашел отличий в размере между версиями с фикшена и той, с либрусека. тогда, если там каким-то образом присутствует вторая книга, как она называется?

hagen написал:
не нашел отличий в размере между версиями с фикшена и той, с либрусека. тогда, если там каким-то образом присутствует вторая книга, как она называется?

В удалённой книге - 5 частей:
1. Практикум по алхимии
2. Ученье - свет
3. Полевая практика
4. Светские хроники цвета Сиреневой Лилии
5. Раз, два, три, четыре, пять - вышли Стражи погулять.

Первые три - здесь.
Четвёртая - здесь.
Пятая часть, насколько я поняла, новая.

У Юрия Никитина висит три книги "Как стать писателем". Две - первое издание (как я понял), третья книга является 2-м изданием. Из первых изданий, у этой http://lib.rus.ec/b/39649 в аннотации "заменить книгу, купив с Литреса", весит 132 кб, у этой http://lib.rus.ec/b/103815 вес 1,4 Мб.
Произвёл замену на 2-ю.

Случайно наткнулся на сайт с детскими книжками: http://www.childhoodbooks.ru/files.htm - сплошь DJVU. Кому нужно, кто может - перелейте, плиз, сюда. А может, кто-то и переберёт в fb2?..

вы посотмрите какая здесь фигнотень!! http://lib.rus.ec/b/105629/edit

да кто вообще такое заливает???)
ощущение, что у нас специальные вредители))

soshial написал:
вы посотмрите какая здесь фигнотень!! http://lib.rus.ec/b/105629/edit
да кто вообще такое заливает???)
ощущение, что у нас специальные вредители))

А что Вас смущает? То, что книга не на русском? :)
Я ее вряд ли прочту, но при беглом просмотре - кому-то, наверное, интересно...

AVB написал:
А что Вас смущает? То, что книга не на русском? :)
Я ее вряд ли прочту, но при беглом просмотре - кому-то, наверное, интересно...

Я тоже бегло посмотрела и погуглила немного. ;-)
Автор не указан, текст не сначала. Вот здесь - оригинал: http://www.ukrcenter.com/library/read.asp?id=2020&page=1#text_top

Текст, который расположен на Либрусеке, начинается со второй страницы. Когда будет время, исправлю. А может, кто-нибудь успеет раньше меня. ;-)

и что ето?

hagen написал:
и что ето?

Hagen, это ты мне? Я ничего не поняла. :-(

Угу, резонное дополнение.
Юникод не подскажете для неразрывного пробела? 0160, или?

Э... Помню, что амперсенд nbsp; а код - ща гляну...
Ага. В 1251 это 0xA0, а в юникоде - ага, кажется, U+00A0, т.е. опять же десятичный 160.

правда, вынужден признаться, что делал не я...
Точнее, почти закончив первую книжку, вспомнил что нужно проверить в своей библиотеке... И точно! Все уже было готовое :)

Так что готов взяться за следующего автора

AVB написал:
правда, вынужден признаться, что делал не я...
Точнее, почти закончив первую книжку, вспомнил что нужно проверить в своей библиотеке... И точно! Все уже было готовое :)
Так что готов взяться за следующего автора

Бывает. ;-)
Ну, если Вы так рвётесь в бой, вот Вам списочек.

http://lib.rus.ec/b/102971
http://lib.rus.ec/b/88219
http://lib.rus.ec/b/92869
2 книги здесь - http://lib.rus.ec/a/10459

Хватит пока? ;-)

golma1 написал:
Ну, если Вы так рвётесь в бой, вот Вам списочек.
...
Хватит пока? ;-)

Вполне! Спасибо :)

отметьте как обработанную, плз
http://lib.rus.ec/b/105218

Если просто ставить, то Ctrl+Shift+пробел (в некоторых редакциях предлагают просто Ctrl+пробел). Или нажать пробел на один раз больше, чем надо, а потом вернуть курсор при помощи BackSpace на нужное место (программа сама заменяет более двух пробелов на неразрывные).

А как сделать массовую замену в FBE, я сама интересуюсь. Пока не знаю.

Аватар пользователя Captain Scarlett

Да, меня именно массовая замена интересует. Править несколько тысяч пробелов вручную я не хочу :)

Вы можете попробовать сделать так:
1. Вызвать меню "заменить".
2. В окне "найти" ввести [пробел-дефис-пробел].
3. В любом месте текста ввести [неразрывный пробел-тире-пробел] и вырезать эти три знака (Ctrl+X).
4. Вставить их в окно "заменить" (Ctrl+V).
5. Нажать "заменить все".

Аналогично с тире в диалогах:
[дефис-пробел] на [тире-неразрывный пробел]

Не очень изящное решение, но работает. Я предполагаю, что можно сделать красивее, но не знаю, как.
Подождём, что скажут специалисты. :-)

Соболезную. :-((
Желаю как можно скорейшего решения проблем. Сама знаю, как это обидно...

У нас появился новый фронт работы. Спасибо пользователю ilsatyd , любезно предоставившему исходные материалы.

По мере выкладки буду добавлять ссылки. А пока:

Бабенко. Рассказы. Сканы и rtf-файл (распознавание сохранено, насколько я поняла, как "редактируемая копия"). Брать здесь.

Бабенко. Приблудяне. Невалидный fb2-файл и два txt-файла. Брать здесь.

Два рассказа из сборника "Фата Моргана". В каждом - rtf-файл и сканы. Оба лежат здесь.

Фармер "Конец времен" Сканы и rtf-файл (распознавание такое же, как у Бабенко). Брать здесь и здесь.

Головачев "Реквием машине времени" Сканы, rtf-файл и txt-файл.

Желающие принять участие, отзовитесь.

Ну нифига ж себе объемчик.. Я бы взялся за Фармера, если б не 100+ Мб выкачивать.
Трафик такие объемы не позволяет :(
А просто rtf отдельно нету? В смысле, без сканов.

МихалЫч написал:
Ну нифига ж себе объемчик.. Я бы взялся за Фармера, если б не 100+ Мб выкачивать.
Трафик такие объемы не позволяет :(
А просто rtf отдельно нету? В смысле, без сканов.

Есть. Только, боюсь, что без оригинала будет очень сложно. :-( Если хотите, могу выслать Вам на мыло. Пишите в личку.
edit:
Только что просмотрела Фармера. Вполне доступно. Если хотите, возьмитесь за него. А если будут проблемы, я Вам помогу сравнить со сканами.

Головачев "Реквием машине времени" Сканы, rtf-файл и txt-файл. Брать здесь и здесь.

Обновился список книг для распознавания.
Сканы пока никуда не выложены. Желающие поучаствовать обращайтесь, пожалуйста, в личку. Договоримся о способе передачи.

Бабенко Земля
Борис Хазанов
Компьютер по имени Джо (сборник)
Крапивин "Мушкетер и фея"
Крапивин "Возвращение клипера 'Кречет'"
Крапивин "Ковер-самолет"
Теодор Томас "Целитель"
Ночь, которая умирает (сборник)
Обратная связь (сборник)
Перпендикулярный мир (сборник)
Продается Япония (сборник)

Фармер уже "пристроен". Кто следующий? :-)

Берусь заменить файлы Пушкина, сделанные rusec-ом, оригиналами, находящимися в свободном доступе.
С небольшой задержкой: хочу восстановить отступы сделанные автором, но уничтоженные при переводе в fb2 (особое отношение Грибого и К0 к отступам). Видны на большинстве читалок, кроме AlReader-а, сохраняются при конвертации в rtf и html.

sd написал:
Берусь заменить файлы Пушкина, сделанные rusec-ом, оригиналами, находящимися в свободном доступе.
С небольшой задержкой: хочу восстановить отступы сделанные автором, но уничтоженные при переводе в fb2 (особое отношение Грибого и К0 к отступам). Видны на большинстве читалок, кроме AlReader-а, сохраняются при конвертации в rtf и html.

Я уже заметила Вашу работу по исправлению пушкинских драм. Браво!

Фармер Филип Хосе - Конец времен. Вычитан и выложен (заменен старый, где был фрагмент). Ссылка, кому интересно - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном - у него почему то отсутствует пятый том из серии "Путь Бога" и нет романа "За дверью".

Фармер Филип Хосе - Конец времен. Вычитан и выложен (заменен старый, где был фрагмент). Ссылка, кому интересно - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном - у него почему то отсутствует пятый том из серии "Путь Бога" и нет романа "За дверью".

Фармер Филип Хосе - Конец времен. Вычитан и выложен (заменен старый, где был фрагмент). Ссылка, кому интересно - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном - у него почему то отсутствует пятый том из серии "Путь Бога" и нет романа "За дверью".

Фармер Филип Хосе - Конец времен. Фрагмент заменен полной версией - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном. У него отсутствует пятый том из серии "Путь Бога" и роман "За дверью".

Ссылку надо бы поправить. ;-)

http://lib.rus.ec/b/107126

Спасибо за Фармера. Белозерова записываю за Вами.

Фармер Филип Хосе - Конец времен. Фрагмент заменен полной версией - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном. У него отсутствует пятый том из серии "Путь Бога" и роман "За дверью".

Фармер Филип Хосе - Конец времен. Фрагмент заменен полной версией - http://lib.rus.ec/i/107126.
Далее займусь Белозеровым Антоном. У него отсутствует пятый том из серии "Путь Бога" и роман "За дверью".

Что-то у меня куча одинаговых постов ушла. А как лишние удалить?

МихалЫч написал:
Что-то у меня куча одинаговых постов ушла. А как лишние удалить?

Сам пост удалить не получится, только текст. :-(

Страницы

X