Проект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.

Форум пока очень неудобный для этого, так что пока будем обсуждать здесь... Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;) я предлагаю "сплочиться" =D просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.) Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет. СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ. FAQ: > Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу. Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =) что хотите то и выбираете) > С каким форматом предстоит работать? с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =) общая информация здесь и тут в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;) 1. общая информация о формате 2. описание тегов и простой пример книги. 3. как сделать книгу 4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только 5. несколько статей и инструкций по fb2 6. Создание электронных книг в формате FictionBook 2.1: практическое руководство > Условия, правила вычитки, форматирования? правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.) [quote]а теперь главное! в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]

Комментарии

soshial написал:
это ты из олдмаглибоских перевел? да??
кстати хорошие книжки?
и еще, если я тебе скину их на английском - ты в fb2 переведешь? пожалуйста.

Источник rtf и скана - Библиотека Старого Чародея.
Если книги будут в rtf/doc - могу попробовать, но не быстро и вычитать не смогу. Кстати, 3-я и четвертая у меня есть в fb2. Нужно?

заливай все что есть, чего не на Либрусеке.
нам нужны любые языки)

скажи, откуда ты взял эти fb2 ффорде на английском???
сам перевел или скачал? мне нужен этот твой источник!! ;)

Аватар пользователя Captain Scarlett

soshial написал:
кстати хорошие книжки?

Отличные :) Очень хорошее развлекательно-интеллектуальное чтение.

Наконец то появилось время для редактирования выбраной книжки Терри Пратчетт "Море и рыбаки". Были мелкие огрехи распознавания, а так все нормально. Завтра выложу новый вариант.

З.Ы. Алекс Орлов "Тени войны-1" возмусь вычитывать, там много ошибок распознавания.

Залил исправленную книгу Пратчетта http://lib.rus.ec/b/104599. Через пару дней выложу Орлова

Товарищи, а каким образом можно поставить книги к вам в очередь на вычитку?

Xellos написал:
Товарищи, а каким образом можно поставить книги к вам в очередь на вычитку?

Пишите прямо здесь, какие книги требуют вычитки, и дайте на них ссылки. Если они, конечно, уже залиты на Либрусек.
Если не залиты, но в таком виде, что их как-то можно читать, залейте сначала. Если залить нельзя, пришлите кому-нибудь на е-мэйл (напишите сначала в личку).

Для книг, залитых на Либрусек, есть фича "пожаловаться на плохое качество книги" - можете ей тоже воспользоваться. :-)

Закачал Воннегута - Утопия 14 - http://lib.rus.ec/b/104637
Просьба проверить сноски (делал их первый раз).

это радостно, что ты помог в вычитке книги, НО! (я сегодня злой, так просто перечислю недостатки)
0. кодировка cp1251 вместо utf8.
1. первый же абзац - ошибка с лишним пробелом:

Цитата:
Северо- восток - место жительства управляющих, инженеров

2. далее, во всем тексте ВСЕ ТИРЕ заменены на дефисы (кроме диалоговых, конечно - они заменены на полу-тире):
Цитата:
– Не вставайте, не вставайте, - сказал он Баду, который растянулся на диване.

3. поехали дальше, смотрим дескрипшен:
что было:
Цитата:
* fictionbook/description/title-info/genre prose_contemporary
* fictionbook/description/title-info/author/first-name Курт
* fictionbook/description/title-info/author/last-name Воннегут
* fictionbook/description/title-info/book-title Утопия 14
* fictionbook/description/title-info/date 1952
* fictionbook/description/title-info/lang ru
* fictionbook/description/title-info/src-lang en
* fictionbook/description/document-info/author/first-name Scanda
* fictionbook/description/document-info/program-used FB Tools
* fictionbook/description/document-info/date 2005-10-11
* fictionbook/description/document-info/src-url www.lib.ru
* fictionbook/description/document-info/src-ocr Д.Соловьев
* fictionbook/description/document-info/id 14280E91-C1CB-41AA-B462-99A8BE011529
* fictionbook/description/document-info/version 1.0

что стало:
Цитата:
* fictionbook/description , ,
* fictionbook/description/title-info , , , , ,
* fictionbook/description/title-info/genre sf
* fictionbook/description/title-info/author
* fictionbook/description/title-info/author/first-name Курт
* fictionbook/description/title-info/author/last-name Воннегут
* fictionbook/description/title-info/book-title Утопия 14
* fictionbook/description/title-info/lang ru
* fictionbook/description/document-info , , , , ,
* fictionbook/description/document-info/author
* fictionbook/description/document-info/program-used Fiction Book Designer, FB Editor v2.0
* fictionbook/description/document-info/date 30.05.2008
* fictionbook/description/document-info/id FBD-02SN9H7L-R91F-GAQV-BO4V-LUM4I21H5SDK
* fictionbook/description/document-info/version 1.1

1) старый id удален и вместо этого поставлен новый, да еще и с префиксом FBD!!!
это неприемлемо!
2) информация о годе, оригинальном языке книге и авторе сделавшем первую версию просто СТЁРТЫ!!!!
3) даты прошлого редактирования нет,, да и вообще информации о том, кто сделал эту, новую версии нет тоже!! дескрипшен вообще пустой!!
прежде чем приниматься за работу, за что я очень хотел бы сказать спасибо посмотрели бы как правильно делать его:

<description>
  <title-info>
   <genre>sf_social</genre>
   <author>
    <first-name>Дэниэл</first-name>
    <last-name>Киз</last-name>
   </author>
   <book-title>Цветы для Элджернона</book-title>
   <annotation>
    <p>Тридцать лет назад это считалось фантастикой. </p>
    <p>Тридцать лет назад это читалось как фантастика. </p>
    <p>Исследующая и расширяющая границы жанра, жадно впитывающая всевозможные новейшие веяния, примеряющая общечеловеческое лицо, отважно игнорирующая каинову печать "жанрового гетто". </p>
    <p>Сейчас это воспринимается как одно из самых человечных произведений новейшего времени, как роман пронзительной психологической силы, как филигранное развитие темы любви и ответственности. Не зря вышедшую уже в 90-е книгу воспоминаний Киз назвал "Элджернон и я". </p>
   </annotation>
   <date value="1966-01-01">1966</date>
   <coverpage>
    <image l:href="#cover.png"/></coverpage>
   <lang>ru</lang>
   <src-lang>en</src-lang>
   <translator>
    <first-name>Сергей</first-name>
    <last-name>Шаров</last-name>
   </translator>
  </title-info>
  <src-title-info>
   <genre>sf_social</genre>
   <author>
    <first-name>Daniel</first-name>
    <last-name>Keyes</last-name>
   </author>
   <book-title>Flowers for Algernon</book-title>
   <date value="1966-01-01">1966</date>
   <coverpage>
    <image l:href="#cover.png"/></coverpage>
   <lang>ru</lang>
   <src-lang>en</src-lang>
   <translator>
    <first-name>Sergey</first-name>
    <last-name>Sharov</last-name>
   </translator>
  </src-title-info>
  <document-info>
   <author>
    <nickname>soshial</nickname>
    <email>***</email>
   </author>
   <author>
    <nickname>shum29</nickname>
    <email>***</email>
   </author>
   <program-used>Book Designer 4.0 MS Word, AlReader2, FB Editor v2.0</program-used>
   <date value="2008-05-24">24.05.2008</date>
   <src-url>all-ebooks.com</src-url>
   <src-ocr>c777</src-ocr>
   <id>GN0V9GD7-X821-3PTX-HIFM-BGK9WA5CWMNJ</id>
   <version>2.0</version>
   <history>
    <p>v0.0 - создание chm - c777 (???)</p>
    <p>v1.0 - создание fb2 - shum29 (25.06.2007)</p>
    <p>v2.0 - полная вычитка книги в тех местах, где это требовалось - soshial (24.05.2008)</p>
   </history>
  </document-info>
  <publish-info>
   <book-name>Цветы для Элджернона</book-name>
   <publisher>Домино, Эксмо</publisher>
   <city>М.</city>
   <year>2006</year>
   <isbn>5-699-15744-1</isbn>
  </publish-info>
</description>

5. если у вас после этого всё еще осталось желание заниматься вычиткой))), просто посмотрети как это делаеют другие и учитесь на своих ошибках =)

PS@golma. видите какой я добрый сегодня?) pps. не придирайтесь к ошибкам в этом посте, потому что писал "в гневе" (книгу, кстати удалил), и не следаил за правильностью... да и вообще, во всем виновата книга, которую я привел как пример))) хыхы)

Залил исправленную версию. http://lib.rus.ec/b/104861/
А

Цитата:

history
v0.0 - создание chm - c777 (???)
v1.0 - создание fb2 - shum29 (25.06.2007)
v2.0 - полная вычитка книги в тех местах, где это требовалось - soshial (24.05.2008)
history

в FBE 2 - это где?
Цитата:
да и вообще информации о том, кто сделал эту, новую версии нет тоже!
- а если я не хочу?

осталось добавить (src-title-info)

  <src-title-info>
   <genre>sf_social</genre>
   <author>
    <first-name>Daniel</first-name>
    <last-name>Keyes</last-name>
   </author>
   <book-title>Flowers for Algernon</book-title>
   <date value="1966-01-01">1966</date>
   <coverpage>
    <image l:href="#cover.png"/></coverpage>
   <lang>ru</lang>
   <src-lang>en</src-lang>
   <translator>
    <first-name>Sergey</first-name>
    <last-name>Sharov</last-name>
   </translator>
  </src-title-info>

и историю, которую я указал где находится: в разделе (document-info)
до него можно добраться в FB Editor v2.0 так: слева в оглавлении есть как раз такая надпись history - надо её двойны кликом ткнуть и вписывать =)

отлично! осталось только сделать структуру книги (по главам) и поправить fictionbook/description/src-title-info/lang en на ru

Цитата:

1) старый id удален и вместо этого поставлен новый, да еще и с префиксом FBD!!! это неприемлемо!
2) информация о годе, оригинальном языке книге и авторе сделавшем первую версию просто СТЁРТЫ!!!!
3) даты прошлого редактирования нет,, да и вообще информации о том, кто сделал эту, новую версии нет тоже!! дескрипшен вообще пустой!!

Чтобы вышеозначенная инфа сохранялась, в окне "make Fiction Book file" надо поставить галки в следующих боксах
- book for library
- import description
- import id

Если при импорте fb2 надо соxранить оригинальные секции -> F9 -> галка на "section import".

Для проверки валидности, изменения кодиировки и ручного редактирования fb2 можно пользовать Fiction Book Investigator, входящий в состав FBD (Tools -> Fiction Book Investigator).

@sohial: Добрый, добрый! В-) @Polarnik: Он у нас очень строгий, за порядком следит.;-) Будете переделывать или попробуете себя в чём-нибудь другом? :-)

Переделаю.
1. Если сохранить в UTF размер увеличиться в 2 раза.
2. Нужны длинные тире ? http://ru.wikipedia.org/wiki/Тире
3. А что на счёт сносок?

1. Если файл находится в архиве, то при смене кодировки файла на utf, размер архива увеличивается максимум на 20%, а поскольку на Либрусеке все хранится в архивах, то utf как раз рекомендуется (не могу привести ссылку на пост Ларина)
2. Можно использовать полутире (ndash), но использовать дефис в тех местах, где должно быть mdash или ndash - нельзя.
3. сноски приемлемо, но все будет лучше если сделать их с помощью FBEditor, он справляется намного лучше; да и пользоваться FBDesigner - не рекомендуется, потому что он портит дескрипшен и еще у него есть некоторые баги, не говоря уже о том, что он не обновлялся с 2006 го года, а значит и не соответствует последним спецификациям стандарта FB (он в последние годы усовершенствовался, да-да!)))
4. decription хорошо генерит FBEditor - качать здесь: http://www.fictionbook.org/forum/viewtopic.php?t=5433 (самая последняя версия - очень удобная!!!)

Аватар пользователя Captain Scarlett

Раз уж Вы такой добрый, то и я к Вам с вопросами :) Я сейчас как раз разбираюсь с FB Editor и туплю. Как в нем добавить в текст новые заголовки (title)??

izaraya написал:
Раз уж Вы такой добрый, то и я к Вам с вопросами :) Я сейчас как раз разбираюсь с FB Editor и туплю. Как в нем добавить в текст новые заголовки (title)??

Сtrl+T - заголовок
Alt+S - подзаголовок

А вообще, очень рекомендую прочесть это, сразу решится много вопросов. ;-)

Аватар пользователя Captain Scarlett

golma1 написал:
izaraya написал:
Раз уж Вы такой добрый, то и я к Вам с вопросами :) Я сейчас как раз разбираюсь с FB Editor и туплю. Как в нем добавить в текст новые заголовки (title)??

Сtrl+T - заголовок
А вообще, очень рекомендую прочесть это, сразу решится много вопросов. ;-)

Ура, разобралась! Нужно было сначала разбить на секции, а потом уже добавлять заголовки. Спасибо :)

Я пытался разобраться как сделать сноски в FBE 2 (брал по ссылке с фикшбука)- не понял (Утопию 14 делал из rtf в Ворде - затем в FBD, затем в FBE).
Из ссылок на статьи в шапке тож не понятно.
Размер файла в utf кодировке - 1,13 Мб, в win -672 кб.

Аватар пользователя Captain Scarlett

Polarnik написал:
Я пытался разобраться как сделать сноски в FBE 2 (брал по ссылке с фикшбука)- не понял

Ставите курсор на то место, где должна быть сноска. Scripts -> Добавление сноски со вводом (или ctrl+shift+4), в появившееся окошко копируете текст сноски. Номер сноски скрипт проставит сам.

насчет размеров файлов (заливай utf!!) зазипуй сначала а потом сравни =)

если fbd не рекомендуется, то как насчёт связки OpenOffice c ExportToFB21?

думаю, это хорошая вещь, но у меня она не пашет пока что...=(
его код выдает ошибку(
буду ждать патча)
так что пока ничё сказать не могу...

Polarnik написал:
если fbd не рекомендуется, то как насчёт связки OpenOffice c ExportToFB21?

Я готовил документ при помощи этой связки. Но потом дорабатывал напильником - FBEv2 для простановки сносок и вставки картинок, EditPlus для "причесывания" текста(embasis захватывающий пробелы и т.п.)

Могу помочь проекту с переводом книг в fb2. Только как это лучше сделать? Искать не-fb2 книги по сайту?

AVB написал:
Могу помочь проекту с переводом книг в fb2. Только как это лучше сделать? Искать не-fb2 книги по сайту?

Да. :-)
Только, пожалуйста, давайте знать, какие книги Вы берёте. Потому что я тоже потихоньку конвертирую txt и doc в fb2. Не нужно, чтобы мы с Вами делали одну и ту же работу. ;-)

Могу Вам сразу же дать пример:
Людмила Астахова. НЧЧК-2. Командировка. Сам файл в формате txt. Но там всего 7 глав. Есть полный вариант: здесь - 11 глав. Нужно дополнить и конвертировать в fb2.

Возьмётесь? :-)

golma1 написал:
Могу Вам сразу же дать пример:
Людмила Астахова. НЧЧК-2. Командировка. Сам файл в формате txt. Но там всего 7 глав. Есть полный вариант: здесь - 11 глав. Нужно дополнить и конвертировать в fb2.

Возьмётесь? :-)

ОК, сделаю
Единственное - я, наверное, сразу с самиздата все главы возьму. Есть возражения?

AVB написал:

ОК, сделаю
Единственное - я, наверное, сразу с самиздата все главы возьму. Есть возражения?

Абсолютно никаких. :-)
Занесла Вас в список.

меня немного тревожит, что мы опять сами компилируем книги и вычитываем их, которые могут оказаться черновиками!! (на СИ - по определению черновики лежат)

Для истории сгодится, когда появится окончательный вариант книги, сделать примечание_черновик...
знаю по опыту некоторые черновики интереснее чем окончательный вариант...
набоков к примеру...

Людмила Астахова. НЧЧК-2. Командировка.
11 глав в fb2
Done!
http://lib.rus.ec/b/104723

Что следуюшее обработать? :)

Быстро Вы управились! Cool!

А как Вы к эзотерике относитесь? Половина Блаватской - в txt. Посмотрите? :-)

golma1 написал:
Быстро Вы управились! Cool!

Опыт не пропьешь :)
Я на фикшинбук и альдебаран кучу книг залил (пока они нормальными библиотеками были)

golma1 написал:
А как Вы к эзотерике относитесь? Половина Блаватской - в txt. Посмотрите? :-)

К эзотерике равнодушен, но почему бы и не сделать? :)
Запишите за мной Блаватскую... Правда ее так быстро не получится (сегодня со временем было получше), но потихоньку сделаю

AVB написал:
Опыт не пропьешь :)

Такие люди нам нужны! :-)

Записываю за Вами Блаватскую. Не торопитесь. ;-)
Спасибо.

её, кстати, я залил)))
из коллекции arteume =)

Ну, вот - ты залил, AVB перегонит в fb2 - и будет всем счастье. ;-))
Осталось только прочесть. В-)

Начал добавлять (пока мелкие файлы), но что-то пошло не так :(
В общем, исходники остаются на прежнем месте (в отличие от Астаховой, когда либа предложила оставить один из двух файлов - fb2 или txt)

История одной планеты:
fb2 http://lib.rus.ec/b/104728
txt http://lib.rus.ec/b/104575

Письмо Фадеевой
fb2 http://lib.rus.ec/b/104727
txt http://lib.rus.ec/b/104578

Я подчистила дубли.
Посмотрите здесь, я постаралась подробно описать, как это делается. ;-)

Имею вопросы насчёт тире. В википедии написано:

Цитата:
Тире отбивается пробелами по таким правилам: [...]
* Вокруг всех остальных тире предписывается ставить узкие (2 п.) пробелы, причем перед тире пробел должен быть неразрывным. Однако из-за технических ограничений компьютерного набора нередко вместо укороченных пробелов ставят обычные; такая практика допускается и официально «в изданиях оперативной полиграфии»
Что такое "узкий пробел" или "укороченный пробел", которым отбивается тире справа? Я читаю книги на LBook eReader V3, при его сравнительно небольшом экране и крупном шрифте несколько неприятно выглядят тире, отбитые с одной стороны  'ём, а с другой - обычным пробелом: если строка сильно растягивается для выравнивания - тире "перекашивается" в сторону неразрывного пробела, если строка не растягивается - всё нормально. Какой, собственно, символ ставить - чтобы поддерживался в FB2, обрабатывался читалками (как минимум, CoolReader'ом) и не требовал обязательной перегонки книги в UTF-8?

И второй вопрос: не следует ли отбивать тире, отделяющее авторский текст от прямой речи, неразрывным пробелом со стороны прямой речи? Пример:

"—[неразрывный-пробел]Я не виноват,[неразрывный-пробел]—[просто-пробел]оправдывался Илька.[просто-пробел???]—[неразрывный-пробел???]У меня хвост новый, не тренированный. Мне мышцу качать надо, а некогда!"

Честно говоря, не помню, где я вычитал это правило, но до сих пор считал, что оно правильно. Теперь сомневаюсь. Подскажите, плиз!

Рыжий Тигра написал:

"—[неразрывный-пробел]Я не виноват,[неразрывный-пробел]—[просто-пробел]оправдывался Илька.[неразрывный-пробел]—[простой-пробел]У меня хвост новый, не тренированный. Мне мышцу качать надо, а некогда!"

Честно говоря, не помню, где я вычитал это правило, но до сих пор считал, что оно правильно. Теперь сомневаюсь. Подскажите, плиз!


Делаю аналогично. ИМХО, оформляется таким образом для того, что бы при переносах не получилось
"[начало строки]— оправдывался Илька."
Т.е. новый абзац.

У Кондратовича написано:

Цитата:

Об использовании неразрывных пробелов.
В FB2 ими отделяются: а) длинное тире в начале прямой речи от идущего следом слова; б) длинное тире в тексте от идущего впереди слова или знака препинания. Еще неразрывным пробелом можно «связать» идущий в начале предложения однобуквенный предлог со следующим словом.

Получается, что в твоём примере:
"—[неразрывный-пробел]Я не виноват,[неразрывный-пробел]—[просто-пробел]оправдывался Илька.[неразрывный-пробел]—[простой-пробел]У меня хвост новый, не тренированный. Мне мышцу качать надо, а некогда!"

Кстати, я в датах использую "дефис". Например, 1941-1945.
Неправильно?

golma1 написал:
У Кондратовича написано: [...] Получается, что в твоём примере: [...] оправдывался Илька.[неразрывный-пробел]—[простой-пробел]У меня хвост новый, [...]
Ну да. Но про то, как отделять тире после прямой речи, Кондратович не пишет. Вот меня и гложут сомненья - как именно правильно: оставлять тире прижатым к предыдущей прямой речи (а при переносе - в той же строчке) или привязывать его к последующему авторскому тексту. Мой вкус мне вообще-то подсказывает привязывать всегда к слову слева от тире, но я не уверен. :(
golma1 написал:
я в датах использую "дефис". Например, 1941-1945. Неправильно?
ИМХО всё же в датах и маршрутах поездов надо что-то более длинное, чтобы показать не только крайние значения, но и  м е ж д у   н и м и  - а то с дефисом оно выглядит как одно слово. Я использую полутире (en dash).

Рыжий Тигра написал:
всё же в датах и маршрутах поездов надо что-то более длинное, чтобы показать не только крайние значения.... - а то с дефисом оно выглядит как одно слово. Я использую полутире (en dash).

Да, наверное, так правильнее. А с пробелом или без?

golma1 написал:
Рыжий Тигра написал:
всё же в датах и маршрутах поездов надо что-то более длинное
с пробелом или без?
Э... щас попробую на вкус... :)

...таки без пробела. (Википедия тоже с этим согласна. :) )

что дальше?

AVB написал:
что дальше?

Аристотель, например. ;-))))
Как Вы к нему относитесь?

Беру на вычитку "Дело о свалке токсичных заклинаний"
http://lib.rus.ec/b/55631

Страницы

X