Файл fb2, полученный из FR11


В продолжение темы "Мои алгоритмы работы с FR11". На всякий случай повторюсь: ни на чём не настаиваю, никого ни в чём не убеждаю, не утверждаю, что мой метод лучше какого бы то ни было другого. Просто делюсь собственным опытом.



Итак, мы получили файл fb2 при помощи опции ФР "сохранить как fb2". Если при сохранении вы заполнили название книги и автора, то они уже стоят в дескрипшене. Но файл в любом случае невалидный, поскольку в дескрипшене отсутствуют обязательные данные. Поэтому первая задача - сделать файл валидным.

1 этап - заполнение дескрипшена.


- жанр по умолчанию всегда "science" -- меняем на правильный
- название и автор -- заполнено (если нет, заполняем)
- "дата текстом" -- для переводных книг я ставлю здесь год, когда сделан перевод (он может быть отличным от года издания)
- "значение даты" -- не заполняю
- "обложка" -- прикрепляю файл cover.jpg и выбираю его в окне "изображение" (насчёт размеров: с недавнего времени по просьбе уважаемых сканировщиков делаю обложки чуть больше - 500 пикселей по горизонтали; но при этом слежу, чтобы размер после разумного сжатия не превышал 100 кб - если не получается, уменьшаю до 450)
- "язык" - русский
- "язык оригинала" -- соответствующий (если книга НЕ переводная, НЕ НАДО дублировать "русский" в этой графе)
- "переводчики" -- ищу вариант написания имени на Либрусеке (он зачастую намного полнее, чем в выходных данных книги) и записываю в дескрипшен именно так (при этом поиске иногда находятся дубли авторов-переводчиков, если вы на 100% уверены, что это одно лицо, можно их объединить)
- "серия" - снова ищу написание серии на Либрусеке. В это окно вносится авторская серия. Если книги в ней нумерованы, внесите номер в соответствующее поле.


Различные даты:



Раздел дескрипшена "Информация об оригинале книги" заполняется тем же образом, только "дата текстом" должна быть соответствующая (см. скриншот), а в графе "язык" должен быть указан язык, на котором написана книга.
Имя автора и название книги, как правило, указаны в ВД (выходных данных) книги или даже даны отдельной страницей. Кроме того, можно попытаться найти эти данные на Озоне: под русским названием книги обычно стоит её название на языке оригинала, а если кликнуть на имя автора в разделе "Персоны" (ниже на странице), то в открывшемся окне, опять-таки как правило, есть настоящее (не переводное) имя автора.
Записывать или нет название авторской серии (разумеется, на языке оригинала) серии в этом разделе - выбор верстальщика. Когда-то внесение этой информации приводило к конфликту на странице автора, сейчас, по-моему, этой проблемы нет.


Раздел дескрипшена "FB2-документ" заполняется интуитивно. Не забудьте только изменить набор цифр в разделе "дата текстом". Ибо совершенно непонятно, откуда ФР их берёт. В "Source OCR" я записываю ники сканировщика, OCR-щика и вычитывальщика (например: Scan&ReadCheck: Ronja_Rovardotter; OCR: golma1). Если книга не вычитывается, то пишу OCR&SpellCheck: golma1.
Если вы делаете книгу "с нуля" (со сканов), то в разделе Source URLs можно записать интернет-адрес библиотеки, для которой вы делаете эту книгу.


Раздел дескрипшена "Бумажная книга" тоже понятен интуитивно. Все необходимые для него данные стоят в ВД книги. Строка "серия" предполагает издательскую серию (за редким исключением, книги в ней не нумерованы).


Раздел дескрипшена "Дополнительная информация" предназначен для любой информации, которую вы сочтете важной, но место для которой в основных разделах дескрипшена не предусмотрено. Например: "Художественное оформление Александра Шпакова". С недавних пор я стала вписывать сюда также типографские данные (они обычно даются в конце книги на отдельной странице). В "тип" можно поставить "general" - общая (информация). А можно и не заполнять.


В дескрипшене некоторые поля можно дублировать - кликом на значок двойного окна:

"Крестик" убирает лишние поля.


В самом верху страницы дескрипшена есть кнопка "показать", где можно выбрать, что именно вы хотите видеть на этой странице:

Комментарии

Аватар пользователя Антонина82

У меня не работает. Не могли бы Вы дать ссылку на работающую версию.

Антонина82 написал:
У меня не работает. Не могли бы Вы дать ссылку на работающую версию.

Все мои скрипты лежат http://yadi.sk/d/JAxigKB7DXGBe
Если не надо точки щелкаете Нет. После набора имен и выхода Переносите Имена в словарь и OK. Больше на этих именах останавливаться не будет.
Аватар пользователя Антонина82

Скачала, установила. Не работает. Пишет

Антонина82 написал:
Скачала, установила. Не работает. Пишет

В каталоге FictionBook Editor\XML\. Должен быть файл-словарь voc_1.txt. В нем хранятся слова. По-моему в скрипте это 149 строка.
Скачайте еще раз по тому же адресу. Я туда добавлю свой каталог XML. В нем мой словарь. Слова можно добавлять в любом тестовом редакторе, не обязательно по алфавиту. Или потом в каком-нибудь редакторе расставить по алфавиту. Но это не обязательно.
Аватар пользователя Антонина82

Спасибо, заработало.

Антонина82 написал:
Спасибо, заработало.

Прекрасно!

izekbis написал:

В каталоге FictionBook Editor\XML\. Должен быть файл-словарь voc_1.txt...

Речь идет о любой версии FBE? Если я, особо одаренный, правильно понял, то три папки из Вашего архива нужно поместить в FBE?

час написал:
izekbis написал:

В каталоге FictionBook Editor\XML\. Должен быть файл-словарь voc_1.txt...

Речь идет о любой версии FBE? Если я, особо одаренный, правильно понял, то три папки из Вашего архива нужно поместить в FBE?

Ниже 2.6 не знаю. Не обязательно папки можно отдельные скрипты.
Аватар пользователя Isais

Еще раз, медленно: диалоговая страница выходит пустая. У меня. Перемещение HTML-файла в разные папки директории FBE не помогло.

А теперь продолжайте рассказывать , как У ВАС все работает. И почему.

Набрал пару слов, вышел. Окно пополнения словаря не появилось.

tvnic написал:
Набрал пару слов, вышел. Окно пополнения словаря не появилось.

Где набрал?

Запустил скрипт и пару раз кликнул нет.

tvnic написал:
Набрал пару слов, вышел. Окно пополнения словаря не появилось.

А, что появляется? Словарь есть? Какая версия FBE? Папки все мои?

izekbis написал:
tvnic написал:
Набрал пару слов, вышел. Окно пополнения словаря не появилось.

А, что появляется? Словарь есть? Какая версия FBE? Папки все мои?

Проблемы нет, разобрался.

Существует ли место, где можно найти обновленный/дополненный скрипт "Поиск по набору регэкспов"?
-------------------
И, пожалуйста, немного ликбеза.
Чтобы что-то самому добавить в этот скрипт, требуется его (например Поиск по набору регэкспов.js) открыть блокнотом и добавить, что необходимо?
Я открываю и вижу строки типа

Аватар пользователя Isais

На 1-й вопрос не отвечу.
На 2-й: смените блокнот на другой, с поддержкой UTF-8. В штатном виндовом блокноте открывается как текст:

Цитата:
// ТУТ НАДО НАСТРОИТЬ СПИСОК РЕГЭКСПОВ
// Каждый регэксп настраивается строкой такого формата:
// addRegExp("регэксп","ключи","описание","в каких тегах искать","лимит для просмотра назад");
// Слеши \ в регэкспе надо удвоить
// Если регэксп содержит прямые кавычки, перед ними надо поставить слеш: \"
// (этот слеш перед кавычкой не надо удваивать)
// "Ключ" (пока) поддерживается только один:
// i – поиск без учета регистра (case Insensitive)
// По умолчанию поиск происходит с учетом регистра
// "Описание" – это текст, который выведется в строке статуса, когда
// по регэкспу будет что-то найдено
// "В каких тегах искать" – параметр должен содержать сочетания
// "плюс или минус, потом имя элемента", разделенные пробелом.
// К примеру, если этот параметр имеет значение "+poem -stanza +title",

Цитата:
открыть блокнотом

Попробуйте что-нибудь типа Notepad++ (http://notepad-plus-plus.org/download/v6.5.5.html)
Все станет понятнее.

XtraVert написал:
Все станет понятнее.

Спасибо, все стало намного понятнее.
Isais написал:
На 1-й вопрос не отвечу.

У меня скрипт версии декабрь 2012. Правда строчку от себя сейчас добавил.
Аватар пользователя Антонина82

tvnic написал:

У меня скрипт версии декабрь 2012. Правда строчку от себя сейчас добавил.

Могу предложить свою версию http://rusfolder.com/40480334
Это вариант был взят у Голмы. Но я регулярно пополняю словарь. По-моему единственный реальный способ бороться с фантазий ФР. Вот и сегодня список пополнился: запятая - занятая, колон (даже не знала о существование такого слова, но гугл сказал, что есть) - колен и т.д.
Особенно актуально для старых книг. Если какое-то словосочетание мешает, то его можно удалить. (Я работаю в блокноте с этой программой. )
***
Просьба к тем, кто может написать формулу -
Вариант: Она шла домой, по ее остановил Фёдор. Чтобы можно было распознавать этот вариант, т.к. вместо по нужно но

Антонина82 написал:
tvnic написал:

У меня скрипт версии декабрь 2012. Правда строчку от себя сейчас добавил.

Могу предложить свою версию http://rusfolder.com/40480334
Это вариант был взят у Голмы. Но я регулярно пополняю словарь. По-моему единственный реальный способ бороться с фантазий ФР. Вот и сегодня список пополнился: запятая - занятая, колон (даже не знала о существование такого слова, но гугл сказал, что есть) - колен и т.д.
Особенно актуально для старых книг. Если какое-то словосочетание мешает, то его можно удалить. (Я работаю в блокноте с этой программой. )
***
Просьба к тем, кто может написать формулу -
Вариант: Она шла домой, по ее остановил Фёдор. Чтобы можно было распознавать этот вариант, т.к. вместо по нужно но

Попробуйте:
addRegExp("[а-я] по ","i","Найдено: -по- в обрамлении пробелов, скорее всего нужно -но-")
Я еще добавил ваш регесп:
addRegExp("[.] [а-яё]","","Найдено: точка в середине предложения");

izekbis написал:

Попробуйте:
addRegExp("[а-я] по ","i","Найдено: -по- в обрамлении пробелов, скорее всего нужно -но-")
Я еще добавил ваш регесп:
addRegExp("[.] [а-яё]","","Найдено: точка в середине предложения");

Ваш вариант будет находить все предлоги "по" по тексту. Добавьте впереди запятую - должно искать "по" после запятой.

golma1 написал:
izekbis написал:

Попробуйте:
addRegExp("[а-я] по ","i","Найдено: -по- в обрамлении пробелов, скорее всего нужно -но-")
Я еще добавил ваш регесп:
addRegExp("[.] [а-яё]","","Найдено: точка в середине предложения");

Ваш вариант будет находить все предлоги "по" по тексту. Добавьте впереди запятую - должно искать "по" после запятой.

А перед "но" всегда запятая?

izekbis написал:
golma1 написал:
izekbis написал:

Попробуйте:
addRegExp("[а-я] по ","i","Найдено: -по- в обрамлении пробелов, скорее всего нужно -но-")
Я еще добавил ваш регесп:
addRegExp("[.] [а-яё]","","Найдено: точка в середине предложения");

Ваш вариант будет находить все предлоги "по" по тексту. Добавьте впереди запятую - должно искать "по" после запятой.

А перед "но" всегда запятая?

По правилам русского языка всегда. Кстати, в этом же скрипте есть регэксп, который ищет "но" в пробелах, предполагая, что это "по". Признаком как раз является отсутствие запятой.

golma1 написал:
izekbis написал:
golma1 написал:
izekbis написал:

Попробуйте:
addRegExp("[а-я] по ","i","Найдено: -по- в обрамлении пробелов, скорее всего нужно -но-")
Я еще добавил ваш регесп:
addRegExp("[.] [а-яё]","","Найдено: точка в середине предложения");

Ваш вариант будет находить все предлоги "по" по тексту. Добавьте впереди запятую - должно искать "по" после запятой.

А перед "но" всегда запятая?

По правилам русского языка всегда. Кстати, в этом же скрипте есть регэксп, который ищет "но" в пробелах, предполагая, что это "по". Признаком как раз является отсутствие запятой.

В регеспе после запятой пробел нужен, или нет?

izekbis написал:

В регеспе после запятой пробел нужен, или нет?

Да, конечно.

golma1 написал:
izekbis написал:

В регеспе после запятой пробел нужен, или нет?

Да, конечно.

И как он будет выглядеть?

golma1 написал:
izekbis написал:

В регеспе после запятой пробел нужен, или нет?

Да, конечно.

В таком виде:
addRegExp("[а-я] , по ","i","Найдено: -по- после после запятой, скорее всего нужно -но-")
искать любое "по" перестал.
Что не так?

izekbis написал:
golma1 написал:
izekbis написал:

В регеспе после запятой пробел нужен, или нет?

Да, конечно.

В таком виде:
addRegExp("[а-я] , по ","i","Найдено: -по- после после запятой, скорее всего нужно -но-")
искать любое "по" перестал.
Что не так?

Ну, что никто не знает!

izekbis написал:
izekbis написал:
golma1 написал:
izekbis написал:

В регеспе после запятой пробел нужен, или нет?

Да, конечно.

В таком виде:
addRegExp("[а-я] , по ","i","Найдено: -по- после после запятой, скорее всего нужно -но-")
искать любое "по" перестал.
Что не так?

Ну, что никто не знает!

А в ответ - тишина...

А проверить, поразмышлять... ?!
Если в скрипте "Поиск по набору регэкспов.js" прописано так же, как:

Цитата:
addRegExp("[а-я] , по "...
,
то очевидно нужно убрать пробел между квадратной скобкой и запятой.

Alex2L написал:
А проверить, поразмышлять... ?!
Если в скрипте "Поиск по набору регэкспов.js" прописано так же, как:
Цитата:
addRegExp("[а-я] , по "...
,
то очевидно нужно убрать пробел между квадратной скобкой и запятой.

Называется: "Глаз замылился". спасибо!

Alex2L написал:
А проверить, поразмышлять... ?!
Если в скрипте "Поиск по набору регэкспов.js" прописано так же, как:
Цитата:
addRegExp("[а-я] , по "...
,
то очевидно нужно убрать пробел между квадратной скобкой и запятой.

Очевидно стоит убрать и "[а-я]" - лишнее. Оставить addRegExp(", по "...
Аватар пользователя Антонина82

Цитата:
Попробуйте:
addRegExp("[а-я] по ","i","Найдено: -по- в обрамлении пробелов, скорее всего нужно -но-")

А нельзя ли уточнить, чтобы искало не везде, где есть предлог "по", а только после запятой. Очень уж распостранен этот "по"
Увидела ответ Голмы :)

Антонина82 написал:
Увидела ответ Голмы :)

Т.е. нужно так? addRegExp("[а-я] ,по ","i","Найдено: -по- в обрамлении пробелов, скорее всего нужно -но-")
-------------------
Явно сделал не так, как требуется...
Поделитесь, почему Вы в своем скрипте отказались от некоторых строк? // tagRegExp
Аватар пользователя Антонина82

tvnic написал:
Антонина82 написал:
Увидела ответ Голмы :)

Т.е. нужно так? addRegExp("[а-я] ,по ","i","Найдено: -по- в обрамлении пробелов, скорее всего нужно -но-")
Поделитесь, почему Вы в своем скрипте отказались от некоторых строк? // tagRegExp

Это "тяжелое" наследство Голмы :) Я редко от чего отказываюсь
Отказалась от "далее - даже", "итак "и так" - слишком часто пришлось бы тормозить. ФР эти слова (по моим наблюдениям), в большей части правильно определял.
Намедни хотела отказаться от "нос", а тут как тут - вылезла ошибка. Надо было "но с". Оставила.
Чисто эмпирическим путем определяю "кандидатов на удаление".

Всем спасибо. Воспользуюсь обязательно.
------------------------
Почему-то не отображается здесь вся строка и после нее.
И мое "творчество" - tagRegExp("(?

tvnic написал:
Всем спасибо. Воспользуюсь обязательно.
------------------------
Почему-то не отображается здесь вся строка и после нее.
И мое "творчество" - tagRegExp("(?<![а-яё])сие(?![а-яё])","i","Найдено: слово "сие" ("сне" с опечаткой).","",1);

Пользуйтесь тэгом "code", он сохраняет написание тэгов.

golma1 написал:
Пользуйтесь тэгом "code", он сохраняет написание тэгов.

Ага, спасибо.

Может кто в шведском горазд?
Что это за буква после Dawkins W H:

Аватар пользователя Антонина82

sem14 написал:
Может кто в шведском горазд?
Что это за буква после Dawkins W H:

Я - не горазда. Но разве это не b. Просто перед ней стоит /

Антонина82 написал:
sem14 написал:
Может кто в шведском горазд?
Что это за буква после Dawkins W H:

Я - не горазда. Но разве это не b. Просто перед ней стоит /

Угу. Просто название написано без заглавных букв.
Переводится как "Письма и дневники".

http://www.amazon.de/Brev-dagbok/dp/9171604642

golma1 написал:
Антонина82 написал:
sem14 написал:
Может кто в шведском горазд?
Что это за буква после Dawkins W H:

Я - не горазда. Но разве это не b. Просто перед ней стоит /

Угу. Просто название написано без заглавных букв.
Переводится как "Письма и дневники".

http://www.amazon.de/Brev-dagbok/dp/9171604642


Мерсибо.
Надеюсь, закончить книгу Энглунда к столетию начала Великой войны, а не конца.

На всякий случай, вдруг понадобится:
Книга (оцифрованной в свободном доступе не нашел)
Человек
Знглунд на английском
или так

sd написал:
На всякий случай, вдруг понадобится:
Книга (оцифрованной в свободном доступе не нашел)
Человек
Знглунд на английском
или так

Тихо опэкээнел от того, как Австралия помнит своих жертв в первой мировой. Если кто не знал, АНЗАК бросали на самые тяжелые участки, как штрафников Британской империи.
Это вам не Третий Рим.
Аватар пользователя alexej36

addRegExp("[а-я], по ","i","Найдено: -по- после после запятой, скорее всего нужно -но-")
Работает, спасибо!
Как точку с запятой в конце абзаца спалить можно?
Как сделать чтобы картинка в тексте не прерывала поиск по регекспам?
А еще "Генеральная уборка" из такие, ...такие делает такие…такие Как ее "отучить"?

alexej36 написал:
addRegExp("[а-я], по ","i","Найдено: -по- после после запятой, скорее всего нужно -но-")
Работает, спасибо!
Как точку с запятой в конце абзаца спалить можно?
Как сделать чтобы картинка в тексте не прерывала поиск по регекспам?
А еще "Генеральная уборка" из такие, ...такие делает такие…такие Как ее "отучить"?

Попробуйте мою ГУ я когда-то эту проблему устранял. Все мои скрипты лежат http://yadi.sk/d/JAxigKB7DXGBe
Точку с запятой и аналогичные устраняю "Заменить все".
С картинкой в тексте пока справиться не удалось.

alexej36 написал:

А еще "Генеральная уборка" из такие, ...такие делает такие…такие Как ее "отучить"?

Нет, не делает.

До:

После:

Аватар пользователя alexej36

Та генеральная уборка, что выложил izekbis действительно работает корректно. А та, что из дистрибутива FBE 2.66 - портит текст как я писал выше.

alexej36 написал:
Та генеральная уборка, что выложил izekbis действительно работает корректно. А та, что из дистрибутива FBE 2.66 - портит текст как я писал выше.

Значит, что-то произошло уже позже. У меня версия 2.6.4, Генуборка работает как положено.

golma1 написал:
alexej36 написал:
Та генеральная уборка, что выложил izekbis действительно работает корректно. А та, что из дистрибутива FBE 2.66 - портит текст как я писал выше.

Значит, что-то произошло уже позже. У меня версия 2.6.4, Генуборка работает как положено.

Выложите свою. У меня 2.3 - я сделал именно это изменение. Заменю.

Страницы

X