Мои алгоритмы работы с FR11

Последнее время часто стали возникать вопросы по поводу работы с ФР. Я много раз описывала свои методы - в личке, в форуме.
Сейчас решила собрать все советы в своём блоге.

Никого не собираюсь переубеждать, не буду тратить время на доказывание, что мой метод лучше какого бы то ни было другого; просто делюсь своими наработками - вдруг кому-нибудь пригодится? На вопросы по содержанию с удовольствием отвечу.

Я большой приверженец работы с ФР. С хорошими исходными файлами он позволяет максимально подготовить текст для экспорта сразу в fb2.
При таком экспорте решается сразу несколько важных проблем:
- диалоги сохраняют начальное тире, хотя в ФР после них стоят знаки табулятора (список/перечисление)
- сохраняется форматирование курсивом/полужирным
- никаких "мягких" переносов
- возможен экспорт картинок. Это, правда, половинное преимущество, поскольку картинку всё-таки хорошо бы обработать. Но, во-первых, обрабатывают картинки не все верстальщики, а во-вторых, сразу видно место, где они должны находиться.

Текст во многом писался для друзей, поэтому периодически встречается обращение на "ты".

После распознавания сохраните документ ФР.


Продолжение: Файл fb2, полученный из FR11

Комментарии

Аватар пользователя remembecoventry

Типографская раскладка Ильи Бирмана (http://ilyabirman.ru/projects/typography-layout/)

И фигурные скобки в любой программе при любой раскладке и ещё много чего.

Кстати, насчет FR и FBE: интересно, что, когда FR сохраняет в doc, он преобразует кавычки « и » в " и " и потом после конвертации приходится запускать скрипт. Так вот, оказывается, при копипасте эта "фича" не работает! Кавычки, какие были в скане, такие и вставляются.(Когда делал «Срубить крест» из «Следопыта», то обратил внимание и удивился, что кавычки не пришлось скриптом менять, они изначально оказались какие надо.) FR11 не ставил, пользуюсь 9, поэтому не знаю, как обстоит дело с кавычками при сохранении в fb2. Хотя допускаю, что несохранение вида кавычек в Ворд может быть опциональным, а я просто не отключил эту "фичу".

Аватар пользователя remembecoventry

Просто не знаю в какую ещё тему написать. Пишу сюда.
В библиотеку льют странным образом зацензуренные файлы.
Например, книга Губенко "Театр абсурда. Во что превратили Россию" - http://lib.rus.ec/b/453993
Парикмахеры в тексте стали парикма*censored*ами, хулиганы - *censored*ганами, порнография - *censored*графией.
Файл этот не единственный, я встретил уже, наверное, штук пять подобных в doc и pdf.
Люди, будьте бдительны при конвертации!

remembecoventry написал:
Просто не знаю в какую ещё тему написать. Пишу сюда.
В библиотеку льют странным образом зацензуренные файлы.
Например, книга Губенко "Театр абсурда. Во что превратили Россию" - http://lib.rus.ec/b/453993
Парикмахеры в тексте стали парикма*censored*ами, хулиганы - *censored*ганами, порнография - *censored*графией.
Файл этот не единственный, я встретил уже, наверное, штук пять подобных в doc и pdf.
Люди, будьте бдительны при конвертации!

Это, в основном, книги из-ва Алгоритм, выложенные издательством в свободный доступ.
Попадалось несколько. Очень был рад такому развлечению - угадыванием скрытого.
Самые трудные:
потре*censored*нство - потреблянство
*censored*ман - Херман
о*censored* - описка
зави*censored*ия завихрения

Такую книжку да Мизулиной в руки. Пусть порадуется.

Нумерация и перенумеровка областей.

Каждая область в распознанном документе имеет свой номер. Иногда нумерация сбивается, особенно часто - при наличии иллюстрации на странице. Тогда имеет смысл перенумеровать области в нужном порядке.
Сделать это довольно просто:

Я вынесла соответствующую кнопку на панель инструментов:

После выбора пункта меню (нажатия кнопки) вы увидите номера областей, выделенный болдом:

Щёлкните по каждой области в необходимом порядке: номера областей изменятся. После щелчка по последней области номера снова исчезнут. Если ошиблись, повторите сначала.
Перераспознавать после перенумерации не нужно.

В случае сложноструктурированного текста на странице (наличие нескольких столбцов, обтекающий картинку текст) удобно разбить текст на отдельные области и пронумеровать его в нужном порядке.

Аватар пользователя alexej36

ABBYY FineReader 12 Меняем дефисы в конце строк на мягкие переносы, где это нужно. В FR 11 Замена: - в "Поиск": дефис и разрыв строки - в "Заменить на": мягкий перенос и разрыв строки В FR 12 Замена: - в "Поиск": дефис и разрыв строки - в "Заменить на": мягкий перенос. <Символ разрыва строки не ставим, иначе слово разделится на две части>

alexej36 написал:
ABBYY FineReader 12
Меняем дефисы в конце строк на мягкие переносы, где это нужно.
В FR 11
Замена:
- в "Поиск": дефис и разрыв строки
- в "Заменить на": мягкий перенос и разрыв строки
В FR 12
Замена:
- в "Поиск": дефис и разрыв строки
- в "Заменить на": мягкий перенос. <Символ разрыва строки не ставим, иначе слово разделится на две части>

Не, лично я массово не меняю, прохожусь поиском и смотрю, это недолго обычно. А иначе все нужные дефисы, попавшие на перенос, пожрет нафиг.

upd: Пардон, "где это нужно" не заметил сразу. :))

Аватар пользователя alexej36

В билде 12.0.101.388 все вернулось назад. Теперь делаем как было в FR 11

Аватар пользователя Антонина82

В 5 номере "Иностранки" помещен новый перевод "Ричарда III". Напечатан текст так - на одной странице английский вариант - на другой русский перевод. Что-то не соображу, как лучше оформить, сначала все на английском, а потом на русском... Или как в ЖЗ оформили -чередованием текста. Или возможны другие варианты?..
Кстати, а стихи с параллельным переводом, как лучше делать?

Аватар пользователя Isais

Вот есть билингвальные книги: https://lib.rus.ec/b/449861 , https://lib.rus.ec/b/449862. Не знаю, что внутри.
ИМХО, т.к. читалки fb2 (и редакторы, да) не поддерживают в полном объеме таблицы, сделать по-настоящему параллельный текст (два текста рядом на одной странице) не получится.

Аватар пользователя Миррима

Люди!!! Поделитесь ссылью на где скачать ФР-11!!! (за деньги не предлагать)))

Аватар пользователя Антонина82

Рутрекер пока не заблокирован. Там и 12 версию можно скачать

Антонина82 написал:
...пока не заблокирован.

Уже не пока.
Аватар пользователя Антонина82

sd написал:
Антонина82 написал:
...пока не заблокирован.

Уже не пока.

Надо ж, точно убрали. А с 1 мая 2015 рутрекер можно целиком закрывать. :(
Как, впрочем, и Либрусек.(((

Версия, которой я пользуюсь в настоящее время (11.0.113.164) - https://yadi.sk/d/QLsLN3HicoNFb

Аватар пользователя Миррима

Уррря!!!! Заработало!!!!!
СПАСИБО!!!

Страницы

X