Как оформить кавычки при сканировании?

У меня такой вопрос.

Я пользуюсь FineReader'ом 10 для сканирования. Когда сканирую книги на иностранном языке - английском или каком другом - кавычки в виде лапок в распознанном тексте превращаются в прямые. А мне очень нравятся лапки, и мне хотелось бы их сохранять. Я смотрела "Помощь" в ФайнРидере, но ничего на этот счет не нашла.

Никто из знатоков не знает, как это сделать? Или как запретить ФайнРидеру переделывать лапки в прямые кавычки?

„“«»

И что это значит?

sonate10 написал:
И что это значит?
У меня в браузере есть эти символы, можешь взять отсюда и заменить. Впрочем, тут уже более подходящий вариант предложили.

Мне кажется, легче потом в готовом документе сделать массовую замену, чем "учить" ФР. ;)

Вопрос в том, как её сделать. Это не так просто, как кажется. Поставить в меню "Заменить " на ” " ? Но тогда и начальные лапки,, и конечные заменятся на ”, а ведь начальные лапки должны выглядеть как “, а не как ”. Вот в чем проблема. И запрограммировать отдельно "Заменить начальные " на “ " у меня не получается, потому что FBE не распознаёт, где начало, где конец прямой речи. А уж если кавычки стоят в начале абзаца — так и подавно. И приходится вручную проходить всю книгу. Может, есть какое-то пегулярное выражение? Хотя, с другой стороны, я ими тоже пользоваться не умею. Но уж это единственное как-нибудь бы запомнила...

sonate10 написал:
Вопрос в том, как её сделать. Это не так просто, как кажется. Поставить в меню "Заменить " на ” " ? Но тогда и начальные лапки,, и конечные заменятся на ”, а ведь начальные лапки должны выглядеть как “, а не как ”. Вот в чем проблема. И запрограммировать отдельно "Заменить начальные " на “ " у меня не получается, потому что FBE не распознаёт, где начало, где конец прямой речи. А уж если кавычки стоят в начале абзаца — так и подавно. И приходится вручную проходить всю книгу. Может, есть какое-то пегулярное выражение? Хотя, с другой стороны, я ими тоже пользоваться не умею. Но уж это единственное как-нибудь бы запомнила...

Я бы сделала так:
1. Запустила скрипт "Расставить только ёлочки".
2. Сделала бы массовую замену « на “.
3. Сделала бы массовую замену » на ”.

Я тоже долгое время так делал, а потом меня это censored, и я просто сделал себе копию этого скрипта с нужными кавычками в прямо в тексте. Потом, впрочем, все равно приходится искать по регэкспам непарные кавычки, но это уже к ошибкам сканирования и опечаткам в первоисточнике.

Спасибо, попробую. Наверно, это соаботает.

Аватар пользователя s_Sergius

golma1 написал:
Я бы сделала так:
1. Запустила скрипт "Расставить только ёлочки".
2. Сделала бы массовую замену « на “.
3. Сделала бы массовую замену » на ”.

Если конечным результатом будет формат fb2, то именно так.

А если doc, то можно и в Word'e сделать аналогично:
1. Запустить массовую замену " на ". Word найдет все ", «, » и сделает их парными елочками «» (Word97 в свое время, помнится, делал как раз “”).
2. Сделать массовую замену « на “.
3. Сделать массовую замену » на ”.

golma1 написал:
Я бы сделала так:
1. Запустила скрипт "Расставить только ёлочки".
2. Сделала бы массовую замену « на “.
3. Сделала бы массовую замену » на ”.
Нужен скрипт по английским кавычкам в FBE.

Вот, только расширение смените на .js

Аватар пользователя s_Sergius

Отлично работает, только еще неплохо было бы само слово «елочки» на «лапки» в сообщениях поменять. Во избежание путаницы.

s_Sergius написал:
Отлично работает, только еще неплохо было бы само слово «елочки» на «лапки» в сообщениях поменять. Во избежание путаницы.

Действительно неплохо.
Только желательно, чтобы:
1. скрипт всё же обрабатывал обычную для английского конструкцию --" или —" в конце абзаца, как завершающую кавычку: —”
2. скрипт учитывал, что в английском вложенные кавычки одиночные: английские одиночные внутри обычных двойных

Неплохо бы, но я не настоящий сварщик. :(

К тому же в выхолощенном английском тексте за все одиночные кавычки отдувается апостроф. А как отличить апостроф, исполняющий роль кавычек, от апострофа в словах типа ’cause, get ’em, ’specially, и т.п. - скрипт их наверняка переделает в левые. В общем, как завещал нам товарищ Саахов, торопиться не надо.

KillerBeer написал:
К тому же в выхолощенном английском тексте за все одиночные кавычки отдувается апостроф. А как отличить апостроф, исполняющий роль кавычек, от апострофа в словах типа ’cause, get ’em, ’specially, и т.п. - скрипт их наверняка переделает в левые. В общем, как завещал нам товарищ Саахов, торопиться не надо.
Не только апостроф, но ещё и курсив

KillerBeer написал:
К тому же в выхолощенном английском тексте за все одиночные кавычки отдувается апостроф. А как отличить апостроф, исполняющий роль кавычек, от апострофа в словах типа ’cause, get ’em, ’specially, и т.п. - скрипт их наверняка переделает в левые. В общем, как завещал нам товарищ Саахов, торопиться не надо.
Резонно. Такие апострофы обрабатывать не надо, не получится. Скрипт должен обращать внимание только на двойные кавычки ".
X