FineReader 12 Professional

Аватар пользователя Антонина82
Forums: 

ABBYY по электронке известил, что вышла версия FineReader 12 Professional. Что нового - здесь,цена - 4490. Я уже с 11 сроднилась. Всяких обновлений побаиваюсь. Кто здесь самый смелый - сообщите, стоит менять шило на мыло?

Аватар пользователя alexej36

час написал:
Появилась новая версия ABBYY FineReader 12.0.101.388. Попробовал, вроде без ранее замеченных недостатков. Если есть потребность, могу дать ссылку (или загрузить сюда?).

На руборде возьмем. Чем лучше стартовой версии? Что пофиксили?
----
Пофиксили некорректное отображение текста в окне "крупный план", о чем я писал выше. Теперь веских поводов сидеть на 11-й версии не осталось.

alexej36 написал:
час написал:
Появилась новая версия ABBYY FineReader 12.0.101.388. Попробовал, вроде без ранее замеченных недостатков. Если есть потребность, могу дать ссылку (или загрузить сюда?).

Пофиксили некорректное отображение текста в окне "крупный план", о чем я писал выше. Теперь веских поводов сидеть на 11-й версии не осталось.


12-й номера сносок на странице стаскивает в одно место. У меня была страница где в одну точку стащено пять номеров, а так по 2-3. Потом ищи-свищи.
ABBY это признали, но вот сделали ли что-нибудь не знаю.
Так что распознавать книги с большим количеством сносок на странице – не рекомендую. Или отключать распознавание сносок. 11-й это делает корректнее.
Аватар пользователя alexej36

Сноски, оглавление, списки - однозначно отключаем. Сноски - в квадратные (фигурные) скобки.

Привет! Обнаружил проблему - если есть нижний(!!!) колонтитул то нумерация страниц распознаётся как текст. Если способы борьбы, кроме понятного - в Word или fb2 заменой вычисть?

mikebb написал:
Привет! Обнаружил проблему - если есть нижний(!!!) колонтитул то нумерация страниц распознаётся как текст. Если способы борьбы, кроме понятного - в Word или fb2 заменой вычисть?

А определить поле распознавания?

Цитата:
А определить поле распознавания?

То есть 840 раз исправить области распознания? Ну это не технично - проще потом регулярным выражением типа
^[\d]+$
Выловить и разом заменить на пусто!

Странны баг - если после заглавной "Г" идут "о" или "а" то получается
Г отлиб
Г одфруа
Г амбург
Г авр
вставляется лишний пробел!

Аватар пользователя Антонина82

Мне кажется, это частный случай. Повлиял шрифт книги и соответственно скан ФР распознал с ошибкой. Мне по крайней мере, такой баг не встречался.

Антонина82 написал:
Мне кажется, это частный случай. Повлиял шрифт книги и соответственно скан ФР распознал с ошибкой. Мне по крайней мере, такой баг не встречался.

Мне частенько и в 11-ом это прилетало

Антонина82 написал:
Мне кажется, это частный случай. Повлиял шрифт книги и соответственно скан ФР распознал с ошибкой. Мне по крайней мере, такой баг не встречался.

Да, от шрифта много зависит. Хотя и собственных косяков у Фани хватает. К примеру, "Я" в начале строки чуть ли не всегда распознается как курсивное "Я". Как и упорото слитное "ия" или слипание оттенков, типа "темносиние". На такие мелочи, как я понял, разработчики просто забили. Словарь ихний - просто пиздец, простите мой французский. Тем не менее лучше них пока никого нет. Такой вот пердимонокль, гы-гы.

mikebb написал:
Странны баг - если после заглавной "Г" идут "о" или "а" то получается
Г отлиб
Г одфруа
Г амбург
Г авр
вставляется лишний пробел!

ага, есть такое
возможно из-за шрифта
а также в режиме форматированного текста (в основном в нем работаю) как ни нумеруй блоки - один хрен выведет как захочет
слева подпись, справа картинка... ессно 1 картинка, 2 подпись
не-ет, сначала подпись, потом картинка

если шрифт с засечками, то вместо Т может выдать 'Г
и вместо щ упорно ставит ш

mikebb написал:
Странны баг - если после заглавной "Г" идут "о" или "а" то получается
Г отлиб
Г одфруа
Г амбург
Г авр
вставляется лишний пробел!

Ну уж это простейшей заменой ликвидируется, без регэкспов.

Цитата:
Ну уж это простейшей заменой ликвидируется, без регэкспов.

Тут, как вы понимаете, важно найти, исправить то пара пустяков!
Да и это вечно прописное Я которое превращается в курсивное. Но 12 -ый сноски распознал на твёрдую 5!!!! Только 1 раз ошибся на всё книгу!
Аватар пользователя alexej36

Цитата:
а также в режиме форматированного текста (в основном в нем работаю) как ни нумеруй блоки - один хрен выведет как захочет
слева подпись, справа картинка... ессно 1 картинка, 2 подпись
не-ет, сначала подпись, потом картинка

Если есть картинки, нумерация блоков часто ошибочная. Без картинок почти всегда нормально.
"Руками" перенумеровать как надо и распознать страницу заново.

alexej36 написал:
Цитата:
а также в режиме форматированного текста (в основном в нем работаю) как ни нумеруй блоки - один хрен выведет как захочет
слева подпись, справа картинка... ессно 1 картинка, 2 подпись
не-ет, сначала подпись, потом картинка

Если есть картинки, нумерация блоков часто ошибочная. Без картинок почти всегда нормально.
"Руками" перенумеровать как надо и распознать страницу заново.

ну а я о чём? слева - 3 подпись, справа - 2 картинка, снизу - 1 текст (цифры - ручная нумерация блоков)
ногда выводит как есть, т.е. подпись-картинка-текст, а не как хочется - текст-картинка-подпись
и хз почему... не, ну при оригинальном оформлении текста всё нормально, а вот при выводе в фб2 приходится всё равно вручную переставлять
Аватар пользователя alexej36

Кнопка "перенумеровать области" Расставляем правильно. Перераспознаем. Где ошибки? Если есть - давайте скан.

Внимание!!!Вроде в ФР11 этого не было. Если перед сноской ":,.?" то ФР12 добавляет 1 от себя!!! То есть сноска ?2 или ,2 превращается в ,1 2

Однако!! Если на странице есть сноска 1и текст в самой нижней строчке НЕ ДОХОДИТ ДО КРАЯ, то в самом конце текст(!!) ФР самостоятельно добавляет сноску 1

Все эти баги в версии ABBYY FineReader 12.0.101.264. Поставил ABBYY FineReader 12.0.101.382 баги исчезли, но поиск не работает :-((((

Аватар пользователя alexej36

Цитата:
от шрифта много зависит.

Пока разработчики не дали нам возможность вручную править/создавать сноски - пользоваться ими смысла нет. Сноски - в квадратные скобки.
Аватар пользователя Антонина82

alexej36 написал:
Цитата:
от шрифта много зависит.

Пока разработчики не дали нам возможность вручную править/создавать сноски - пользоваться ими смысла нет. Сноски - в квадратные скобки.

Лучше в фигурные. Квадратные скобки довольно часто встречаются в текстах книг.Примечания я делаю только вручную, ФР не доверяю.
Аватар пользователя alexej36

Имеющиеся квадратные скобки можно массовой заменой временно поменять на что-нибудь другое - лишь бы в тексте больше не встречалось.

Делаю замены и выскакивает такое сообщение. Причем в других вариантах замен такого не наблюдается.

И еще с другим поиском/заменой

У вас 11 версия. В ней замены работают правильно, по крайней мере в версии 11.0.102.583

Belomor.canal написал:
У вас 11 версия. В ней замены работают правильно, по крайней мере в версии 11.0.102.583

Да, версия 11-я. Просто новую тему не хотел создавать.
Пользуюсь этой версией давно и такая проблема до сих пор не возникала.

mikebb, в FineReader 12.0.101.388 Corporate таких проблем не имею

Работаю с FR12 и вот появилась проблема. При переносе OCR слоя из одного djvu-файла в другой интервалы между словами стали двойными. Не могу понять в чем дело. Может быть кто-нибудь в курсе?

час написал:
Работаю с FR12 и вот появилась проблема. При переносе OCR слоя из одного djvu-файла в другой интервалы между словами стали двойными. Не могу понять в чем дело. Может быть кто-нибудь в курсе?

Djvu.OCR-ом перетаскиваете? Есть такое дело. OCR файл надо открыть в любом текстовом редакторе и массово заменить (char на # (char. Иногда, правда, при переносе прожка ругается, у меня пару раз было, тогда массово же заменить " " на "".
А проще всего перейти с Djvu.OCR на DjVu Text Layer Crutch, там такой проблемы нет. Я лично так и сделал.

J_Blood, большое спасибо! Массовая замена не помогла и я воспользовался ссылкой на прогу, которая и помогла.

Аватар пользователя alexej36

Зашел на днях в тему на руборде...

Цитата:
Есть тут у некоторых основания считать, что погибший в прошлом году небезызвестный Крис Касперский здесь был известен как Пафнутий.

Ну т.е. автор лекарства для последних версий FR...
Аватар пользователя alexej36

FineReader 14

Наши узкоглазые братья наконец-то сделали лекарство.
Руборд, рутрекер. Читаем, скачиваем.
По мне так ничего интересного по сравнению с 12 версией.
Я про конвертирование сканов в Fb2.

Страницы

X