Внимание! При экспорте из FineReader 11 в fb2 возможно потеря текста!!!!
Опубликовано ср, 23/05/2012 - 00:23 пользователем Belomor.canal
Forums: Привет всем! 3 апреля. СубботаФР -11 интерпретировал как СНОСКУ! При экспорте в fb2, все сноски, которые ФР-11 не знает куда отнести в итоговый текст не попадают! В данном случае текст этой записи пропал! Смена стиля ничего не дала!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
larin RE:Пропал абонемент 2 дня
Океана RE:Подайте бедному копеечку на книжку с литреса... 50 мин. tvv RE:DNS 4 дня sem14 RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 4 дня MrMansur RE:<НРЗБ> 1 неделя Stager RE:Беженцы с Флибусты 1 неделя Tramell RE:Серия "Библиотека французской литературы" (Макбел) 1 неделя sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 неделя sem14 RE:Современная корейская литература. Книжная серия... 1 неделя sem14 RE:Серия "Символы времени" издательства "Аграф" 2 недели sem14 RE:Собираем серию: "Азбука-триллер", издательство "Азбука-Терра" 2 недели sem14 RE:«Юмористическая серия» 2 недели larin RE:Оплатил. Абонемент не отображается 3 недели larin RE:Оплатил, но абонемент не отображается 3 недели alexk RE:Багрепорт - 2 1 месяц Isais RE:Семейственность в литературе 1 месяц Violontan RE:Жан Батист Мольер воскрешенный 1 месяц sem14 RE:Гонкуровская премия 1 месяц Впечатления о книгах
DGOBLEK про Спинрад: Русская весна [Отсутствует очерк] (Научная фантастика)
05 01 Книга не полностью - Отсутствует очерк = Виталий Бабенко. Пятое время года (очерк), стр. 5-9
svetik489 про Иевлев: Ковыряла (Киберпанк, Социальная фантастика, Самиздат, сетевая литература)
05 01 было бы хорошо,но такой перебор со сленгом.... поэтому неплохо Оценка: неплохо
lorealke про Птица: Конструктор живых систем [СИ] (Альтернативная история, Городское фэнтези, Стимпанк, Самиздат, сетевая литература)
03 01 Очередная агитка под видом «боярки» для подростков. Антагонисты слеплены по методичке из телевизора: мерзкий поляк, подлый грузин и надменный швед против «святого» русского мальчика. Весь мир книги — это унылая «осажденная ……… Оценка: плохо
mysevra про Лукьяненко: Последний Дозор (Фэнтези)
03 01 В своё время я была в восторге от первых двух книг, а эта – просто выжимки из опилок, не стоящие внимания. И очень повлияла на моё восприятие творчества автора его гражданская позиция – оказалось, что это не просто фантаст, ……… Оценка: плохо
mysevra про Сегень: Поп (Историческая проза, Православие)
03 01 Интересные страницы истории. Люди, у которых есть чёткие моральные принципы и жизненные ориентиры на любой случай (неважно, чем продиктованные: традициями, профессией, религией или понятиями) – им и сложнее, и проще одновременно. ……… Оценка: хорошо
mysevra про Бачило: Пленники Черного Метеорита (Боевая фантастика, Космическая фантастика)
03 01 Не знаю, не зашло, хоть я честно старалась. Оценка: плохо
lorealke про Астахов: Император Пограничья 1 (Фэнтези, Попаданцы, Самиздат, сетевая литература)
03 01 Типичнейшая «мужская фантастика» формата АТ: чистейший литературный попкорн, который жуется легко, потому что сюжет не провисает, а бодро несется по рельсам нагибаторства. Художественной ценности, понятно, кот наплакал — ГГ ……… Оценка: неплохо
lorealke про Метельский: Кровь легиона [СИ] (Фэнтези, Самиздат, сетевая литература)
03 01 Очередная графоманская ода «священной Империи» с невыносимым количеством воды и бухгалтерии. Вместо сюжета — унылый цикл: убил моба, продал лут, посчитал медяки, попил кофе — и так сотни страниц. Герой — абсолютная картонка, ……… Оценка: нечитаемо
hocmun про Ливадный: Дорога к фронту (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
02 01 К сожалению автор скатился в чуть ли не обычную пропаганду замаскированую под лит рпг и аля попаданцы . все решат ... После такой шедевральной серии как ,,Истоирия галактики,, к этому ? Простите друзья но это путь почившего ……… Оценка: плохо
lorealke про Тен: Шайтан Иван. Книга 1 [СИ] (Альтернативная история, Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
02 01 Лютая графомания с чудовищной орфографией, от которой буквально вытекают глаза. Герой — картонный нагибато» в вакууме: и спецназовец, и певец, и оружейник, решающий любые проблемы щелчком пальцев одной левой. Сюжета нет, сплошное ……… Оценка: плохо
lorealke про Мясников: Новороссия. ВоZVращение. Краткая история от Екатерины ll до Путина (История, Публицистика)
02 01 Типичная пропагандистская агитка. Мусор. Оценка: нечитаемо |
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Изменить размер шрифта стиля "Сноска" и "Оглавление" на ЗНАЧИТЕЛЬНО отличающийся от основного текста и проглядывать при распознании в FineReader. Найденный кусок вырезать, копировать в блокнот и возвращать копированием из блокнота.
Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Спасибо! Значит тема закрыта
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы - всё, лежащее ниже пустой строки или отбивки * * *.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Isais]Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы
Спасибо! Именно так! Ну что ж, известно кто учится на своих, а не на чужих ошибках! В общем я пока буду в ворд- там просто смотришь в конец файла и все сразу понятно!! Скачал последний билд, но вряд это это поправио!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Совершенно верно. :)
Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Метод борьбы с этими ошибками был уже описан Desenchantee. :)
Что касается самостоятельной расстановки сносок силами самого ФР, то качество этой версии хоть и намного лучше, но всё равно 100%-ной гарантии правильной расстановки нет.
Поэтому я предпочитаю пользоваться старинным методом: переношу текст сноски к слову, к которому она относится, заключая его в фигурные скобки. В ФБЕ потом эти сноски расставляются одним кликом.
В документальной литературе, где сносок очень много, сноски так не расставляю. Но после экспорта в фб2 методично - страница за страницей - проверяю сноски на наличие в боди "Примечание". Недостающие добавляю. Да, часто их текст оказывается после всего текста, но не менее часто он просто отсутствует.
При количестве сносок более 200 - этот способ всё равно более рациональный, на мой взгляд.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote golma1]Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Отличный способ с гарантией!!!!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Небольшое техническое дополнение - мне так удобнее. После объединения, находите первую сноску, нажимете кнопку стили, далее OK и сноска окрасится зелёным цветом. Далее листа страниы (Alt+стрелка) вы видите зелёные куски текста - это и есть область СНОСКИ!!! Так очень быстро можно посмотреть весь проект! Ярко зелёная область просто бросается в глаза!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Кстати говорят есть новый билд. Кто ни будь на нём пробовал? У меня 11.102.481 прошлогодний
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Спасибо что предупредили! Скачал из торрентов собирался ставить. Мой совет ребятам из Фр - сделайте опцию "различать" и "не различать"! После таких шуток, когда полстраницы обычного текста превращается в сноску, лучше без! И конечно хорошо бы, что бы экспорт из ФР был управляемый - если я сделал стиль сноска то это и есть сноска!