Внимание! При экспорте из FineReader 11 в fb2 возможно потеря текста!!!!
Опубликовано ср, 23/05/2012 - 00:23 пользователем Belomor.canal
Forums: Привет всем! 3 апреля. Суббота ФР -11 интерпретировал как СНОСКУ! При экспорте в fb2, все сноски, которые ФР-11 не знает куда отнести в итоговый текст не попадают! В данном случае текст этой записи пропал! Смена стиля ничего не дала!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Estel22 RE:Подайте бедному копеечку на книжку с литреса... 1 день
edvud RE:Багрепорт - 2 2 дня sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 5 дней babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 1 неделя Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 неделя Kiesza RE:Бушков умер. 1 неделя sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 неделя Isais RE:Игорь Северянин - Том 2. Поэзоантракт 2 недели sem14 RE:Современная корейская литература. Книжная серия... 2 недели sem14 RE:Семейственность в литературе 2 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 3 недели kopak RE:На 78-м году жизни скончался советский и российский... 1 месяц Саша из Киева RE:Подводное течение 1 месяц lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц konst1 RE:Переименовать ник (имя учетки) 1 месяц Larisa_F RE:Таррин Фишер 2 месяца Aleks_Sim RE:Беженцы с Флибусты 2 месяца Саша из Киева RE:Как приобретать друзей и оказывать влияние на людей 2 месяца Впечатления о книгах
Darja68 про Астахов: Чужая земля [litres] (Детективы: прочее)
15 10 Редкостная чушь. Куски текстов законов и введение в миграционную политику РФ вперемешку с с вялой интригой Оценка: плохо
Belomor.canal про Бохэннон: ЕВА. История эволюции женского тела. История человечества [litres] (История, Биология, Научпоп)
15 10 Масса впечатляющих фактов о том что есть и как есть у женщин и на сколько они другие существа, с точки зрения биологии и психологии. Очень рекомендую почитать читательницам библиотеки, хотя бы потому, что современная медицина ……… Оценка: отлично!
Wik@Tor про Стоев: Странные Земли (Фэнтези, Самиздат, сетевая литература)
14 10 Прочитал Срамные земли. Появился интерес, но тут же понял, что это Странные земли. Интерес пропал.
mysevra про Булычев: Спасите Галю! (Научная фантастика)
13 10 Прелесть какая! Приятно будоражит. Жутче и ярче, чем большинство книг по S.T.A.L.K.E.R. (хотя тут и не каноническая чернобыльская Зона, но тем не менее). И концовка такая, по-нашему, лишь бы было тихо. Оценка: отлично!
mysevra про Чуковский: Серебряный герб (Детская проза)
13 10 В старых книгах для подростков была заложена идея, как им стать полноценными членами общества и встроиться во взрослый мир. В современных книгах тинейджеры прогибают мир под себя, а глупые взрослые крутятся вокруг них. Надеюсь, ……… Оценка: отлично!
mysevra про Ефремов: Сердце Змеи [litres] (Космическая фантастика, Научная фантастика)
13 10 Хотела обновить воспоминания. И не вышло – хорошие идеи, плохой театр. Вообще большинство советской фантастики сейчас смотрится так, словно и у персонажей, и у рассказчика швабра с позвоночник зашита. Живые люди, которые вынуждены ……… Оценка: неплохо
sibkron про Ласло Краснахоркаи
13 10 Краснахоркаи несомненно крут. Достойное лауреатство. Один из самых важных классиков современности.
valeryma про Чайка: Купец из будущего ч.1 (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
12 10 Отличная альтернативка, читается влёт. Очень приятно на фоне затопившей ресурс убогой графомани. Оценка: отлично!
Darja68 про Проханов: Лемнер (Современная проза, О войне)
12 10 Слог у него живой, язык грамотный, читается легко. Но какая же давящая неизбывная тоска и тупая беспросветность наползает на душу, когда читаешь. Изолированная, отдельно взятая вечно агонизирующая Россия, кишащая нечеловеками, ……… Оценка: неплохо
serafim68 про Шелепин
11 10 Суховато написано, но очень интересно. И язык хороший, мусора мало. Оценка 5 |
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Изменить размер шрифта стиля "Сноска" и "Оглавление" на ЗНАЧИТЕЛЬНО отличающийся от основного текста и проглядывать при распознании в FineReader. Найденный кусок вырезать, копировать в блокнот и возвращать копированием из блокнота.
Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Спасибо! Значит тема закрыта
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы - всё, лежащее ниже пустой строки или отбивки * * *.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Isais]Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы
Спасибо! Именно так! Ну что ж, известно кто учится на своих, а не на чужих ошибках! В общем я пока буду в ворд- там просто смотришь в конец файла и все сразу понятно!! Скачал последний билд, но вряд это это поправио!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Совершенно верно. :)
Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Метод борьбы с этими ошибками был уже описан Desenchantee. :)
Что касается самостоятельной расстановки сносок силами самого ФР, то качество этой версии хоть и намного лучше, но всё равно 100%-ной гарантии правильной расстановки нет.
Поэтому я предпочитаю пользоваться старинным методом: переношу текст сноски к слову, к которому она относится, заключая его в фигурные скобки. В ФБЕ потом эти сноски расставляются одним кликом.
В документальной литературе, где сносок очень много, сноски так не расставляю. Но после экспорта в фб2 методично - страница за страницей - проверяю сноски на наличие в боди "Примечание". Недостающие добавляю. Да, часто их текст оказывается после всего текста, но не менее часто он просто отсутствует.
При количестве сносок более 200 - этот способ всё равно более рациональный, на мой взгляд.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote golma1]Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Отличный способ с гарантией!!!!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Небольшое техническое дополнение - мне так удобнее. После объединения, находите первую сноску, нажимете кнопку стили, далее OK и сноска окрасится зелёным цветом. Далее листа страниы (Alt+стрелка) вы видите зелёные куски текста - это и есть область СНОСКИ!!! Так очень быстро можно посмотреть весь проект! Ярко зелёная область просто бросается в глаза!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Кстати говорят есть новый билд. Кто ни будь на нём пробовал? У меня 11.102.481 прошлогодний
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Спасибо что предупредили! Скачал из торрентов собирался ставить. Мой совет ребятам из Фр - сделайте опцию "различать" и "не различать"! После таких шуток, когда полстраницы обычного текста превращается в сноску, лучше без! И конечно хорошо бы, что бы экспорт из ФР был управляемый - если я сделал стиль сноска то это и есть сноска!