Вы здесьПроблемы и приемы OCR: dewarp
Опубликовано ср, 06/05/2009 - 04:06 пользователем Ulenspiegel
Если при сканировании книжка не прижата плотно к предметному стеклу, участки строк, находящиеся вблизи разворота, искривляются. При сильном искривлении (заползание на уровень соседней строки) программы распознавания приходят от таких червячков в недоумение. Не знает ли всемогущий All алгоритмов и (что еще лучше) готовых программ для борьбы с таким безобразием ?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
aldan RE:Подайте бедному копеечку на книжку с литреса... 3 часа
aldan RE:Прошу переформатировать, распознать, etc... 1 день Larisa_F RE:Современная корейская литература. Книжная серия... 6 дней Larisa_F RE:Таррин Фишер 6 дней Aleks_Sim RE:Беженцы с Флибусты 1 неделя Саша из Киева RE:Как приобретать друзей и оказывать влияние на людей 1 неделя Isais RE:Семейственность в литературе 1 неделя miri.ness_ RE:Доступ 27 2 недели bmusanov Оплатил, но абонемент не отображается 2 недели holla RE:Багрепорт - 2 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 недели konst1 RE:Файнридер для Win11 3 недели larin RE:Оплатил, но абонемент не отображается 3 недели sem14 RE:Книжная серия «Сlio» издательства "Евразия" 3 недели Isais RE:Национальный конкурс на лучшее литературное произведение... 3 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 3 недели sem14 RE:«Морской роман» — книжная серия Калининградского книжного... 3 недели larin RE:Оплатил,но абонемент не отображается 4 недели Впечатления о книгах
mysevra про Тремблэй: Хоррормейкеры [litres] [Horror Movie: A Novel ru] (Социальная фантастика, Ужасы, Триллер)
23 08 Во-первых, повествование скачет настощее-прошлое-новый сценарий-оригинальная раскадровка. Во-вторых, затянуто: почти нет событий, нагнетание обстановки и вдруг - ничего. Оценка: неплохо
mysevra про Лаундес: Как говорить с кем угодно и о чем угодно. Навыки успешного общения и технологии эффективных коммуникаций (Психология, Маркетинг, PR, реклама)
23 08 Хорошие рекомендации. Жаль, поздно мне попались – сейчас у меня уже профдеформация и тут нужна инструкция «Как помолчать хотя бы 10 минут в компании незнакомцев». Оценка: хорошо
mysevra про Ночкин: Слепое пятно (Боевая фантастика)
23 08 Изложено хорошо, но я несколько раз порывалась бросить из-за неторопливости развития событий, да и общей размытости сюжета. Оценка: хорошо
Олег Макаров. про Царь Федя
21 08 Что-то надо делать с нацизмом у авторов... Как-то помечать книги, может быть? Невозможно же читать, чесслово.
Barbud про Яманов: Сын Тишайшего-2 (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
21 08 Вначале было ничего так, хотя и не без ляпов и анахронизмов, да и герои общаются очень уж по-современному. Но к концу второй части из ГГ (или из автора?) полезло дерьмо - смакование казни на колу, рассуждения о собственной ……… Оценка: нечитаемо
Isais про Роббинс: Куда ушла любовь [Where Love Has Gone ru] (Современная проза, Семейный роман/Семейная сага)
20 08 Криминальная линия в романе основана на действительных событиях — на драме в семье голливудской кинодивы Ланы Тёрнер из-за связи с лос-анджелесским гангстером.
obivatel про Спасти красноармейца Райнова
20 08 2 marin029 Да, во втором томе. У Поселягина всё такое: где-то что-то слышал, втыкает в текст не разобравшись; ну не склонен он к анализу и глубокой проработке не только входящей, но и исходящей информации, и по тексту одно ………
Лысенко Владимир Андреевич про Усманов: Следующий шаг (Боевая фантастика, Героическая фантастика, Попаданцы)
19 08 Эта серия книг нечитаемая, не понял, что автор в этих книгах хотел сказать, нечитаемо. Оценка: нечитаемо
obivatel про Страж [Земляной]
18 08 Годное чтиво для разжижения мозгов: всенагибающий всенаклоняющий всехпривлекающий и т.д и т.п.; читателю остаётся только расслабиться и внемлить потоку эпического повествования. 2 ne_fanat согласен по каждому слову. Но ………
udrees про Эрлих: Легко ли плыть в сиропе. Откуда берутся странные научные открытия (Физика, Научная литература: прочее, Научпоп)
17 08 Очень интересная, веселая и занимательная книга, посвященная необычным или бесполезным открытиям в науке. Я честно думал прочитать про открытия как селедки общаются посредством «пуканья», но в книге хватает и других полезных ……… Оценка: хорошо
udrees про Михайлов: Кроу. Суровые земли (ЛитРПГ)
17 08 Для поклонников обычных приключений в стиле литРПГ, книга может показаться очень скучной. Подавляющее время идет описание хозяйственных хлопот, налаживания связей, экономических проблем индивидуального предпринимателя гнома ……… Оценка: неплохо |
Комментарии
Отв: Проблемы и приемы OCR: dewarp
Насчет алгоритмов не знаю (хотя Файнридер вроде что то делает) но как вариант решения за $500 смотри тут: http://lib.rus.ec/node/131676
Отв: Проблемы и приемы OCR: dewarp
Э нет, кривой скан в данном случае - уже данность :( В смысле - готовый DJVU
Отв: Проблемы и приемы OCR: dewarp
В FineReader 8, которым я пользуюсь, в настройках "1. Сканировать/открыть" есть опция "Устранить искажение строк". Очень даже помогает.
В 9-й версии наверняка тоже есть.
Отв: Проблемы и приемы OCR: dewarp
Есть , "streighten lines" и "desкew" - кто из них кто уже не помню за ненадобностью.
можно на страницу провести операцию а можно применить ко всем , но я бы советовал постранично ибо некоторые страницы наоборот как раз портит.
Отв: Проблемы и приемы OCR: dewarp
Да вы чего, издеваетесь, панове ?! deskew - есть, это исправление перекоса (когда книжку положили непараллельно границам окна),
Отв: Проблемы и приемы OCR: dewarp
deskew - это совсем из другой оперы.
Возьмите ложку. Положите ее на стол под уголм 45градусов к краю. Исправьте положение ложки. А теперь СОГНИТЕ ложку поплам и попрубуйте исправить перекос относительно края тем же способом
Отв: Проблемы и приемы OCR: dewarp
В моем случае ложка выглядит примерно так: Я думал, что это именно warp
Отв: Проблемы и приемы OCR: dewarp
Я не издеваюсь , я же сказал что не помню, значит не deskew а второй - staighten text lines:
Отв: Проблемы и приемы OCR: dewarp
Теоретически в 8 и 9 Файнридерах имеется встроенный механизм коррекции:
На практике, выработанной на 4м ещё файнридере, лучшим удалителем искажений в зоне разворота служит левая рука, прижимающая книгу к сканеру в момент сканирования... :)
...Каких либо отдельных программ, позволяющих выпрямлять строки я никогда не встречал. Теоретически это можно проделать в фотошопе, но... страницу, пусть две. А сотню? Сомневаюсь.
Отв: Проблемы и приемы OCR: dewarp
АААА!!!! Спасибо, Jolly Roger - ака, и вправду есть! Они его спрятали неочевидным образом.
Если кто-нибудь еще на эти грабли наступит, тулза работает и выглядит вот так:
Отв: Проблемы и приемы OCR: dewarp
Дык а я о чем ?
Отв: Проблемы и приемы OCR: dewarp
Виноват, подумал, что она в опциях сканирования сидит.
Отв: Проблемы и приемы OCR: dewarp
Вроде бы именно такие искривления исправляет Book Restorer. Подробности на ru-board.
Отв: Спасибо!
Век живи - век учись... Действительно, есть и отдельная программа под задачу:
http://djvu-soft.narod.ru/scan/curved_text.htm
...как я понимаю, у неё настроек побогаче будет. Видимо, для сложных случаев может оказаться предпочтительней.
Отв: Проблемы и приемы OCR: dewarp
На сорсфорже была утилитка unpaper - она, кажется, умела автоматически делать обработку сканированных страниц, выравнивая картинки, зачищая поля и выравнивая интенсивность фона. Заодно резала на страницы, если сканировался разворот.
Отв: Проблемы и приемы OCR: dewarp
http://unpaper.berlios.de
А строки, AFAIK, не ровняет.
Но вобщем ничего, пользуюсь периодически.
Отв: Проблемы и приемы OCR: dewarp
Если нужно подготовить скан для создания дежавю, то лучше выпрямить строки программой BookRestorer. Там же можно сделать все остальное (чистка, обрезка и т. д.)
Отв: Проблемы и приемы OCR: dewarp
Покажите, плз, мне нормально выпрямленные букресторером строки
Я пробовал это делалать, у меня не получилось. У моих знакомых по ру-боарду тоже.
Отв: Проблемы и приемы OCR: dewarp
Показать в буквальном смысле не могу, т. к. не сохраняю исходники во-первых, и не помню какие именно строки были выпрямленыв во-вторых. Но этой функцией пользовался не раз и не два. Настройки дефолтные. Правда, изгиб касался максимум 3-4 строк внизу страницы. Обычно все же стараюсь прижимать книгу к сканеру :) Совсем уж бракованный скан проще переснять, чем маяться с ним.