Вопрос-консультация у распознающих (ВАЖНО)
Опубликовано ср, 23/05/2012 - 13:56 пользователем soshial
Forums: Уважаемые сканирующие и распознающие. У нас есть крупная ценная научная монография, которая не была опубликована. Однако мы не знаем с какими параметрами нужно сканировать, чтобы распознавание прошло как можно удачнее и исправлять вручную нужно было как можно меньше. Могу ли я попросить вас дать своё экспертное мнение (как людей, искушенных именно в распознавании текстов), какой из испробованных режимов наиболее подходит для возможного последующего распознавания, и если все они плохи, то что следует поменять в настройках сканирования, чтобы вытянуть максимально возможное? Речь идет в данный момент не о восприятии при чтении, а исключительно о наилучшем возможном распознавании. Я уделяю выбору оптимального режима столько внимания, поскольку на сканирование трех томов уйдет просто уйма времени, и переделывать это из-за неоптимального режима уже будет невозможно. Вот параметры, которые менялись при сканировании: Что вы могли бы посоветовать улучшить?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Rebellioner RE:Подайте бедному копеечку на книжку с литреса... 10 часов
Larisa_F RE:Серия "Символы времени" издательства "Аграф" 13 часов larin RE:Оплатил, но абонемент не отображается 2 дня nehug@cheaphub.net RE:DNS 6 дней alexk RE:Багрепорт - 2 1 неделя sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 недели Isais RE:Семейственность в литературе 2 недели Violontan RE:Жан Батист Мольер воскрешенный 2 недели sem14 RE:Гонкуровская премия 3 недели Dead_Space RE:Беженцы с Флибусты 3 недели Саша из Киева RE:Приключения белочки Рыжки 1 месяц alex-from RE:Оплатил два раза, но абонемента нет 1 месяц Kiesza RE:На 78-м году жизни скончался советский и российский... 1 месяц Paul von Sokolovski RE:Бушков умер. 1 месяц lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Isais RE:Издательство "Медуза" 1 месяц babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 2 месяца Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 месяца Впечатления о книгах
Никос Костакис про Калмыков: На пути «Тайфуна» [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
12 12 Ни один нормальный человек не поверит, что убийцам и грабителям могут дать в руки оружие. И уж тем более, ни одно правительство не пойдет на такой шаг". __________________________ Ну да, ну да...
Isais про Плещеева: Батареи Магнусхольма (Исторический детектив, Шпионский детектив)
11 12 Хотя мне давно отвратительно откровенное имперство автора, перетекающее в путинославие, не могу не признать — исторические детективы у нее получаются. И исторические лучше, чем детективы, потому что детективы у нее случаются ……… Оценка: хорошо
123_abc про Вадим Юрьевич Панов
10 12 Аркада. Вся трилогия с оценкой "отлично". А с учетом времени её написания ещё и "плюс" сверху. Оценка: отлично с плюсом
vvv про Алмазов: Гений Медицины (Героическая фантастика, Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
10 12 Медицинская часть интересна. Но остальное... Создается впечатления, что основной целью авторов было показать на примере персонажей, как развитие магии способствует деградации интеллекта.
Лысенко Владимир Андреевич про Земляной: Мастер стихий 3 [СИ] (Боевая фантастика, Технофэнтези, Самиздат, сетевая литература)
10 12 Книга понравилась, читается легко, хотелось бы продолжения. Оценка: отлично!
Дей про Наставник
08 12 Очень однообразно. Идут, разговаривают, влипают в неприятности, выпутываются - и так по кругу три книги. Всё это густо разбавлено древними шутками. Третью не оцениваю, ибо пролистала по диагонали.
ecr про В. Бирюк
08 12 Продолжения после 41-й книги не будет, автор скончался. https://samlib.ru/w/wbirjuk/nekrolog.shtml
mysevra про Джэнз: Дети тьмы [Children of the Dark ru] (Ужасы)
08 12 Подростки и ужасы – так, чтобы было интересно взрослым. Это сложно, мало кто справился: «Лето ночи», Кинг да, пожалуй, Кунц, навскидку больше некого и вспомнить. Оценка: неплохо
mysevra про Громыко: Год Крысы. Путница (Фэнтези)
08 12 Люблю этого автора – потрясающая фантазия и лёгкий слог. Дилогию прочитала с удовольствием, впечатление не испортили даже глупость и ограниченность главной героини. Оценка: отлично!
francuzik про Шимуро: Системный Кузнец IV (Фэнтези, ЛитРПГ, Самиздат, сетевая литература)
07 12 Очень слабо. Какая-то депрессивная хрень. Оценка: плохо
Лысенко Владимир Андреевич про Замполит: Белый генерал. Частная война (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
07 12 Книга интересная, события описываются нормально, хотелось бы продолжения. Оценка: отлично!
Дей про Консультант
06 12 Первые три книги - мило и очень интересно. 4 - уже не мило (прапрадед и праправнучка?? серьёзно?), но интересно. 5 - сборник рассказов по сюжету серии. 6,7 и 8... мне не было ни мило, ни интересно, совершенно другая атмосфера. |
Отв: Вопрос-консультация у распознающих (ВАЖНО)
Чисто визуально, чуть темнее, чем вариант 4 и чуть светлее, чем вариант 5 было бы оптимально. Но текст настолько плох, что хрен редьки не слаще. Текст ужасен. Если он весь такой, то лучше ручной набор. Потому что количество ошибок зашкаливает разумные пределы. Текст с такими ручными правками сканить под распознавание практически не имеет смысла.
Определить параметры сканирования проще всего самостоятельно, распознав несколько вариантов, и сравнив количество выявленных Файнридером ошибок в разных случаях.
А бояться отсканировать с неидеальными параметрами - не надо. Если только это не крайние параметры - очень-очень светлый, или очень-очень темный - то после сканирования их можно будет подправить пакетной обработкой. Например, в фотошопе.
Отв: Вопрос-консультация у распознающих (ВАЖНО)
Очень хорошо бывает прогнать сканы через Букресторер. Для таких сканов он мне очень пригождается.
Отв: Вопрос-консультация у распознающих (ВАЖНО)
а что это за программа и для чего она нужна?
Отв: Вопрос-консультация у распознающих (ВАЖНО)
Посмотрите здесь:
http://lib.rus.ec/node/394079
Отв: Вопрос-консультация у распознающих (ВАЖНО)
либо делать из него книгу в пдф или дежавю. руками такое набрать это ж каторжный труд - каждую букву сверять с бумагой
Отв: Вопрос-консультация у распознающих (ВАЖНО)