Курьезы сканировщика

Forums: 

Забавные нелепицы иной раз рождаются при сканировании. Вот, например, сегодня вместо "высокопоставленным лицам" вдруг возникло "высокопоставленным яйцам".
А чуть ранее слово "мультиканальный" было разделено на два и получилось "мультик анальный".

Цитата:
Лес здесь растет на равнинной болотистой местности с небольшими холмами высотой от шеи и 40 десяти футов
от шести до десяти

Цитата:
Однако Польше всего я любил бродить по окрестностям

Цитата:
В прошлом известный охотник, ныне восьмидесятилетний старик, полковник, несмотря на гной небольшой рост

Цитата:
Его великолепный дворец, освещаемый в особых случаях 60 ООО золотых электрических лам почек, производит феерическое впечатление.
О как! 60 ООО лам с почками. :D

Цитата:
В свободное от служебных дел время махараджа беседовал со мной о лик ИХ животных.
диких

Цитата:
сплошной лесной массив, разделяемый пни, фмпицей между этими штатами
лишь границей

Цитата:
И все же доброго слома о них не скажешь.

Цитата:
Ездовые слоны возят туристов в довольно густой пес
Густопсовость какая-то

Ококчания - окончания

Аватар пользователя Мой Повелитель

жыды - евреи
и никогда наоборот((( \_(ツ)_/
намучился я с дореформенным изданием "Тарас Бульба"....

Цитата:
На мирных лодках
должно быть
Цитата:
На моторных лодках

Цитата:
Вуд, пожилой англоиндиец, превосходно шил диких животных
знал

Zadd написал:
Цитата:
Вуд, пожилой англоиндиец, превосходно шил диких животных
знал

Жуть какая, шил вместо знал, мирных вместо моторных...
Это какая версия ФР?
Можешь выложить скан страницы с таким текстом, проверю у себя тоже.

TaKir написал:
Zadd написал:
Цитата:
Вуд, пожилой англоиндиец, превосходно шил диких животных
знал

Жуть какая, шил вместо знал, мирных вместо моторных...
Это какая версия ФР?
Можешь выложить скан страницы с таким текстом, проверю у себя тоже.
FR 9 Sprint
В оправдание Фане могу сказать, что скан очень плохого какчества с разрешением 200DPI. Удивительно, что он вообще что-то распознал на таком скане. (Сканил не я, у меня нет такой книги)

Zadd написал:
FR 9 Sprint
Стесняюсь спросить - ты садомазохист или убежденный противник вареза? На кой юзать эту ублюдочную поделку, которая появилась сразу после одной из лучших версий FR и по сей день - восьмой, и ничем хорошим себя не запятнала. Насчет обработки сканов даже не заикаюсь, напомню только о неоднократном обсуждении отключения словарей, дабы и чтобы не провоцировать FR на всякие выебоны (исправить которые может только человек) путем бездумной подстановки слов из внутреннего словаря.

GMAP написал:
Стесняюсь спросить - ты садомазохист или убежденный противник вареза? На кой юзать эту ублюдочную поделку, которая появилась сразу после одной из лучших версий FR и по сей день - восьмой, и ничем хорошим себя не запятнала. Насчет обработки сканов даже не заикаюсь, напомню только о неоднократном обсуждении отключения словарей, дабы и чтобы не провоцировать FR на всякие выебоны (исправить которые может только человек) путем бездумной подстановки слов из внутреннего словаря.
Ни то, ни другое. Просто засрал винчестер, а удалять всё жалко, а эта прога НЕ создает проектов, следовательно, не тратит зря место на винте. А какая мне разница, откуда копипастить - из проекта или из одной страницы? Из одной страницы так ещё и удобнее: отсканировал страницу, тут же её распознал и скопипастил в FBE. И сканировать можно на максимальном DPI и на диске место не засирается. Прога поставляется вместе со сканером. Неудобство только в том, что нельзя сделать PDF-книгу, нельзя же серьёзно воспринимать возможность делать PDF из одной страницы, но мне это и не надо.
Насчёт подстановок из словаря: ну да, бывает, что подставляет из словаря неправильное слово, но совсем не факт, что без словаря будет лучше, просто ошибки будут другие и в других местах.

Zadd написал:
TaKir написал:
Zadd написал:
Цитата:
Вуд, пожилой англоиндиец, превосходно шил диких животных
знал

Жуть какая, шил вместо знал, мирных вместо моторных...
Это какая версия ФР?
Можешь выложить скан страницы с таким текстом, проверю у себя тоже.
FR 9 Sprint
В оправдание Фане могу сказать, что скан очень плохого какчества с разрешением 200DPI. Удивительно, что он вообще что-то распознал на таком скане. (Сканил не я, у меня нет такой книги)

Поставь 8 версию (не портабл). Все, что выше 8 - распознает хуже, и глюков больше. Если надо - выложу куда-нить рабочую восьмерку.
UPD - уже написал GMAP практически то же самое.

TaKir написал:
Поставь 8 версию (не портабл). Все, что выше 8 - распознает хуже, и глюков больше. Если надо - выложу куда-нить рабочую восьмерку.
UPD - уже написал GMAP практически то же самое.
Помню, как-то wotti сне рекомендовал 9 portable, которой он пользовался. Ох и намучался я с ней, всё время на каждом скане сообщала, что 300DPI слишком мало, замените скан на 300DPI. И ещё: у меня TEMP="D:\TEMP", так она не могла найти "С:\D:\TEMP". чудо в перьях, поставил нормальную, инсталлируемую, все выебоны исчезли.
Восьмеркой тоже пользовался, не заметил, чем она лучше или хуже девятки.
Это всё было на предыдущем компе. На этом просто поставил Sprint искаропки.

Цитата:
число рабочих слонов на тиковых разработках в Бирме мепылилось
уменьшилось

Цитата:
В сущности, весь заповедник состоит из небольшого п. к умственного озера протяженностью 74 акра; вода в «игре задерживается небольшой дамбой (бондом) и идет
• и прошение рисовых и других полей
Цитата:
В сущности, весь заповедник состоит из небольшого искусственного озера протяженностью 74 акра; вода в озере задерживается небольшой дамбой (бондом) и идет на орошение рисовых и других полей

Цитата:
На земле пеликаны выглядят неуклюжими, но летают пни красиво

Цитата:
15 ООО птиц
Ну, то, что птицы объединяются в ООО давно уже не удивительно, с тех самых пор, как в ООО объединились электрические ламы с почками. :)

Цитата:
Он не реки мендовал мне пользоваться 35-миллиметровым фотопаратом

Цитата:
Фотопринадлежности я обычно закрывал двумя куем* ми материи
кусками

Восьмерка вполне уверенно распознает даже с этого скриншота (137 дпи).
Ну да, внизу у разворота плохо прижали при сканировании, это очевидное слабое место.
Но справа блок я бы чуть растянул вправо, а то режутся буквы.

TaKir написал:
внизу у разворота плохо прижали при сканировании
Похоже, что у Zadd имеет место детская вера, что FR-у можно подсунуть любой дерьмоскан, а он, как истый жентельмен распознает его без малейших проблем. Наивный чукотский юноша! Технологии OCR нынешнего дня (не будем касаться квантовых компов и нейросетей) находятся на уровне прошлого века, и верить им нельзя от слова совсем. Тем не менее, большинство якобы OCR казусов, показанных на этой странице относятся к рукам не из плеч, и мозговому аппарату облегченного образца. "Ругаться матом, это как шахматы, мало знать как двигать фигуры, надо еще и играть уметь." Точно то же самое с комповым железом/софтом - мало иметь, надо еще уметь.

GMAP написал:
Похоже, что у Zadd имеет место детская вера, что FR-у можно подсунуть любой дерьмоскан, а он, как истый жентельмен распознает его без малейших проблем. Наивный чукотский юноша! Технологии OCR нынешнего дня (не будем касаться квантовых компов и нейросетей) находятся на уровне прошлого века, и верить им нельзя от слова совсем. Тем не менее, большинство якобы OCR казусов, показанных на этой странице относятся к рукам не из плеч, и мозговому аппарату облегченного образца. "Ругаться матом, это как шахматы, мало знать как двигать фигуры, надо еще и играть уметь." Точно то же самое с комповым железом/софтом - мало иметь, надо еще уметь.
Просто неохота отказывать даме :) Не факт, что она сможет лучше отсканировать да и сканера её я не знаю.

TaKir написал:
Восьмерка вполне уверенно распознает даже с этого скриншота (137 дпи).
Ну да, внизу у разворота плохо прижали при сканировании, это очевидное слабое место.
Но справа блок я бы чуть растянул вправо, а то режутся буквы.
Я это потом сделал, просто не стал новый рисунок перезаливать. Просто показал "какчество" сканов, как некоторые сканируют. Что интересно, зато у неё рисунки хорошо получились, можно без обработки в fb2 вставлять, у меня наоборот, текст хорошо распознается, а картинки надо долго обрабатывать.

"Она вернулась домой и с тех нор жила одна."

Аватар пользователя alexej36

addRegExp("(?<![а-яё])нор(?![а-яё])","i","Найдено: слово "нор" ("пор" с опечаткой).");
В поиск по набору регекспов можно добавить!

http://www.lib.rus.ec/b/682685 написал:
Вспыхнули и загорелись опутывающие стены ползучие растения. Начали взрываться камни с сингхскими рисунками – каждый из них был создан с использованием ритуалов тёмной стороны, а потому взрывался не хуже хорошей фанаты.
взрывающиеся фанаты - типичная ошибка OCR. :)

"...но внезапны и неуместны были они в сопливом ночном лесу."
Правильно - "сонливом".


7 May
распозналось как 1 May. Вообще на картинке было ясно видно именно 7. То ли Фаня знает Первомай и поэтому поправил дату, то ли сыграло роль то, что текст перед 7 был курсивным, поэтому и 7ка воспринялась как курсивная 1ка.

Цитата:
King William ill
на самом деле King William III. Фаня сразу нашёл словарное слово ill(дурной, злой, больной(в школе только значение "больной" изучали)) и заменил.

Цитата:
77ie Times
фантазии Фани на тему The Times
Аватар пользователя Александр Лагода

Гомик стихов Блока

маразматиче-ский пидер
вместо маразматиче-ский лидер
44 вместо П

Аватар пользователя Александр Лагода

Он уселся на верхней студентке, поставил рядом с собой бутылки с водкой... (ступеньке)

Город "Борисо-глебск" (в тексте был знак переноса) распознался как "Борнео-глебск".

Аватар пользователя Isais

Что и как себе думает Файнридер, просто диву даешься.
Понимаю, почему "порядок" стал поряликом, не вопрос. Но как "юными" стали "мятыми" -- не представляю!

Картинка: 

Isais написал:
Что и как себе думает Файнридер, просто диву даешься.
Понимаю, почему "порядок" стал поряликом, не вопрос. Но как "юными" стали "мятыми" -- не представляю!

Меня вообще удивляет, как ФР может так по-разному распознавать.
Его же скриншот ридер зачастую распознает гораздо лучше, чем основная часть редактора.
Как они так пишут софт - хз.
Не раз замечал, что в режиме выбранных 2 языков (стандартно англ+рус) распознается лучше, чем просто с русским на чисто русском тексте.
Если наложить блоки на страницы по сохраненному шаблону - тоже распознается лучше, чем при накладывании блоков автоматом.
Ну и стандартно - если 15 ФР чего-то не может распознать, берем 8 версию и частенько получаем идеальный результат.

Не видел, классику жанра, творение вроде третьего FR, постили? "Лолита, свет моей жизни, огонь моих кресел"

И название трактата Марка Туллия Цицерона, посвящённого ораторскому искусству: "Врут, или О знаменитых ораторах"
Брут, разумеется, но очень хорошо получилось.

Очень часто встречается неправильно распознанная латиница, причем бывают забавные слачаи, например (из литресовской книжки): in писе, что следует читать как in nuce, ну а это в общем-то (букв. лат. "в орехе", "в зародыше", обычно употребляется как "в целом", "в общем" и т.п.) не очень-то и далеко...

Аватар пользователя Isais

Это когда в ФР выставлен режим "русский+английский".
На днях ФР в таком режиме принес мне rope- (в латинице) вместо горе- ("горе-охотник", что ли).

Страницы

X