Вы здесьТекстовый pdf из сканов
Опубликовано чт, 09/12/2010 - 08:07 пользователем golma1
Forums: Текстовый pdf, сделанный из сканов, - намного удобнее для хранения и при вычитке, чем любой другой вариант. Я только не очень поняла, какие вопросы при этом возникают. ;)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
aldan RE:Подайте бедному копеечку на книжку с литреса... 19 часов
alexk RE:DNS 3 дня sem14 RE:Гонкуровская премия 3 дня Dead_Space RE:Беженцы с Флибусты 5 дней Саша из Киева RE:Приключения белочки Рыжки 2 недели alex-from RE:Оплатил два раза, но абонемента нет 3 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 недели Kiesza RE:На 78-м году жизни скончался советский и российский... 3 недели Paul von Sokolovski RE:Бушков умер. 1 месяц lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц mig2009 RE:Багрепорт - 2 1 месяц Isais RE:Издательство "Медуза" 1 месяц babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 1 месяц Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 месяц sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц Isais RE:Игорь Северянин - Том 2. Поэзоантракт 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц sem14 RE:Семейственность в литературе 1 неделя Впечатления о книгах
Oleg68 про Иванов: Золото бунта, или Вниз по реке теснин (Историческая проза, Исторические приключения)
24 11 Книга понравилась. Интрига, описание быта тех времен и, конечно, описание природы. Все на высшем уровне. Оценка: отлично!
Олег Макаров. про Реванш
24 11 Феерическая чушь. Испанский стыд как он есть. То есть, на самом деле написал Максимушкин, а стыдно почему-то мне
decim про Мейсон: Северный лес [litres] (Историческая проза, Современная проза)
24 11 Люто одобряю. Каких-то литературных открытий нет, просто отличная книга в отличном переводе. Отдельное спасибо за показ природы глазами не скучающего блогера, но лесного жителя и даже участника событий. Это сейчас редкость. ………
mysevra про Кинг: Стрелок [переработанная автором версия] [The Gunslinger ru] (Фэнтези)
24 11 Слышала, что надо прорваться через первую книгу, дальше будет веселее. Оценка: неплохо
mysevra про Галь: Слово живое и мертвое (Языкознание, Литературоведение)
24 11 Книгу интересно читать сразу после «Поверженных буквалистов». Обе школы по-своему правы, но поражает другое – профессионализм, энциклопедические знания и общий уровень эрудиции, культуры, да и просто интеллигентности переводчиков тех времён. Оценка: отлично!
mysevra про Вернер: Славгород [litres] (Героическая фантастика, Детективная фантастика, Фэнтези)
24 11 Язык хорош. Но я думала, что это будет детектив-трупы-загадка, а тут расовое угнетение, социальное неравенство и гендерная борьба, слегка присыпанные пудрой фэнтези. Прелестно, только хотелось совсем другого. Оценка: неплохо
decim про Алеников: Невероятная подлинная история Горгоны медузы (Современная проза)
23 11 Ещё один с юморком пометил чужое, задрав заднюю ногу. На этот раз - греческий миф попал под, цитируя аффтара, золотой дождь. Кстати, о Медузе. Как-то так вышло, что одновременно в сети появилась книга "I, Medusa", автор ………
alex-from про Гросов: Инженер Петра Великого – 1 (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
23 11 незамысловато и наивно. Плохо Оценка: плохо
udrees про Шиленко: Искатель - 1 [СИ] (Фэнтези, Эротика, ЛитРПГ, Самиздат, сетевая литература)
23 11 Достаточно просто написанная книжка по литРПГ, очередной попаданец. Сюжет не блещет новизной, герой умер и ему дают выбор прожить замечательную жизнь в РПГ-мире, но один раз. Статистика статов не загромождает текст. Описания ……… Оценка: плохо
udrees про Каган: Пелопоннесская война [litres] (История, Военная документалистика)
23 11 В книге достаточно много карт древней греции с отметками городов, островов, пару раз даже укрупненные карты с городом и обзором где были укрепления, где стояли войска. Но в целом должен отметить, что на картах не отмечены ……… Оценка: хорошо
udrees про Морале: Проклятье, с*ка! Книга 1 (с иллюстрациями) [АТ] (Попаданцы, Самиздат, сетевая литература)
23 11 Очень простенькое, примитивное, слюнявое, наивное чтиво для развлечения своего нижнего друга. Книжка для озабоченных подростков наверное. Половину книги занимают картинки, причем различных сексапильных девиц в откровенных ……… Оценка: плохо
udrees про Володин: Газлайтер. Том 1 [СИ] (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
23 11 Простенько написанная книжка про попаданца, теперь в тело школьника со способностями телепата. Написано очень простым языком, описания и объяснения почти отсутствуют, просто описываются похождения главного героя, ну скорее ……… Оценка: неплохо |
Отв: Текстовый pdf из сканов
Не надо цитировать мультики, википедию, и растекаться мыслями. Мы и без википедии знаем, что TIFF - формат без потерь, а JPEG - с потерями. Еще с тех времен, когда вики не было. Речь не о теории, а о практике конкретной работы.
но по факту распознается не хуже
Отв: Текстовый pdf из сканов
Если знаешь, зачем тогда людей в заблуждение вводишь "голословными измышлениями"?
По какому факту?
У нас с Вами факты разные:
я Вам про Фому, Вы мне про Ерёмуя Вам факты привел, Вы сказали, что факты неправильные. Чем они неправильные? Они что, дают неправильный мёд? Или просто обзываете то, что неугодно Вам "неправильными" фактами.Я тоже по факту говорю: распознание с TIFF лучше, чем с JPEG,а Вы отвечаете: "Это всё теория, а на практике всё наоборот!"
Если бы я ничего не распознавал, я бы с Вами может и согласился, но мне тоже приходилось распознавать, и поэтому я знаю, что и практика говорит то же самое, что и теория.
Отв: Текстовый pdf из сканов
А вот не надо. Не надо замусоривать ветку по конкретному вопросу своими измышлениями.
Откройте новую и расскажите там всем о том, что JPEG 300dpi в оттенках серого ФР "не любит". В-)
Отв: Текстовый pdf из сканов
Да я бы, как грится, с радостью.
Но тогда в этой ветке останутся измышления niksi, на которые, как покажется, никто не дал отпор!
Так что приходится тут, что ж поделаешь...
Отв: Текстовый pdf из сканов
Читать умеешь? НЕ НАДО БЫЛО НАЧИНАТЬ. ТЕБЕ.
Еще раз. Джпеги 300 и тифы 300 распознаются примерно с одинаковым кол-вом ошибок. Одно не лучше другого. Хочешь оспорить - приводи примеры. Одних и тех же сканов, распознанных с тифоф и джпегов, с указанием кол-ва ошибок в одном и другом случае. В новой теме. Иначе говорить не о чем. Я с удовольствием признаю, что не прав, если это будет ДОКАЗАНО.
Отв: Текстовый pdf из сканов
Да, пожалуйста.
И я там обязательно напишу, что ВСЕ сканы, полученные мною от niksi и Ronja_Rovardotter, распознаются с минимальным количеством ошибок. В каком формате и с каким разрешением они сделаны, расскажут сами сканировщики. В-)
Отв: Текстовый pdf из сканов
Реплика убойная!
Я ж не знал, что на мою вполне невинную реплику будет столь громкий ор с
метанием какашекобзывааниями.Отв: Текстовый pdf из сканов
Давно я так не веселился. :-)
Отв: Текстовый pdf из сканов
(хихикает) Вот мне всегда кажется, что если я понимаю, то уже тогда точно и все понимают, а вот поди ж ты... Не бывает JPEG без потерь. Вот просто не бывает и все. Бывает сжатие с максимальным качеством. Ага, для JPEG-ов максимальным. )))
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Видимо, необходимо все же отметить для тех, у кого еще не очень много опыта по оцифровке книг, что опытные и великолепные сканировщики, такие как niksi и Ronja_Rovardotter, и опытные и отличные OCR-щики, такие как Голма, обмениваются сканами именно в jpg, что значительно проще и быстрее. Такие сканы замечательно распознаются, и работать с их сканами - одно удовольствие.
Необходимо так же предупредить новичков об осторожности при принятии на веру утверждений и советов Zadd-а, т.к. в них энтузиазм и поспешность в суждениях, как правило, преобладает над знанием и умением. Полезно делать на это поправку, не отвергая, впрочем, и некоторой части его советов.
Отв: Текстовый pdf из сканов
Хм. Опробовал оба способа на 256-сером 300-dpi'йном скане, уже распознанном и (в меру возможностей ФР) вылизанном. У ФР получаются либо редкостно говённые картинки (даже акробат-ридер их через раз в упор не понимает), либо полноценные серые картинки, но сотни мег размера, зато с уже готовым текстом. У акробата - соответственно, ч/б картинки - ляля, размер на двух с чем-то сотнях страниц - меньше десятка метров, но текст никакой.
Ну и третий способ, который до сих пор юзаю, - выгрузить из файн-ридера однобитные ч/б картинки, их опять загрузить, распознать и сделать .pdf, - сочетает слабовыраженные недостатки предыдущих способов (картинка не особо хороша и текст так себе, размер в раза полтора побольше, чем после акробата).
А нельзя ли (ценой не чрезмерно больших трудозатрат) скрестить оба способа и получить файн-ридерный текст с акробатной картинкой?
Отв: Текстовый pdf из сканов
Сделать после распознавания в FR-е pdf по способу TaKir-а, но не для web, а с хорошим качеством, а потом ужать в Акробате готовый pdf?
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Что-то Acrobat не хочет tiff-файлов...
Acrobat 9.0.0 а файлы цветные.
FineReader'ом из 75 страниц никак меньше 26 мегов pdf не получается.:(
Отв: Текстовый pdf из сканов
Таки получилось. Правда из другой книжки в сером цвете. 380 страниц - 15 Мегов. Очень хорошо.
Спасибо Голма!
Страницы