Вы здесьТекстовый pdf из сканов
Опубликовано чт, 09/12/2010 - 08:07 пользователем golma1
Forums: Текстовый pdf, сделанный из сканов, - намного удобнее для хранения и при вычитке, чем любой другой вариант. Я только не очень поняла, какие вопросы при этом возникают. ;)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Aliki RE:Подайте бедному копеечку на книжку с литреса... 15 часов
Larisa_F RE:Современная корейская литература. Книжная серия... 4 дня Larisa_F RE:Таррин Фишер 4 дня Aleks_Sim RE:Беженцы с Флибусты 5 дней Саша из Киева RE:Как приобретать друзей и оказывать влияние на людей 1 неделя Isais RE:Семейственность в литературе 1 неделя miri.ness_ RE:Доступ 27 1 неделя bmusanov Оплатил, но абонемент не отображается 2 недели holla RE:Багрепорт - 2 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 недели konst1 RE:Файнридер для Win11 2 недели larin RE:Оплатил, но абонемент не отображается 3 недели sem14 RE:Книжная серия «Сlio» издательства "Евразия" 3 недели Isais RE:Национальный конкурс на лучшее литературное произведение... 3 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 3 недели sem14 RE:«Морской роман» — книжная серия Калининградского книжного... 3 недели larin RE:Оплатил,но абонемент не отображается 3 недели sd RE:Fishing 1 месяц Впечатления о книгах
Олег Макаров. про Царь Федя
21 08 Что-то надо делать с нацизмом у авторов... Как-то помечать книги, может быть? Невозможно же читать, чесслово.
Barbud про Яманов: Сын Тишайшего-2 (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
21 08 Вначале было ничего так, хотя и не без ляпов и анахронизмов, да и герои общаются очень уж по-современному. Но к концу второй части из ГГ (или из автора?) полезло дерьмо - смакование казни на колу, рассуждения о собственной ……… Оценка: нечитаемо
Isais про Роббинс: Куда ушла любовь [Where Love Has Gone ru] (Современная проза, Семейный роман/Семейная сага)
20 08 Криминальная линия в романе основана на действительных событиях — на драме в семье голливудской кинодивы Ланы Тёрнер из-за связи с лос-анджелесским гангстером.
obivatel про Спасти красноармейца Райнова
20 08 2 marin029 Да, во втором томе. У Поселягина всё такое: где-то что-то слышал, втыкает в текст не разобравшись; ну не склонен он к анализу и глубокой проработке не только входящей, но и исходящей информации, и по тексту одно ………
Лысенко Владимир Андреевич про Усманов: Следующий шаг (Боевая фантастика, Героическая фантастика, Попаданцы)
19 08 Эта серия книг нечитаемая, не понял, что автор в этих книгах хотел сказать, нечитаемо. Оценка: нечитаемо
obivatel про Страж [Земляной]
18 08 Годное чтиво для разжижения мозгов: всенагибающий всенаклоняющий всехпривлекающий и т.д и т.п.; читателю остаётся только расслабиться и внемлить потоку эпического повествования. 2 ne_fanat согласен по каждому слову. Но ………
udrees про Эрлих: Легко ли плыть в сиропе. Откуда берутся странные научные открытия (Физика, Научная литература: прочее, Научпоп)
17 08 Очень интересная, веселая и занимательная книга, посвященная необычным или бесполезным открытиям в науке. Я честно думал прочитать про открытия как селедки общаются посредством «пуканья», но в книге хватает и других полезных ……… Оценка: хорошо
udrees про Михайлов: Кроу. Суровые земли (ЛитРПГ)
17 08 Для поклонников обычных приключений в стиле литРПГ, книга может показаться очень скучной. Подавляющее время идет описание хозяйственных хлопот, налаживания связей, экономических проблем индивидуального предпринимателя гнома ……… Оценка: неплохо
udrees про Шермер: Небеса на земле. Научный взгляд на загробную жизнь, бессмертие и утопии [Heavens on Earth: The Scientific Search for the Afterlife, Immortality, and Utopia ru] (Научная литература: прочее, Научпоп)
17 08 Хорошая популярная книга с рассуждениями о жизни, смерти, жизни после смерти, возможности достижения бессмертия или хотя бы внушительного долголетия, построения утопического общества и смысла жизни. Утешения в такой книге ……… Оценка: хорошо
Юле4ка про Хольст: Зелёный, ласковый весенний ветер (Детективы: прочее)
16 08 Книга переведена со шведского для поклонников автора с помощью ИИ, результат очень читабельный. Enjoy! Оценка: отлично!
mysevra про Булычев: Сто лет тому вперед [Гостья из будущего, с иллюстрациями] (Детская фантастика)
15 08 Из советских фантастов создавать такие светлые миры будущего умел лишь Булычев да, пожалуй, Стругацкие в некоторых произведениях. Ностальгия за тем, чего не было, но очень хотелось. Иллюстрации Мигунова просто изумительны. Оценка: отлично! |
Отв: Текстовый pdf из сканов
Не надо цитировать мультики, википедию, и растекаться мыслями. Мы и без википедии знаем, что TIFF - формат без потерь, а JPEG - с потерями. Еще с тех времен, когда вики не было. Речь не о теории, а о практике конкретной работы.
но по факту распознается не хуже
Отв: Текстовый pdf из сканов
Если знаешь, зачем тогда людей в заблуждение вводишь "голословными измышлениями"?
По какому факту?
У нас с Вами факты разные:
я Вам про Фому, Вы мне про Ерёмуя Вам факты привел, Вы сказали, что факты неправильные. Чем они неправильные? Они что, дают неправильный мёд? Или просто обзываете то, что неугодно Вам "неправильными" фактами.Я тоже по факту говорю: распознание с TIFF лучше, чем с JPEG,а Вы отвечаете: "Это всё теория, а на практике всё наоборот!"
Если бы я ничего не распознавал, я бы с Вами может и согласился, но мне тоже приходилось распознавать, и поэтому я знаю, что и практика говорит то же самое, что и теория.
Отв: Текстовый pdf из сканов
А вот не надо. Не надо замусоривать ветку по конкретному вопросу своими измышлениями.
Откройте новую и расскажите там всем о том, что JPEG 300dpi в оттенках серого ФР "не любит". В-)
Отв: Текстовый pdf из сканов
Да я бы, как грится, с радостью.
Но тогда в этой ветке останутся измышления niksi, на которые, как покажется, никто не дал отпор!
Так что приходится тут, что ж поделаешь...
Отв: Текстовый pdf из сканов
Читать умеешь? НЕ НАДО БЫЛО НАЧИНАТЬ. ТЕБЕ.
Еще раз. Джпеги 300 и тифы 300 распознаются примерно с одинаковым кол-вом ошибок. Одно не лучше другого. Хочешь оспорить - приводи примеры. Одних и тех же сканов, распознанных с тифоф и джпегов, с указанием кол-ва ошибок в одном и другом случае. В новой теме. Иначе говорить не о чем. Я с удовольствием признаю, что не прав, если это будет ДОКАЗАНО.
Отв: Текстовый pdf из сканов
Да, пожалуйста.
И я там обязательно напишу, что ВСЕ сканы, полученные мною от niksi и Ronja_Rovardotter, распознаются с минимальным количеством ошибок. В каком формате и с каким разрешением они сделаны, расскажут сами сканировщики. В-)
Отв: Текстовый pdf из сканов
Реплика убойная!
Я ж не знал, что на мою вполне невинную реплику будет столь громкий ор с
метанием какашекобзывааниями.Отв: Текстовый pdf из сканов
Давно я так не веселился. :-)
Отв: Текстовый pdf из сканов
(хихикает) Вот мне всегда кажется, что если я понимаю, то уже тогда точно и все понимают, а вот поди ж ты... Не бывает JPEG без потерь. Вот просто не бывает и все. Бывает сжатие с максимальным качеством. Ага, для JPEG-ов максимальным. )))
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Видимо, необходимо все же отметить для тех, у кого еще не очень много опыта по оцифровке книг, что опытные и великолепные сканировщики, такие как niksi и Ronja_Rovardotter, и опытные и отличные OCR-щики, такие как Голма, обмениваются сканами именно в jpg, что значительно проще и быстрее. Такие сканы замечательно распознаются, и работать с их сканами - одно удовольствие.
Необходимо так же предупредить новичков об осторожности при принятии на веру утверждений и советов Zadd-а, т.к. в них энтузиазм и поспешность в суждениях, как правило, преобладает над знанием и умением. Полезно делать на это поправку, не отвергая, впрочем, и некоторой части его советов.
Отв: Текстовый pdf из сканов
Хм. Опробовал оба способа на 256-сером 300-dpi'йном скане, уже распознанном и (в меру возможностей ФР) вылизанном. У ФР получаются либо редкостно говённые картинки (даже акробат-ридер их через раз в упор не понимает), либо полноценные серые картинки, но сотни мег размера, зато с уже готовым текстом. У акробата - соответственно, ч/б картинки - ляля, размер на двух с чем-то сотнях страниц - меньше десятка метров, но текст никакой.
Ну и третий способ, который до сих пор юзаю, - выгрузить из файн-ридера однобитные ч/б картинки, их опять загрузить, распознать и сделать .pdf, - сочетает слабовыраженные недостатки предыдущих способов (картинка не особо хороша и текст так себе, размер в раза полтора побольше, чем после акробата).
А нельзя ли (ценой не чрезмерно больших трудозатрат) скрестить оба способа и получить файн-ридерный текст с акробатной картинкой?
Отв: Текстовый pdf из сканов
Сделать после распознавания в FR-е pdf по способу TaKir-а, но не для web, а с хорошим качеством, а потом ужать в Акробате готовый pdf?
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Что-то Acrobat не хочет tiff-файлов...
Acrobat 9.0.0 а файлы цветные.
FineReader'ом из 75 страниц никак меньше 26 мегов pdf не получается.:(
Отв: Текстовый pdf из сканов
Таки получилось. Правда из другой книжки в сером цвете. 380 страниц - 15 Мегов. Очень хорошо.
Спасибо Голма!
Страницы