Вы здесьКак правильно отсканировать?
Опубликовано сб, 14/03/2009 - 12:36 пользователем thirteen
Есть сканер, есть Файнридер, есть книга, которую хочу выложить, точно знаю, что в сети её нет. Посоветуйте правильные настройки при сканировании (разрешение, цвет...) и в каком формате лучше сохранять? Я пытался в ПДФ, но он даже при скромных размерах книги получается почти 60 мег. Что я делаю не так?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 день
Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 2 дня Океана RE:Подайте бедному копеечку на книжку с литреса... 3 дня fixel RE:Пропал абонемент 3 дня sem14 RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 недели sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 3 недели Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 1 месяц sem14 RE:Серия "Символы времени" издательства "Аграф" 1 месяц tvv RE:faq brainstorm =) 1 месяц Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 2 месяца Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 2 недели larin RE:абонемент не обновлен 2 месяца sem14 RE:За иллюминатором (серия) - чего не хватает? 2 месяца sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 2 месяца Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 2 месяца tvv RE:DNS 2 месяца MrMansur RE:<НРЗБ> 2 месяца Впечатления о книгах
iggy71 про Сашар: Я не верю в монстров [There’s a Boy in the Girls’ Bathroom ru] (Детская проза)
20 03 Шедевр. И перевод великолепный. Оценка: отлично!
iggy71 про Буайе: Ромашка. Легенда о пропавшем пирате [litres] (Исторические приключения, Морские приключения)
20 03 Эту муть мог сочинить только ИИ или наркоман. Оценка: плохо
Barbud про Алексеев: Стрелочники истории (Альтернативная история, Научная фантастика)
19 03 Сдохли бы два взрослых мальчика в силуре. Атмосфера тогда была не слишком подходящей для человека и нынешних животных - кислорода еще мало, на пределе для дыхания, углекислоты слишком много. Возможно, какие-нибудь роющие млекопитающие ………
mysevra про Лобанов: Охотник на творцов (Боевая фантастика, Детективная фантастика, Самиздат, сетевая литература)
17 03 Идея просто замечательная, а воплощена спустя рукава. Не знаю, может, мне просто претит излишняя несерьёзность и простота изложения. Какое-то оно чересчур комедийно-залихватское. Оценка: неплохо
mysevra про Гумилёв: Открытие Хазарии [историко-географический этюд] (История)
17 03 Не, ну это на любителя, господа. Вот я – любитель, поэтому перечитываю. Оценка: отлично!
mysevra про Абакумов: Модератор реальности (Боевая фантастика)
17 03 Вроде и сюжет закручен, и идея неплохая, но события так вязко и затянуто изложены, что я не дочитала. Оценка: неплохо
francuzik про Осадчий: Приключения смекалистого мага жизни (Фэнтези, Самиздат, сетевая литература)
17 03 Долго ждал продолжения истории о Петре Птахине. И это случилось. Автор правда другой, но написано ничуть не хуже. Оценка: отлично!
Дей про Строитель
16 03 Автор, пиши ещё! Это очень, скажем так, спокойное литрпг. Без активного действия - никто никуда не бежит, ни с кем не сражается, к бою с мировым злом не готовится. Строитель попадает в тело подростка, подручного деревенского ………
Дей про Останин: О бедном мажоре замолвите слово 4 (Детективная фантастика, Попаданцы, Самиздат, сетевая литература)
15 03 В смысле "серия закончена"? Да кто ж так повествование обрубает-то? Там же задел книг на 10 остался! Вот же совести у автора нету( Оценка: отлично!
valeryma про Земляной: Мастер стихий [СИ] (Альтернативная история, Социальная фантастика, Попаданцы, Самиздат, сетевая литература)
15 03 Графомань для подростков в пубертате Оценка: нечитаемо
Darja68 про Маринина: Посох двуликого Януса (Детективы: прочее)
14 03 Господи, какая немыслимая чушь. Это ж надо так. (( Стерла из читалки. А какой была хорошей детективщицей!
udrees про Володин: Газлайтер. Том 10 [СИ] (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
14 03 Достаточно рядовое продолжение серии, читается увлекательно, если не обращать внимания на примитивные описания и несерьезные разговоры. Школа у героя закончилась, но школа в его голове осталась. Сам он так же крут, всех врагов ……… |
Комментарии
Отв: Как правильно отсканировать?
Тут кт-то писал про сканирование фотоаппаротом.
Вот несколько мыслей из моего опыта.
Требования к фотоаппарату
Сразу и бесповоротно – мыльницы не подойдут.
За редким исключением. Например такие как некоторые модели Canon
В фотоаппарате должны быть.
1. Минимум – 6 Мпиксел, Оптимально – 8 Мпиксел Идеал – 12 и более Мпиксел.
2. Обязательным условием является наличие оптического (не электронного!) стабилизатора ихображения
3. Желательно наличие дистанционного пульта управления.
4 Из обязательных условий – наличие ручной настройки и фокусировки. Автоматика исключается...
Для сканирования фотоаппаратом нужно собрать установку. Основой лучше всего является штативная стойка фотоувеличителя.
Но главное внимание нужно уделить освещению. Вспышка – исключена. Сканируемый текст должен быть освещён с обеих сторон ярким рассеянным светом.
Преимущества фотоаппарата огромны.
Во-первых, можно сканировать разворот, превышающий стандартный для многих сканеров формат A4.
Во – вторых появляется возможность уже в процессе сканирования убрать лишний мусор. То есть перекрывать кусками белой бумаги нумерацию страниц, колонтитулы и прочее...
Есть ещё много мелких преимуществ, но это главные.
Отв: Как правильно отсканировать?
Все, вроде, так и есть, как написано. У меня как раз есть опыт работы "мыльницей", подтверждаю, что результаты не очень :(. И, следовательно, нужно оставить даже мысль о том (как думают некоторые), что сканировать фотоаппаратом - дешевле, легче и т.п. Один хороший штатив чего стоит, освещение, и прочее. Для рабочего места не полметра на столе, а куда больше требуется. Сложности большие, по сравнению со сканером в $50 (не идеал, конечно, но позволяет получить результат куда качественнее, чем обычная камера в $100). Преимущества совсем в другом!
Отв: Как правильно отсканировать?
Согласно данным требованиям, яндекс-маркет выдает следующее:
http://market.yandex.ru/guru.xml?CMD=-RR=9,0,0,0-PF=4390456%2BGT%2Bsel%2B8-PF=15504541%2BTR%2Bsel%2Bselect-VIS=1F2-CAT_ID=100514-EXF=1-EXC=1-PG=10&hid=91148&filter=&num=&greed_mode=false
Ценник от 16 тыс. рублей за Sony Alpha DSLR-A100 Kit и выше.
Добавим к стоимости еще пару тысяч рублей минимум на установку со светом.
И вычеркнем из жизни пару-тройку квадратных метров площади квартиры. (У меня собрана такая штука, так что я в курсе, о чем говорю).
Согласен. Помимо скорости съемки - пока это единственное преимущество, которое я вижу.
На сканере это еще проще и быстрее )) Но не на всех книгах это реально сделать из-за бездарной верстки.
Но для книг давно есть книжные сканеры типа Plustek OpticBook 3600
http://market.yandex.ru/model.xml?hid=91112&modelid=858007
http://www.document-scan.ru/descr99.htm
Ценник - те же 15-16 тыщ, скорость скана высокая - только успевай листать, спец софт, спец конструкция сканера, высочайшее качество сканов, места занимает гораздо меньше фото-установки, в эксплуатации дешевле.
Отв: Как правильно отсканировать?
Распозновать надо, без сохранения структуры документа. То есть без колонок, картинок и всяких прочих ненужностей. Но всё равно, при передаче в Word, страницы не стыкуются. Странно, что Finerider не обрабатывает страницы как целое. Они сохраняются, каждая в отдельном разделе.
Чтобы соединить текст в одно целое, вроде бы достаточно убрать все разрывы раздела. Да не тут то было... В случае качественного оригинала три ситуации:
1. При стыковке должен получится новый абзац
2. При стыковке должна склеится строка
3. При стыковке должна склеится строка с удалением знака переноса, если слово в тексте переносится на следующую страницу.
При некачественном оригинале, нужно провести предварительную обработку, заключающуюся в удалении всех пробелов до знака конца абзаца. В принципе, это не помешает в любом случае.
Алгоритм склейки такой...
1. Ищется разрыв раздела
2. Анализируется стык на один из трёх вышеупомянутых случаев
3. Производится стыковка
4. Переход к другому разрыву.
В простейшем случае это реализуется четырьмя макросами.
Их вызов осуществляется кнопками выведенными на панель инструментов.
Первый макрос просто ищет первый разрыв раздела.
Анализ проводит человек и выбирает один из трёх других макросов, в зависимости от ситуации.
В принципе это можно автоматизировать, написав простейший анализатор, но в любом случае – автоматика может дать сбои. И поэтому лучше, если место стыка окрасить каким-нибудь цветом, для последующего контроля.
Вот 4 макроса, для полуавтоматической обработки.
Sub Разрыв_раздела_Поиск()
'
' Разрыв_раздела_Поиск Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Sub Новая_строка()
'
' Новая_строка Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.TypeParagraph
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Sub Соединение_строк()
'
' Соединение_строк Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.TypeText Text:=" "
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Sub Удаление_переноса()
'
' Удаление_переноса Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.TypeBackspace
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Но это не всё... есть ведь ещё и колонки....
Отв: Как правильно отсканировать?
Я тут начал для затравки про макросы писать.
Пробовал кто-нибудь?
Продолжать дальше или нет?
Отв: Как правильно отсканировать?
А Вы не хотите написать все, чем можете поделиться и, выложив на Либрусеке, дать ссылку? Смотреть лучше все в комплекте, а не выискивать по кусочкам. Пригодится это обязательно - на самом деле довольно много людей, даже зная как, не умеют это объяснить другим. Туда же и макросы напишите. Это очень, leoparrd, полезное дело Вы придумали.
Отв: Как правильно отсканировать?
Не устану повторять:
НЕ НАДО djvu!!!!!
Djvu - могила для текста.
Делайте PDF. Кого анноит размер - делайте правильно.
И ещё - не надо фотоаппаратов... Тем более - "простеньких". Сделать приемлемый скан фотоаппаратом - достаточно нетривиальная задача. И решить её - не проще, чем добыть нормальный сканер.
А 200 страниц - на любом сканере несложно.
Отв: Как правильно отсканировать?
Обоснуй ))
Распознавал с правильно сделанных дежавю неоднократно - иногда качество распознанного лучше, чем я сам сканером получаю.
Криво сделанный pdf не лучше криво сделанного дежавю. Плюс размер нехилый.
Отв: Как правильно отсканировать?
Скажите пожалуйста, а почему могила-то? Мне приходилось окрить с ДежаВю с прекрасными результатами распознавания, почти без ошибок. Или Вы о чем-то другом пишете?
Отв: Как правильно отсканировать?
Аналогично.
Страницы