Хотим много книг, или сканировщики всех стран объединяйтесь!

Последнее время озадачился вопросом попадания новых (да и старых) книг в сеть. Что мы имеем на данный момент? - Литресятину и разброд во всем остальном. Плюс еще последние события (вполне логично, однако все так же негативно) дробят наше сообщество сканировщиков и вычитывателей. В результате некоторые книги появляются и покупаются на разных сайтах по два-три раза некоторых совсем нет, люди делают лишнюю работу, за одно создавая потом лишние проблемы "библиотекарям".
Короче нужна определенная централизация.

При всем уважении к Либрусеку, Флибусте, Песочнице , Huge-Library и многим другим я считаю что книги на первичную вычитку нужно брать в одном месте, и на данный момент таким наиболее подходящим местом явл;яется (в силу разных исторических причин) Библиотека Старого Чародея.
Ведь именно там, вдали от Либрусековских "политических бурь" как не странно собралось наибольшее число опытных сканировщиков и вычитывателей которые организовались наилучшим способом и работают создавая новые FB2.

Собственно речь о том что у них очень много книг, на "обработку" , даже больше чем людей и если вы можете помочь то загляните пожалуйста на главную http://oldmaglib.com/ справа или на форум http://bomanuar.com/forum/index.php?topic=231.0 и присмотрите себе книжку "в работу".

За одно, если вы собираетесь купить какую то книжку, вначале проверьте на форуме http://bomanuar.com/forum/index.php?topic=231.0 - может она уже куплена , если вы купили какую то книгу то опять же пожалуйста отметьтесь там же чтобы не производить лишнюю ненужную работу.

Да, и кстати , на Чародее применено очень удобное разделение труда - если вы например вычитываете но не имеете сканера и/или книг сканировать - то вы можете получить скан и вычитывать , если у вас есть сканер и книги а вы не имеете понятия как делать FB2 то вы можете отправить скан админу Старого Чародея и его сконвертирует и вычитает кто то другой.

Короче, за работу товарищи ! :)

Да, еще одна просьба, если вы не уверены что сможете сделать книгу в течении разумного периода времени (ну что то вроде месяца) то пожалуйста не беритесь за работу - этих книг ждут люди.

Updated:
Вообще тут какой еще момент, возможно я упустил его в начальном посте - я не призываю переходить на "Старого Чародея" читателей для них есть Либрусек, Флибуста и прочие, "Старый Чародей" это в первую очередь библиотека созданная теми кто конвертирует книги. Соответственно удобна она в первую очередь не читателям (им то лучше здесь) а тем кто "работает" над книгами. Это ведь не просто место где берутся книги ето место где встречаются люди с определенными знаниями и определенным кругом интересов завязанным на оцифровке книг. Там вам могут помочь, там вы можете разделить с кем то работу, пообщатся, не как читател а именно как оцифровщик.
Понятно этим можно заняться и тут, но ваш вопрос или запрос скорее всего пропадет среди тысяч других обсуждений на миллион разных тем, а там люди занимаются именно оцифровкой.
Не думаю что это была изначальная цель Чародея но так уж сложилось и грез это не использовать.
Кстати это же относится и к вопросу о жанрах - не важно какие именно жанры собирает Чародей, это для читателей, для оцифровщиков это же место встречи и обмена и по этому можно договорится о любом жанре а выложить потом куда угодно.

Комментарии

"И незачем так орать"(с) - давно с ними работаю, но не очень плотно, ибо тематика не всегда интересна.

Конечно можно вам выдать за это медаль :) но список "неназначеных" книг там довольно большой а это значит людей все же не хватает.

Эрония умилила. Представляю, вашу эронию, если скажу, что вычитывал в свое время для Альдебарана со сканов Юстаса.

Понятно, что один человек не сделает все отсутствующие в сети книги. Но каждый может сделать ровно столько сколько сможет, не более.

Две медали и орден ? ;)
Не будте букой :) и не надо мерится пиписьками. Просто тема была все же немножко не о заслугах сканировщиков а о координации на будущее.

Пирожок с полки и "много книг"(с)

Мне наплевать на бронзы многопудье,

мне наплевать на мраморную слизь.

Сочтемся славою — ведь мы свои же люди,

— пускай нам общим памятником будет

построенный в боях социализм.

Lord KiRon написал:

Да, еще одна просьба, если вы не уверены что сможете сделать книгу в течении разумного периода времени (ну что то вроде месяца) то пожалуйста не беритесь за работу - этих книг ждут люди.

Ну вот с этим я, пожалуй, не соглашусь.
Разные книжки бывают. И с кучей картинок, и с кучей ссылок, и с кучей цитат и вставных стихов. И не всех книжков ждут как горячих пирожков . Я вот у себя с книжной полки кое-каких японо-китайцев снял и рядом со сканером положил. Но с учетом семьи, детей и всякого другого-прочего, у меня одна книжка на 300 страниц от сканера до состояния fb2 кушается не менее чем за месяца 2-3-4.
Пример:
Году в 2003 в сети появились два первых тома Гэндзи, и они сопровождались комментариями, что третий том уже делается и вот скоро. Но тома 3-5 так и лежат по сю пору в поганого качества djvu. Поэтому я в начале этого года начал с пятого тома (чтобы меня не опередили с третьим). Пятый сделал, четвертый сделал, сейчас добиваю третий. А книжки (такие) тяп-ляп делать не хочется, - вычитываю по два раза и торопиться ну ни за что не буду, как бы их кто ни ждал. С 2003 года ждали (или не ждали, что тоже вероятно), и еще пару-тройку месяцев подождут. Зато будет качественный продукт. А опередит кто с третим томом - ну значит нога судьбы ...

Борис

Я не спорю, именно по этому я сказал "разумного периода времени" а месяц это так, "навскидку" середнячек для стандартной книги.

BorisJ написал:
Году в 2003 в сети появились два первых тома Гэндзи, и они сопровождались комментариями, что третий том уже делается и вот скоро. Но тома 3-5 так и лежат по сю пору в поганого качества djvu.
http://www.bookshunt.ru/books/povest_o_gendzi_gendzi_monogatari._v_5_tomah - то же самое или, может быть, вдруг хоть чуть-чуть получше?

То же самое. Два первых тома chm, но они уже давно есть в fb2 здесь и много где еще. 3 и 4 очень плохого качества осветленные djvu из сканов - ближе к корешку многие страницы нечитаемы (я не стал связываться и пересканировал), а 5-й том - djvu с фотографий - серая неконтрастность - однозначно перескан. Правда 5-й том там есть и распознанный - в виде кусков *.doc, но т.к. этот 5-й - примечание, то там важны иллюстрации и схемы, а они - увы, те же серые фотки. Хотя, по правде говоря, 5-й том в таком виде раньше мне в инете не встречался. Я прежде чем этим делом заняться, сеть, конечно, прочесывал.

BorisJ написал:
То же самое.
:-(
Когда-то, ещё в школьные годы, читал отрывки "Сказания..." в каком-то хрестоматийном сборнике древневосточной литературы. Давно уже ношусь с идеей взять и "прочувствовать всю его прелесть" (L) целиком. Но каждый раз отпугивают размер, многотомность и, главное, отсутствие третьего тома.
Жду с нетерпением! Могу оказать помощь с реставрацией иллюстраций.

Рыжий Тигра написал:
BorisJ написал:
То же самое.
:-(
Когда-то, ещё в школьные годы, читал отрывки "Сказания..." в каком-то хрестоматийном сборнике древневосточной литературы.
Жду с нетерпением! Могу оказать помощь с реставрацией иллюстраций.

Это был, скорее всего, отрывок в переводе Конрада в одном из томов БВЛ.

За предложение помощи спасибо. Но иллюстрации, в основном, были в 5-м томе, который уже сделан. Сейчас я с помощью TaKir'а освоил работу с графикой, с помощью wotti (он кстати конвертил 5-й том) - конвертирование в fb2. Да и реставрация здесь не нужна. Иллюстрации - только заставки в начале и конце глав, обложки и форзац. У меня эти книги есть в бумаге и я их заново отсканировал в нужном мне качестве.
С книжкой надеюсь успеть до Нового Года, а если нет, то в каникулы уж точно доделаю, особенно если снега не будет.

Борис

BorisJ,

Ты очень неправ, что оставляешь на потом сканирование книг только из-за того, что нет времени на вычитку.
Отсканируй и выложи в сеть, а распознавать и вычитывать будешь потом, так сказать версия номер 2 - в rtf/fb2/doc/txt
А версия номер 1 - djvu/pdf
И сам будешь доволен (не будет сдерживать тебя от выкладывания книг нехватка времени), и больше пользы будет всем.
Поверь, за один раз идеально все не сделаешь (с распознаванием и вычиткой), а так могут люди подключиться и помочь. А даже если и никто не распознает - все равно книга станет доступной, ведь даже 50 мб сегодня терпимо для книги, которую хочется прочитать, а в djvu при хорошем качестве - это будет всего 2 - 10 мб, в зависимости от размера книги и наличия иллюстраций. То есть вполне сравнимо с текстовой версией, а времени занимает - всего часа 2 - 5 на книгу (со сканированием, конвертацией и выкладыванием в сеть)! Представь, сколько книг может сделать один энтузиаст, и сколько людей будут благодарны!
Для djvu дам пару советов:
- перед конвертацией очень желательно увеличить размер страниц до минимум 400 dpi (это можно сделать в пакетном режиме в редакторе, просмотрщике или спец утилитой) - это не даст появится ошибкам и/н и т.п. (даже если книга была отсканирована в 300 dpi, не страшно - нужно просто увеличить изображения).
- страницы с многоцветными или серыми иллюстрациями лучше делать в djvu Photo режиме, или указывать при конвертации разрешение "150 dpi" для меньших искажений (djvu книгу можно собирать из отдельных страниц или кусков).

Надеюсь, что мысль в начале сделает тебя счастливее как сканировщика (не будешь мучиться комплексом незавершенной работы и отсканируешь-выложишь все книги, которые у тебя в планах очень быстро, а параллельно, потихоньку будешь распознавать и делать fb2).

zenopz написал:

Ты очень неправ, что оставляешь на потом сканирование книг только из-за того, что нет времени на вычитку.
Отсканируй и выложи в сеть, а распознавать и вычитывать будешь потом, так сказать версия номер 2 - в rtf/fb2/doc/txt
А версия номер 1 - djvu/pdf

По ряду причинных обстоятельств я зачастую даже книгу сканю и распознаю по кускам - доступ к сканеру бывает ограничен. А потом есть у меня такое извращенное желание сделать самому книгу от начала до конца. Чтобы она радовала не только людей, но и меня. "Хочешь сделать хорошо - сделай сам." А то я тут уже имел пример, - сделал книжку (китайскую) с обложкой 200х300, там миниатюрка была такая неплохая. Так тут же нашелся некто, пережал обложку до размера почтовой марки и перевыложил более ничего не меняя. Сэкономил весу 70 кило, а книжку, с моей точки зрения, подпортил. Я берусь за книги, которые мне, мягко говоря, не безразличны. Вылизываю их очень тщательно. И делать я их хочу сам, так, как мне нравится и гарантируя качество конечного продукта. Это не свежая Донцова или 37-я длинная рука, я очень старенькие книжки делаю. Чуток можно и подождать.

Вот такой я злобный и занудный черт.

WBR, Борис

BorisJ написал:
По ряду причинных обстоятельств я зачастую даже книгу сканю и распознаю по кускам - доступ к сканеру бывает ограничен.

Тогда тем более имеет смысл постараться не дробить работу, а отсканировать как можно больше за раз.
А это в результате значит, что сканы книг будут лежать на диске готовенькие и ждать очереди -> значит их можно конвертировать в djvu и поделиться, пока очередь до распознавания этих сканов дойдет.

BorisJ написал:
А то я тут уже имел пример, - сделал книжку (китайскую) с обложкой 200х300, там миниатюрка была такая неплохая. Так тут же нашелся некто, пережал обложку до размера почтовой марки и перевыложил более ничего не меняя. Сэкономил весу 70 кило, а книжку, с моей точки зрения, подпортил.

Этого никак не избежать. Модифицируют и ужимают и doc/rtf, и djvu, и pdf. Можно писать обращение на обложке с просьбой не модифицировать, но запретить это никак не получится... Так что нужно принять это как данное, хочется или нет... :-(

BorisJ написал:
Чуток можно и подождать.

Конечно можно. Но лучше, чем сверстанная бумажная книжка все равно скорее всего не выйдет. Правда для КПК лучше TXT, конечно, но, imho, нужно и графическую копию книги заливать - это же "оригинал", так сказать, для истории и сверки ( в хорошем качестве, само-собой).
И тут меня больше всего мучает то, что распознавание - длительный процесс, занимающий много времени и жизненных сил. Главное - он тормозит очередь сканирования. Из-за этого очень много книг никогда не дождется, чтобы их отсканировали... Поэтому я пришел к выводу, что процесс распознавания не должен мешать процессу выкладывания книг, пусть в начале в виде графических сканов. Многие люди не умеют/не имеют возможности сканировать - они могут взяться за распознавание наиболее необходимых книг. А самые важные можно и самим распозновать потихоньку.

BorisJ написал:
Вот такой я злобный и занудный черт.

Да ладно, ;-) злобные да занудные и не подумают с другими чем-то делиться, а это противоречит тому, чем ты занимаешься.

zenopz написал:
сканы книг будут лежать на диске готовенькие и ждать очереди -> значит их можно конвертировать в djvu и поделиться, пока очередь до распознавания этих сканов дойдет.
Хм. Я пробовал - не получается: скан мало-мальски приличной книги в 300 dpi 256 серого - это более-менее гиг. В "дежа-вю" перекрутить - конечно, раз в полста уменьшится, но потом OCR'ить ч/б скан вместо серого - куда хуже. :-(
Пока делаю так: сканю "про запас" файн-ридером (несколько часов на книгу), на скорую руку OCR'ю "на автомате" (полчаса-час) и в таком виде проект архивирую и на компакт-диск. Потом, когда появляется время, место или настроение, разворачиваю и продолжаю обработку. Недостаток: почти нереально отдать скан кому-то через инет из-за объёма.
А какие ещё есть способы?

Перегнать в JPG 60%, запаковать и на файлообменник. В проэктах FR сканы хранятся в несжатых TIF, поэтому размер пакетов зашкаливает для серых за гиг. А так 1-2 метра на разворот хоть в сером, хоть в цветном. Правда при обработке SkanTalosov проблема вылезает - при конвертации в 600 dpi размер файла страницы под и за 50 метров.
Некоторые книги прилично выглядят при сканировании в ч\б 600 dpi.

Рыжий Тигра написал:

Пока делаю так: сканю "про запас" файн-ридером (несколько часов на книгу), на скорую руку OCR'ю "на автомате" (полчаса-час) и в таком виде проект архивирую и на компакт-диск. Потом, когда появляется время, место или настроение, разворачиваю и продолжаю обработку. Недостаток: почти нереально отдать скан кому-то через инет из-за объёма.
А какие ещё есть способы?

Загоняй в pdf.
30-50-80 метровые файлы гораздо проще передать, чем 500-1000 мб )
В ФР выделяешь все страницы, говоришь сохранить изображения, указываешь куда. Всего делов.
Сканить все в грей опять же не обязательно.
Книги без иллюстраций вообще бессмысленно в грэй сканить обычно.
А где иллюстраций не много - только нужные страницы в грей и сканить, ФР умеет выборочно в любой момент менять установки скана для разных страниц.

TaKir написал:
Загоняй в pdf.
С pdf'ом вообще получается бардак, пробовал дважды - часть страниц серые, часть ч/б, закономерности не уловил. :(
TaKir написал:
В ФР выделяешь все страницы, говоришь сохранить изображения, указываешь куда. Всего делов.
Гы. Просто. Не сообразил. Сенькс!
TaKir написал:
Книги без иллюстраций вообще бессмысленно в грэй сканить обычно.
Очень даже осмысленно: игрался на днях с "Островом Русь-2", бумажка тоненькая, буковки серенькие... а файн-ридеру велел сохранять в ч/б (чтобы сэкономить место на винте), потом задолбался отличать запятые от точек. :( Плюнул и начал по новой - уже в сером: совсем другое дело! :)
TaKir написал:
А где иллюстраций не много - только нужные страницы в грей и сканить
Ага. Я картинки сканировал другой прогой - FastStone Image Viewer, не знал, как из файн-ридерного проекта получить картинки. Теперь знаю. :)
Хотя... есть ещё один аспект: автодоворот страницы, чтгобы строки были горизонтальными - его ж тоже на иллюстрациях придётся выключать?
PS. Сканер HP-2410, родной софт и сканирование неродным софтом через интерфейс сканера чудовищно неудобны. Не подскажешь софтинку для удобного "однокнопочного" или "бескнопочного" сканирования картинок в последовательный набор файлов - типа "раз настроил и все рисунки сосканил"?

Рыжий Тигра написал:
Очень даже осмысленно: игрался на днях с "Островом Русь-2", бумажка тоненькая, буковки серенькие... а файн-ридеру велел сохранять в ч/б (чтобы сэкономить место на винте), потом задолбался отличать запятые от точек. :( Плюнул и начал по новой - уже в сером: совсем другое дело! :)

Бывает, кто бы спорил.
Но по собственному опыту - очень не часто.
В сомнительных случаях надо проверять качество на паре-тройке разворотов )

Рыжий Тигра написал:
Не подскажешь софтинку для удобного "однокнопочного" или "бескнопочного" сканирования картинок в последовательный набор файлов - типа "раз настроил и все рисунки сосканил"?

Чем же тебе ФР не угодил?
Скань пакетно рисунки в отдельный пакет, с любыми нужными настройками ) Только успевай листать ))
Как из ФР вынуть картинки ты теперь знаешь )

TaKir написал:
Рыжий Тигра написал:
потом задолбался отличать запятые от точек. :(
В сомнительных случаях надо проверять качество на паре-тройке разворотов )
Так там же ж странички были разные - некоторые хорошо пропечатаны, а некоторые настолько блёклые, что аж проступает текст на обороте. :(
Теперь буду умнее - FR'у буду скармливать только grey: скорость скана та же, а глюков меньше.
TaKir написал:
Рыжий Тигра написал:
софтинку для удобного "однокнопочного" или "бескнопочного" сканирования

Чем же тебе ФР не угодил?
Да всё время забываю перед обработкой картинки отключить автокомпенсацию перекоса страницы, а после неё - включить обратно. :-( А так всё ОК.
Кстати, делись опытом: насколько хуже FR работает, если автокомпенсацию отключить вовсе?

Рыжий Тигра написал:
Так там же ж странички были разные - некоторые хорошо пропечатаны, а некоторые настолько блёклые, что аж проступает текст на обороте. :(

Подкладывай черные листочки сзади сканируемых страниц ) Особенно при скане картинок и плохой бумаге.
Я тонкий черный пластик от офисных папочек использую.
(типа такого: http://www.mamtd.ru/files/antikrizis/r150big.jpg)

И яркость скана поменяй, если бледные страницы - тогда все ок будет. ))

Рыжий Тигра написал:

Да всё время забываю перед обработкой картинки отключить автокомпенсацию перекоса страницы, а после неё - включить обратно. :-( А так всё ОК.

Скань картинки отдельно ) После скана всей книги.
В этот же или в отдельный пакет. С нужными настройками. Быстрее будет.

Рыжий Тигра написал:
Кстати, делись опытом: насколько хуже FR работает, если автокомпенсацию отключить вовсе?

Зависит от кривизны, но не очень сильно хуже.

ПОМОЛИТЬСЯ НЕ ЗАБУДТЕ.

TaKir, сенькс за все подсказки!

Цитата:
Хм. Я пробовал - не получается: скан мало-мальски приличной книги в 300 dpi 256 серого - это более-менее гиг. В "дежа-вю" перекрутить - конечно, раз в полста уменьшится, но потом OCR'ить ч/б скан вместо серого - куда хуже. :-(

Ты не понял. Я говорю о том, что пока сканы ждут распознавания, стоит выложить отсканированную книгу в Интернет (в каком виде - дело десятое, главное, чтобы она стала доступна другим пусть даже в виде картинок; а так - хоть в JPEG, хоть в Djvu, хоть в PDF, хоть в Jpeg2, не в этом суть). Разумеется, тебе более будут благодарны за более компактный вариант (а DjVu самый компактный, если не использвать его Photo режим, иначе Djvu Photo сравним с Jpeg2 и новым PDF по размеру - т.к. в них используются схожие технологии).

Не советую ужимать Jpeg до 60%, т.к. уменьшение несущественное, но возникают такие сильные артефакты, что может быть даже просто уменьшение разрешения будет эффективнее. Оптимальная цифра для Jpeg - 95%. Но я лично сканы сохраняю в TIFF, сжатый по LZW, а Файнридером не сканирую, а если перевожу в Jpeg, то стараюсь 100% или 98%, но никогда не ниже 90%. Все-таки это raw-образцы, их не стоит портить.

Сканировать в черно-белом, как тут предлагают, очень нежелательно, а при 300dpi - ни в коем случае нельзя! Такая книга потом только для распознавания, но не годится для хранения сканов или выкладывания в djvu/pdf. Скорость сканирования на 300 dpi не зависит от цветности, но серый скан можно увеличить, а моно-скан - это как сканирование при сером 100dpi с последующим увеличением до 300 и конвертацией в черно-белый. Книги, отсканированные в монохроме и выложенные потом в djvu - это мусор, их читать невозможно.

zenopz написал:
Ты не понял. Я говорю о том, что пока сканы ждут распознавания, стоит выложить отсканированную книгу в Интернет (в каком виде - дело десятое
[...]
Сканировать в черно-белом, как тут предлагают, очень нежелательно, а при 300dpi - ни в коем случае нельзя! [...] Книги, отсканированные в монохроме и выложенные потом в djvu - это мусор, их читать невозможно.
Я таки не понял: зачем выкладывать в сеть ч/б 300dpi djvu, если он потом ни на что не годится?

Цитата:
Я таки не понял: зачем выкладывать в сеть ч/б 300dpi djvu, если он потом ни на что не годится?

А вот выкладывают... Даже 150 dpi...
Что касается зачем выкладывать сканы (конечно, в приличном dpi) - один человек не способен распознать столько книг, сколько может насканировать. Поэтому часть книг останется недоступна другим - меняются обстоятельста, настроение и т.п., и сканы остаются похороненными в архивах. В то же время эти сканы давно могли бы уже быть распознаны и вычитаны с помощью добровольных помошников-читателей. А даже если и не распознаны, то и в таком виде уже давно бы приносили пользу заинтересованным в них людям...

Цитата:
Вылизываю их очень тщательно. И делать я их хочу сам, так, как мне нравится и гарантируя качество конечного продукта. <...> Вот такой я злобный и занудный черт.

Побольше бы таких чертей. Когда берешь почитать книгу, а там куча ошибок из-за того, что оцифровщик не сделал вычитку - просто зло берет. Книга откладывается в сторону. В общем, Борису респект.

Уважаемый Lord KiRon. Книжку отсканили, Вахмурка довёл до фб2. Что ж у нас-то её нет. Это я про Ластбадера, серия: Жемчужина, Вуаль тысячи слёз.

Где "у нас"?
Тут? Ну так залейте сами http://oldmaglib.com/feedback/feedback.php?id=2694 , дело секундное, вообще обычно кто то, кажется Igorek67 но не уверен, все время перетаскивает книги сюда, может зевнули.
Кстати спасибо вам за работу.

Вообще удивляюсь я народом, я пытаюсь организовать работу над книгами, для всех собственно, а тут же возникают какие то подозрения, претензии и т.д. ...
Вообще почему именно "Старый Чародей" - да не почему, просто у них оно наиболее удобно на данный момент организовано а начинать новое на пустом месте - только дробить силы.

Тут на Либрусеке. Заливаю. Только изменил название серии - на Олдмаге - англ. вариант, здесь - Жемчужина. Первая книга в этом названии серии лежит. Если не понравится - поменяю для всей этой серии.

Цитата:
Вообще удивляюсь я народом...
Не ко мне, наверное. Лично мне "Старый Чародей" - сильно нравится.
Цитата:
Кстати спасибо вам за работу.
Спасибо за оценку.

Вопрос в том что есть библиотеки, они разные, плохие, хорошие, удобные, не очень, платные, бесплатные, с подпорченной репутацией ;) и т.д. Однако они именно библиотеки а нам нужно что то вроде "переплетной мастерской" или (не услышь меня Литрес) "издательства" чтобы книги могли попадать в эти самые библиотеки, и это совсем не одно и то же.

Нет, не я перетаскиваю.

Про Ластбадера.
Я конечно прошу прощения, но книга добавлена ещё : 25.10.2009.
Upd. Сорри, не понял что Либрусек. :-)

И вообще, библиотека с некоторых пор не зациклена на жанрах. Да, основным является фантастика. С моментам скана мной всего Квина и всего Карра стало много классических детективов, мистика и пррключения благодаря никси тоже вырываются на первые позиции. Были бы вычитывальщики, можно было бы говорить о более широком спектре. Но пока их не хватает.

Про сроки - для фантастики никаких ажурных оформлений обычно не надо и затягивание вычитки на месяц я считаю немного некорректным. Да, книга может не понравиться. Но вычитывальщик должен в первую очередь вычитыавать, а не читать. И понимать это при "поднимании руки" всё же необходимо.

Aldio написал:
затягивание вычитки на месяц я считаю немного некорректным. Да, книга может не понравиться. Но вычитывальщик должен в первую очередь вычитыавать, а не читать.
Хм. А что, есть такие, кто читает медленнее, чем вычитывает?

Рыжий Тигра написал:
Aldio написал:
затягивание вычитки на месяц я считаю немного некорректным. Да, книга может не понравиться. Но вычитывальщик должен в первую очередь вычитыавать, а не читать.
Хм. А что, есть такие, кто читает медленнее, чем вычитывает?

Есть те, кто если книжка не нравится читают/вычитывают её месяцами. Она ж не нравится. Психологически я это вполне понимаю. Но... Неправильно это. Проще вернуть тогда. Другие возьмут.

И всё-то вокруг фантастики... А то, что есть другая литература, об этом почему-то забывается.

Там вообще то 4 направления: фантастика, фэнтази, детективы и приключения; иногда еще исторические и детские. Согласен не самый полный набор но все же на чистая ф/ф.

Вообще тут какой еще момент, возможно я упустил его в начальном посте - я не призываю переходить на "Старого Чародея" читателей для них есть Либрусек, Флибуста и прочие, "Старый Чародей" это в первую очередь библиотека созданная теми кто конвертирует книги. Соответственно удобна она в первую очередь не читателям (им то лучше здесь) а тем кто "работает" над книгами. Это ведь не просто место где берутся книги ето место где встречаются люди с определенными знаниями и определенным кругом интересов завязанным на оцифровке книг. Там вам могут помочь, там вы можете разделить с кем то работу, пообщатся, не как читател а именно как оцифровщик.
Понятно этим можно заняться и тут, но ваш вопрос или запрос скорее всего пропадет среди тысяч других обсуждений на миллион разных тем, а там люди занимаются именно оцифровкой.
Не думаю что это была изначальная цель Чародея но так уж сложилось и грез это не использовать.
Кстати это же относится и к вопросу о жанрах - не важно какие именно жанры собирает Чародей, это для читателей, для оцифровщиков это же место встречи и обмена и по этому можно договорится о любом жанре а выложить потом куда угодно.

publ.lib.ru - Библиотека Ершова - много книг в очень хороших doc, html, djvu
Часто одна книга в нескольких форматах выбирай на вкус.
Например:
(http://publ.lib.ru/ARCHIVES/D/DUROV_Vladimir_Leonidovich/_Durov_V._L..html)
Частенько оттуда книги конвертировал.

Разделы разные - от детской до научки. Не олдмаглибом, единым, как говорится.

Сам могу желающим подкинуть и на распознавание, и на вычитку.
Штук 100 книг в ближайшей очереди на скан.

TaKir написал:

Сам могу желающим подкинуть и на распознавание, и на вычитку.
Штук 100 книг в ближайшей очереди на скан.

Если можете, скиньте список в личку, когда время найдется.

господа, вы бы выложили краткое руководство для юных сканировщиков:) к примеру у меня есть сканер, есть энное количество книг, которых нет в сети, но
1) отвратительная программа распознавания текста (хотя может это у меня руки кривые),
2) я не понимаю разницы межу doc и rtf
3) не умею делать fb2 (впрочем, где-то просили не делать, если не умеете)
4) не умею делать pdf
да, это мои личные проблемы, но если сделать небольшую памятку с пошаговой инструкцией сканов было бы больше - моих по крайней мере. потому что сейчас 80% книги приходится перепечатывать вручную.

Тады вам в сканировщики :)
Попросту говоря сканируете в 300DPI (или больше но обычно не нужно) greyscale и результат посылаете через какой ни будь файлообменник админу "Старого Чародея" (в смысле линк) - он выложит название на сайте и кто то желающий сделает из этого DOC а затем он же (или другой) FB2. Так оно и работает.
Ну а захотите научится оцифровывать объясним потихоньку ;)

Посмотрите инструкцию, которую aldio написал:
http://bomanuar.com/forum/index.php?topic=233.0
Может найдете часть ответов.

А у вас сканер в пдф не сохраняет?

А у вас сканер в пдф не сохраняет?

А в pdf - это, пожалуй, лишнее. Во-первых, не сканер пишет в PDF, а его софт; во-вторых, не факт, что при сохранении в PDF не снижается разрешающая способность, количество градаций серого и т.д. (а поставляемое со сканерами ПО, как правило, не имеет настроек, влияющих на эти параметры). Т.о., в общем случае, "автоматический" PDF менее пригоден для OCR, чем сырые необработанные сканы.

нет, сохраняет в tif, оттуда можно копипэйстом перекинуть в ворд. только потом большую часть текста придется перепечатывать вручную - нечитаемый набор букв. где-то 1\3 - 1\4 текста получается нормальной - нужна лишь лёгкая правка.

То ли я чего то не понял то ли полный бред :) Если не бред то пришлите мне пожалуйста свой копипэйст вынимающий буквы из TIFF-a - я даже готов заплатить :)

Lord KiRon написал:
пришлите мне пожалуйста свой копипэйст вынимающий буквы из TIFF-a - я даже готов заплатить :)

Осчусчение дежавю, однако )
Мне один мутный гражданин год или больше назад тут в каком-то топике про скан долго втирал что-то подобное - типа программе пофиг, что там на отсканенной картинке, она сама во всем разберется. (Топик был про распознавание какого-то жуткого качества дежавю - "Тайна болотных демонов" вроде бы).
Я тоже готов был заплатить за мастер-класс ))

TaKir написал:
Я тоже готов был заплатить за мастер-класс ))

Элементарно, Ватсон.
Ворд замечательно принимает картинки через копи-паст.

Страницы

X