Вы здесьУ меня есть книга, которой нет в интернете!!
Опубликовано ср, 28/05/2008 - 08:45 пользователем soshial
Появилась идея создать группу людей, которые будт обмениваться неэлектронными книгами, которых нет на Либрусеке и, возможно, сканировать их. Тем у кого есть книги, которых нет на Либрусеке и тем, кто хочет взять себе книгу отсканировать – отписывайтесь здесь. Также, всем настоятельно рекомендую ознакомиться с понятием слова буккроссинг здесь. Или в этой цитате: wikipedia написал: Буккро́ссинг (англ. bookcrossing, иногда «книговорот») — хобби и общественное движение, действующее по принципу социальных сетей и близкое к флешмобу.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Aleks_Sim RE:Прошу переформатировать, распознать, etc... 59 мин.
sem14 RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 2 часа MrMansur RE:Жорж Санд - переводы 19 века 3 часа Саша из Киева RE:Наш дом - СССР 19 часов DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 12 часов babajga RE:Чернушка. Повести 1 день Саша из Киева RE:Сказки далёких островов 3 дня babajga RE:Лопоухий бес 4 дня kopak RE:Таинственная личность админа Флибусты 5 дней babajga RE:Ежик покидает дом 6 дней babajga RE:Сказки бабушки Черепахи 6 дней babajga RE:Свист диких крыльев 6 дней Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 неделя Саша из Киева RE:Турецкие мусорщики в Анкаре открыли библиотеку, полную... 1 неделя Isais RE:Не тот автор 2 недели xieergai60 RE:Продление подписки 3 недели TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 3 недели Isais RE:Древняя Греция. Читаем... 3 недели Впечатления о книгах
miri.ness_ про Еще не поздно
25 12 Двоякое впечатление. У автора, возможно, в родственниках или их друзей есть взрослые люди, крепко обиженные Ангстремом. Но много знающие про электронику и микроэлектронику тех лет - отсюда и довольно глубокие познания, правда ………
decim про Овалов: Демон революции. Жизнь и приключения Розалии Землячки (Биографии и Мемуары)
25 12 Рерайтинг имеющейся здесь же книги Овалова "Январские ночи", снабжённый манким заголовком. Оценка: хорошо
lorealke про Матвеев: Ниочёма-3 [СИ] (Юмор: прочее, Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
24 12 Автор постоянно долбит про злобную Европу и обижаемую Империю, да царя-батюшку. Читаешь и прямо физически ощущаешь, как тебе промывают мозги. Короче, вместо нормальной бояръаниме получилась какая-то полу-пропагандистская херня. Оценка: плохо
дядя_Андрей про Костин: О чём молчал Атос (Критика, Литературоведение, Самиздат, сетевая литература)
23 12 Karl-Ieronim, конечно же "Последний кольценосец" Еськова
Олег Макаров. про Николай Владимирович Беляев (самиздат)
23 12 Серия «Серебряная осень» Качественно, интересно
Саша из Киева про Краминов: В орбите войны [записки советского корреспондента за рубежом, 1939-1945 годы] (Биографии и Мемуары)
23 12 Огромное спасибо всем, кто сделал и добавил эту книгу!
Лысенко Владимир Андреевич про Емельянов: Японская война 1904. Книга 2 (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
23 12 Серия очень понравилась, прочитал не отрываясь. Буду ждать продолжения. Оценка: отлично!
Саша из Киева про Даниил Фёдорович Краминов
23 12 На Флибусте есть книга Даниила Краминова "В орбите войны. Записки советского корреспондента за рубежом. 1939-1945 годы". Надо бы добавить её сюда. Я попробовал добавить - почему-то не получилось. А книга интересная. Я читал ………
miri.ness_ про Забелин: Домашний быт русских цариц в XVI и XVII столетиях [Литрес] (История)
22 12 Книга отличная, только один минус - издано в 1869 г. в серии Non-Fiction. Большие книги
alexk про Флинн: В стране слепых [litres] [In the Country of the Blind ru] (Социальная фантастика, Научная фантастика)
22 12 На первый взгляд, литресный перевод похуже перевода 95-го года.
Fori про Панов: Пре(восход)ство [СИ litres] (Киберпанк, Социальная фантастика, Самиздат, сетевая литература)
22 12 Зачем выкладывать ознакомительные огрызки Литреса? |
Комментарии
Re: Проект №2: (bookcrossing/OCR)
у меня есть пара книг, которых нигде нет:
1.
Ларс Кристенсен. Полубрат (норвежская проза)(сделано)2. Чинуа Ачебе. Стрела бога (африканская проза)
3. Мария Елиферова. Смерть автора (филологический триллер)
Re: Проект №2: (bookcrossing/OCR)
Есть Ларри Мэддок "Агентство ТЕРРА". Нет сканера :-(
Отв: Re: Проект №2: (bookcrossing/OCR)
Есть "Агенство Терра" и "Терра против империи". Могу отсканировать, распознать с fb2 не знаю, я тут ровно без году неделя. Кто дает отмашку на начало работы, чтобы не повторяться?
Отв: Re: Проект №2: (bookcrossing/OCR)
Никто. :)
Просмотрите и отпишитесь в этой теме - это максимум "гарантий". ;)
Если не хотите/можете конвертировать в fb2, выложите куда-нибудь скан. Кто-нибудь сделает. :)
Re: Проект №2: (bookcrossing/OCR)
Хавьер Мариас "Белое сердце". Нет сканера. Могу потом распознать и вычитать. Киев
Re: Проект №2: (bookcrossing/OCR)
Это интересное предложение вызывает только один вопрос. У нескольких писавших аргумент - нет сканера. В настоящее время мюстековский сканер Scan Express (более чем пригодный для OCR ;) стоит в районе $40. А сколько стоит пересылка по почте книги? А нескольких книг? Т.е. в таком случае, не проще купить сканер, если нет других препятствий? Или даже взять его на день-другой там, где он есть? Или прямо там и отсканировать? Поймите меня правильно, я просто удивлен, что в наше время это может быть проблемой. Вот отсутствие времени, скажем - это серьезнее.
Re: Проект №2: (bookcrossing/OCR)
сканер то есть, но сказать, что в этом опытен (для оцифровки книг), не могу, к тому же для меня время - основная причина создания темы))
Re: Проект №2: (bookcrossing/OCR)
Угу... Насчет времени - таки да... Та же проблема. А вот насчет опыта - а какой тут опыт нужен? Нужен сканер и файнридер (свободных, в том числе портэйбл-версий - море в Сети ;). После чего техника сканирования осваивается даже не за 5 минут, а просто по ходу работы ;).
Re: Проект №2: (bookcrossing/OCR)
Re: Проект №2: (bookcrossing/OCR)
Нет, туда нельзя! За ссылками активно охотятся и удаляют, это вам не хухры-мухры, а факн-ридер! ;) Вот одна из возможных ссылок, проверил, файл еще лежит, но полностью, конечно, не скачивал. Хотя пользуюсь версией из того же поста, но скачанной с другой ссылки, уже умершей :(. Версия работает без установки. Обратите внимание на пароль к архиву! Просьба не писать открыто имя программы, иначе ссылка сдохнет сразу же... Лучше в личку, если кому надо, давайте ссылку. Или перекладывайте куда-то.
Portable A-B-BBB-Y-Y F-i-kn-e-R-e-a-d-e-r 8.0.0.731 rus & enu
password:nnm.ru
Download http://rs182.rapidshare.com/files/67548469/FuckRussianShit_.rar
Кстати, живой пример, что такое факнридер. Только сегодня появилась ссылка на 9-ю версию (кстати, классная вещь, позволяет даже загружать pdf для распознавания), и вот результат (рапида):
Re: Проект №2: (bookcrossing/OCR)
Спасибо, скачал, авось пригодится.
На сайтах, выкладывающих линки на кино, такое бывает сплошь и рядом. Считается, что это работа платных сотрудников компаний, борющихся против распространения, чуть ли не самих киностудий. А что такое "Русский щит"?
Re: Проект №2: (bookcrossing/OCR)
Русский щит - это специальная компания, борющаяся с варезом в Сети по заданию (платному, конечно) компаний-производителей софта. Абби, в частности - ее весьма известный клиент. Правда, все это работает весьма избирательно. Например, одна и та же ссылка может быть срочно удалена с Рапиды, и неделями лежать на Депозите. Ну, это их дело. Можно лишь констатировать, что компании-производители софта зря тратят деньги на Щит, лучше бы софт удешевляли ;). А вы обратили внимание на имя файла для закачки? FuckRussianShit_.rar ;D
Re: Проект №2: (bookcrossing/OCR)
хаха))
lol)
Re: Проект №2: (bookcrossing/OCR)
Ага, понятно, спасибо. Я и не знал что уже есть такие российские компании. (и мимолетно позавидовал - вот работенка не бей лежачего!)
Насколько я понимаю, Рапида просто быстрее (практически мгновенно, в автоматическом режиме) реагирует на абьюз-жалобы. Ну и с Рапиды качают, конечно, больше, чем со всех остальных вместе взятых, так что она цель номер один.
Еще как обратил! Хорошо хоть мой корпоративный фильтр не обратил... ;-)
Re: Проект №2: (bookcrossing/OCR)
ребят, давайте все-таки обмен книгами обсуждать, м?
Re: Проект №2: (bookcrossing/OCR)
Да ну, не все так печально. На http://rapidlinks.ru/ поиском за пару секунд найдется с десяток программ АББИ - вполне рабочих. Та 9 версия, что я скачивал, с марта еще лежит, и ничего, не удаляют.
Re: Проект №2: (bookcrossing/OCR)
Для начала можно поюзать бесплатный CuneiForm. Основной его недостаток - не работает пакетно, приходится распознавать постранично и дописывать в файл. Но в целом неплох.
(чешет репу) ...где-то у меня была подборка мануалов по технике сканерёжки. Найти, да и вывесить... Авось пригодится кому.
Re: Проект №2: (bookcrossing/OCR)
Кунеформ - ацтой тот еще :(. Не тратьте на него время, плз! Файнридер лучше не на порядок, а даже сравнивать не с чем. Кунеформ по сравнению с ним - просто пустое место ;).
Материалы по технике сканирования - дело, может, и нужное, но, ИМХО, никакой техники-то и нет. Чесслово, не знаю, чему там учиться - режим LineArt, разрешение 300, и вперед! Можно, если нужны картинки, и режим серый или цветной использовать, файнридер последних версий позволяет, но идет куда медленнее. Вопрос же создания из сканов файлов книг - совсем другое дело, тут масса вариантов и форматов - дежаву, пдф, фб2 и прочее... В этом я, например, не копенгаген ;). Т.е. делал, конечно, но профессионалы настолько же выше меня, как файнридер - кунеформа ;D. А само сканирование требует, ИМХО, только одной науки - терпения :). Что да, то да! Терпение и свободное время, Ватсон - вот и все, что нам потребуется! - (С) - Конан Дойл. Сканирование 1 страницы даже на самом лучшем сканере отнимает не менее 30 сек, и через 100 страниц превращаешься в автомат по сканированию. Кошмар! Кто не пробовал, не представляет :(.
Re: Проект №2: (bookcrossing/OCR)
Да ладно народ-то пугать! )
400-500 страниц книга за 3 часа сканится легко. Только успевай листать, это точно - на автомате.
Сканер простецкий трехлетний епсон.
Re: Проект №2: (bookcrossing/OCR)
Ну, если это легко - флаг в руки! Но я не выдерживаю за сканером больше часа :(.
Re: Проект №2: (bookcrossing/OCR)
Э-э...5 минут вы это загнули. Хардкорным "клавишникам" это конечно не проблема, но все-таки заметная часть посетителей-потенциальных сканировщиков ими не является.
Могу добавить, что часто проблема еще состоит в особенностях книги. Например, у меня есть 3 тома "Материальной цивилизации" Броделя, которой в цифре я нигде не видел, хотя она и заслуживает этого. Но раскачаться на сканирование я не надеюсь. Там тонны графиков/картинок и прочих нехороших вещей. И если сделать из нее пдф/дежавю еще возможно, то цивилизованные хтмл/фб2 - "заибёсся". Про полную вычитку я даже не вспоминаю. Ну и общий объем тоже роль играет - под 2к страниц получается.
Re: Проект №2: (bookcrossing/OCR)
Вот ссылка про сканирование/распознавание.
_ttp://militera.lib.ru/ocr/01.html
Читать первые две страницы. Остальные (про ворд, макросы и т.д.) читать по желанию.
Re: Проект №2: (bookcrossing/OCR)
У меня на столе 2 компьютера умещаются. И сверху принтер. Сканер поставить некуда. :-)
Правильно ли я отсканил эту страницу???
вот пжалста сслыка: http://ifolder.ru/6856930
сканировал в оттенки серого/dpi 300/16 bit.
Re: Правильно ли я отсканил эту страницу???
16 бит нигде нафиг не надо. Ни в сером, ни в цветном. 8 ставь.
Re: Правильно ли я отсканил эту страницу???
ты сам файл смотрел??
а как бороться с тем, что посередине? или ocr скушает??
Re: Правильно ли я отсканил эту страницу???
Глянул. Херовато все.
1) Прижимать сильнее надо, книжку слегка развернуть на столе можно, чтобы легче раскрывалась. Окр не справится. Всего плохо все будет в середине.
2) Если просвечивают буквы с обратной стороны - подкладывать черную бумагу (на принтере можно распечатать).
(Я купил в канцтоварах несколько тоненьких пластиковых папок рублей по 10, у которых задняя часть из черного тонкого пластика. Нарезал этот пластик под размер типичных форматов страниц - вечная штука получилась.)
3) Если нет картинок в книге, то режим rgb (цветной) нафиг не нужен, достаточно чистого чб или грэй, 300 точек.
Re: Правильно ли я отсканил эту страницу???
Проблема на сгибе. Если корешок книги прочный, то можно прижать именно его к стеклу сканера. Края лучше не сканировать -- сразу обрезать во время сканирования.
Сохраняться лучше в тифе. 17 мбайт на страницу --многовато.
Количество точек лучше выбирать в зависимости от размера шрифта. Если страница примечаний со газетным шрифтом, то ч/б 300 точек мало, имхо.
P.S. Во время сканирования книжка не должна перемещаться по стеклу. Руки придётся потренировать.
Re: Правильно ли я отсканил эту страницу???
короче, резюмирую:
1. прижимать сильнее чтоб не смазывалась
2. избавиться от просвечивания
3. grey 300 dpi 8 bit tiff
4. обрезать края
5. не двигать рукой
okey, спасибо, а есть такие кто мог бы распознать отсканенную книгу?
ps. как ее засунуть в один файл кстати?))
Re: ДежаВю
После сканера получаются .tiff-ы россыпью
Их надо перегнать в единый .djvu
Я предпочитаю пользоваться для сего старенькой DjVu Solo 3.1, но "возможны варианты". Читать про формат и скачивать нужный софт здесь: http://djvu-inf.narod.ru/
Дежавюшный файл, если он делался из тиффов разрешения 300dpi, неплохо разделяется на страницы и распознаётся.
UPD: Кстати, насчет проблем на сгибе...
http://djvu-soft.narod.ru/scan/curved_text.htm
Re: Правильно ли я отсканил эту страницу???
Для данной картинки:
В данном случае это не является проблемой, от которой надо избавляться.
Не всю книжку, а корешок. На картинке не только яркость меняется, но и резкость теряется. Судя по картинке, книжка очень толстая. 485 страница находится где-то в середине книги. Можно попробовать прижать корешок каким-либо стержнем, засунутым внутрь корешка. Там не нужны большие усилия. (Конечно же, учитываем состояние самой книги!)
Если корешок удастся прижать, то чб 400 dpi и, возможно, подобрать яркость сканера. В редакторе удаётся сделать контрастное изображение, значит, и сканеру можно объяснить. Если проблема корешка останется, то grey.
Нет такой необходимости. Если файлы, например, перенумерованы, то FR легко воспринимает пачку файлов на входе.
Зы. Для распознавания текст лучше в tiff, а не djvu
Re: Правильно ли я отсканил эту страницу???
Вот вариант отсканенного разворота, когда практически идеально распознается текст.
(бумага плохая, сильно желтая, книжка старая)
(файл 1,5 мега, жпег)
Re: Правильно ли я отсканил эту страницу???
Re: Правильно ли я отсканил эту страницу???
Идея хорошая, типа бук-тур )) (по аналогии с шоп-турами).
3-4 часа на 400-600 страниц - пару-тройку книг за дождливый день осилить можно )
Главное проверяй, не пропустил ли где страницы... А то при таки объемах сканежки можно пропустить - обидно потом будет...
И скань все - от корки до корки, пригодится )
Re: Правильно ли я отсканил эту страницу???
Re: Проект №2: (bookcrossing/OCR)
Вообще в библиотеке Ершова можно почитать про скан и распознавание.
Написано просто и по делу:
http://publ.lib.ru/publib.html
http://publ.lib.ru/OCR/_Ocr.html
Re: Проект №2: (bookcrossing/OCR)
А возьмется ли кто отсканировать вот эту книжку?
http://www.ozon.ru/context/detail/id/1595741/
Это сборник пьес Ю.М. Полякова. А я тогда, может, возьмусь ее OCR-ить и вычитывать...
Отсканированные книги
У меня есть некоторое количество отсканированной фантастики, ждущей вычитки и (около половины) распознавания.
В электронном виде не нашёл. Сканировал только те части сборников, которых нет в электронном виде.
Станислав Лем:
- "Моя жизнь" (автобиография)
Борис Хазанов:
- "Нагльфар в океане времён"
- "Чудотворец"
Виталий Бабенко (какая-то из книг издательства Текст, 1992 или около того):
- "Приблудяне"
- "Земля"
- "Авангардист"
- "Трудоустройство"
- "New-Москва"
- "Нечеловек-невидимка"
- "Феномен всадников"
- "Игоряша-робинзон"
- "Игры на Красной площади"
- "Холодильник"
- "Поражение"
Василий Головачёв:
- "Реквием машине времени" (оригинальная версия, ещё не переработанная в отстойный цикл)
Из сборника "Ночь, которая умирает":
- Доминик Дуэ "Кочезе из Северамы 10"
- Кодзи Танака "Погоня"
- Джозев Дилейни "Скачок мысли"
- Пьер Буль "Сколько весит сонет?"
- Герд Прокоп "Смерь "бессмертных""
- Доналд Уэстлейк "Смерть на астероиде"
- Радомир Клабал "Если вы такой умник, то скажите, где трупы?"
- Дж. Венс "Удар милосердия"
Из сборника "Компьютер по имени Джо":
- Рикардо Гарсиа Леон "Дарик"
- Джон Макинтош "Дело рук компьютера"
- Иржи Колафа-мл. "Обман"
- Любен Дилов "Очередной номер"
- Даина Чавини "Опять этот робот!"
- Гюнтер Теске "Талантливый футболист"
- Ульф Мальмгрен "Три желания"
- Герберт Франке "Управляемые на расстоянии"
Из сборника "Обратная связь":
- Филип К. Дик "Дублёр президента" (в сети лежит другой текст, так озаглавленный - это ошибка!)
- Карл-Хайнц Тушель "Экспертная система"
- Дж. Уодемс "Имитроника"
- Стен Драйер "Конец шпината"
- Грегори Бенфорд "Под Леннона"
- Джон Койн "Позвоните мне!"
- Джон Браннер и О. Генри "Затруднения с кредитом"
Вячеслав Крапивин:
- "Возвращение клипера "Кречет""
- "Мушкетёр и фея"
- "Ковёр-самолёт"
- "Сказки Севки Глущенко"
Из сборника "Лалангамена":
- Теодор Томас "Целитель"
Из сборника "Перпендикулярный мир":
- Анатолий Гланц "Блудный сын промышленности"
- Грегорий Николаев "Кроссворд"
- Михаил Кривич, Ольгерт Ольгин "Лунная ночь в двадцать первом веке"
- Авдей Каргин "Мы вам докажем, что нас нет"
- Николай Блохин "Настоящим направляю заявку..."
- Георгий Николаев "Восприимчивый"
Из сборника "Продаётся Япония":
- Саке Комацу "Да здравствуют предки"
- Синити Хоси "Корабль сокровищ"
- Таку Маюмура "Приказ о прекращении работ"
- Синити Хоси "Рационалист"
Филип Фармер:
- "Конец времён"
Из сборника "Фата-моргана":
- Гербен Хелинга-мл. "Чудо-цветок"
- Ллойд Дж. Бигл-мл. "Крылья песни"
Re: Отсканированные книги
cпасибо большое.
мы обязательно этим займемся!!
то, что надо просто вычитывать/конвертировать в fb2 - обращайтесь через личку к golma1
а то, что сканить можете пока обратиться к Polarnik, ща еще других соберу ocr'ить.
пока им напишите. вотъ. скоро отвечу о том, как дела: есть ли ресурсы.
Re: Отсканированные книги
Пообщался в личке и с golma1 и с Polarnik.
У меня внезапно не оказалось места, куда можно положить файлы.
Есть какой-нибудь ftp для заливки сырых файлов, предназначенных для дальнейшей обработки?
Re: Отсканированные книги
Чтобы держать статус в одном месте.
Прогнано через OCR, имеется в виде .txt и .rtf (картинки утрачены), требует вычитывания:
- Бабенко "Приблудяне"
Прогнано через OCR, имеется в виде .rtf и в виде картинок, требует вычитывания и конверсии. Качество OCR местами плохое из-за плохого переплёта книг.
- весь Бабенко, кроме "Приблудяне" и "Земля"
- Фармер
- Рассказы из сборника "Фата-Моргана"
- Лем
- Головачёв
Отсканировано, имеется в виде картинок:
- Бабенко "Земля"
- Рассказы из сборника "Компьютер по имени Джо", "Лалангамена", "Ночь, которая умирает", "Обратная связь", "Перпендикулярный мир", "Продаётся Япония",
- Крапивин
- Хазанов
Re: Проект №2: (bookcrossing/OCR)
Я ответила Вам в личке, предложила Рапиду.
Но вообще-то есть ftp Либрусека:
login: ocr
password: newbook
Правда, были какие-то сложности с местом. Не знаю подробностей.
Re: Проект №2: (bookcrossing/OCR)
ok, с этой частью разобрались, нашёл место.
с не-OCR-енными книжками - чуть позже.
Отв: Re: Проект №2: (bookcrossing/OCR)
Мдэ. Пока личка не работает - пишу сюда :)
Оставшиеся странички сфотографировал, выложил: http://artifact-master.com/pages/ - там их по четыре экземпляра каждой, на случай неудачной съёмки.
Отв: Re: Проект №2: (bookcrossing/OCR)
ОК. Спасибо. :)
Я всё скачала на свой комп. Можно удалять.
Re: Проект №2: (bookcrossing/OCR)
Ищу "Вчера будет война" (Сергей Буркатовский) http://www.ozon.ru/context/detail/id/3856135/
Заранее благодарен!
Отв: Проект №2: (bookcrossing/OCR)
наиболее быстро "сканирует" цифровой фотоаппарат. Единственный секрет выставленная вручную диафрагма и выдержка + освещение парой настольных ламп. ~ 5 секунд на страницу, причем большее время уходит на переворачивание :)
Отв: Проект №2: (bookcrossing/OCR)
а что за фотик ?
я баловался 6-мегапиксельной мыльницей fuji - результат так себе.
:)
Отв: Проект №2: (bookcrossing/OCR)
кенон, результат хороший только при отключении автомата и выставлении ручных настроек диафрагмы и выдержки.
Отв: Проект №2: (bookcrossing/OCR)
Тем у кого нет сканера.
А цифровым фотоаппаратом никто не пробовал?
Все пытаюсь создать электронный вариант: Большая книга драконов (Лора С. Айриш)
Но тут нюанс - там большие картинки, а fb2 под это дело не шибко заточен
Страницы