Скоро на "Либрусеке" (Наши планы)

Предлагаю здесь делиться нашими планами, что нового сейчас сканируется, какие книги ожидать в ближайшее время в библиотеке. Как только книга полностью сделана и выложена на Либрусеке, просьба сообщать в сответствующий топик.. Вы также можете помочь тем, кто ищет книги или поделиться книгами, которые ждут...

Курукин Игорь. "Повседневная жизнь тайной канцелярии."
Вайль Петр "Стихи про меня".

Ух, отлично. Читал "Ушли клоуны, пришли слезы" этого автора, очень понравилось. Если её в инете нет, возьмусь делать.

Отсканировал специально для Либрусека книгу Дугласа Престона и Линкольна Чайлда "Книга мертвых". Это завершающая книга серии "Пендергаст". Сижу вычитываю... Видимо потом все таки попытаюсь сам из Ворды а fb2 перевести - хочется в первый раз пройти полный путь. :)

Barson написал:
Отсканировал специально для Либрусека книгу Дугласа Престона и Линкольна Чайлда "Книга мертвых". Это завершающая книга серии "Пендергаст". Сижу вычитываю... Видимо потом все таки попытаюсь сам из Ворды а fb2 перевести - хочется в первый раз пройти полный путь. :)

Отлично! И удачи Вам!

Выложил первый том приключенческого романа В. Редера "Пещера Лейхтвейса".
Немного передохну, сделаю что-нибудь не слишком большое (на очереди - Жюль Верн "Цезарь Каскабель") и займусь вторым томом.

Такой вопрос - увидел вчера в книжном книгу Макса Фрая - Желтый ключ. Никто не собирается сканировать и помещать в библиотеку? Также там же видел новую книгу Стивена Кинга - Дьюма-Ки - такой же вопрос - никто не занимается ей? И последний вопрос - ребята я в последнее время стал замечать что Либрусек превращается в свалку - народ торопится понабить закрома библиотеки чем только может. Новые поступления превратились в многостраничный просмотр всякого отстоя. Может каждый для себя решит простой вопрос - хочу поместить в Либрусек только то, что очень оценил, что хотелось бы показать всем, может так лучше будет а?

меня тоже это смутило. и уже давно.
в итоге я перестал туда заглядывать. только по особым фильтрам иногда смотрю...

Соплеменники! Еще раз спрашиваю - кто нибудь занимается Стивеном Кингом "Дьюма-Ки" ? Пеняйте на себя или я сейчас сам все сделаю! :)

Barson написал:
Соплеменники! Еще раз спрашиваю - кто нибудь занимается Стивеном Кингом "Дьюма-Ки" ? Пеняйте на себя или я сейчас сам все сделаю! :)

Как Вы себе представляете? Каждый, кто НЕ делает, должен написать "нет"? ;)
Делайте. А мы Вам потом огромное спасибо скажем.

Обязательно делайте!

ух ты, какой позитивчик пошёл. =)

Ну все!!! Пеняйте на себя - начинаю!!! :) Отметьте в планах Стивн Кинг - "Дьюма-Ки" - СПЕЦИАЛЬНО для Либрусека!!!

Начал делать второй том "Пещеры Лехтвейса" В. Редера.

Друзья! Начал по немногу выкладывать - Библиотека советской фантастики (Изд-во Молодая гвардия).
ПРИСОЕДИНЯЙТЕСЬ:)

Igorek67 написал:
Друзья! Начал по немногу выкладывать - Библиотека советской фантастики (Изд-во Молодая гвардия).
ПРИСОЕДИНЯЙТЕСЬ:)

А исходники есть где в сети? Как присоединяться-то?
У меня в бумаге нету этой серии (

Есть у Ершова в Публичной библиотеке, но россыпью.

Распознайте кто-то пожалуйста "Антилузера" Илиаса Меркури. Я на трафике, поэтому ни скачать. ни распознать... Спасибо

Аватар пользователя Captain Scarlett

Начала сканировать книгу Андрея Кофмана о Конкисте "Рыцари Нового Света".

Скоро:
Николай Смирнов. Джек Восьмеркин американец.
Жюль Верн. История великих путешествий.
Илиас Меркури. Антилузер.

Алексей_Н написал:
Скоро:
Николай Смирнов. Джек Восьмеркин американец.
Жюль Верн. История великих путешествий.
Илиас Меркури. Антилузер.

Это другой "Антилузер"? Ты же, вроде, недавно какой-то делал.

Все тот же. Сижу, вычитываю, жду отсутствующих страниц.

Прошу меня простить, если влез не в ту тему - подходящей пока не нашёл.

Видел, что на Либрусеке есть книги, написанные специально для библиотеки Либрусек.

Где бы узнать поподробнее - что это такое и не мог бы я тоже пригодиться для этой цели?

Не "написанные", а сделанные от сканирования до окончательной верстки и изначально выложеные на Либрусек.
Любой может принять в этом участие.

А - значит я неправильно что-то понял

А в остальном я просто ничего не понимаю, увы.

Прошу извинить за беспокойство и уход от темы.

Сергей Ильвовский написал:
Прошу меня простить, если влез не в ту тему - подходящей пока не нашёл.
Видел, что на Либрусеке есть книги, написанные специально для библиотеки Либрусек.
Где бы узнать поподробнее - что это такое и не мог бы я тоже пригодиться для этой цели?

Сергей, в принципе, никто не мешает написать книгу для библиотеки )
В целом, все равно для читателей, но выложить ее можно именно здесь. )

Не думаю, что кто-то будет возражать против этого )

http://elkniga.ru/pages/biblio_authors/?subject=53534

Это про Вас?

Сергей Ильвовский является одним из авторов сценария сериалов "Сыщики", "Сыщики 2" и "Сыщики 5", участвовал в некоторых других - "Безмолвный свидетель", "Возвращение Мухтара", но в небольшом объёме - 1-3 серии.

Родился 3 декабря 1947 года.

Имеет неполное медицинское образование, в молодости работал в больнице, на биофаке МГУ и в Московском медицинском стоматологическом институте (каф. нормальной анатомии)

По семейным обстоятельствам из института ушёл, работал наладчиком КИПиА в ин-те НИУИФ, а затем в Опытно-конструкторском бюро автоматики (НПО "Химавтоматика" ген.директор Ю.М.Лужков), окончил вечерний МИХМ и прошёл путь от электрослесаря КИПиА до главного конструктора проекта.

В 1993 году ушёл - всё рассыпалось, работал где придётся и кем придётся, лишь бы прокормить семью - вплоть до строительного рабочего.

Сценарии начал писать совершенно случайно.

Принимал участие в создании телепередачи «Детектив-шоу». Автор сценариев 4-х короткометражных детективных фильмов без названия, использовавшихся в первых выпусках передачи. Реж. Е.Гинзбург. АТВ 1999г

По договору с издательством «АСТ» мной написан детективный роман
«Шесть шестых». Книга вышла в марте 2008 года и находится в продаже.

Приступил к работе над романом М. Г. Льюиса "Монах".

Уважаемые, "Шрам" Чайны Мьевилля на русском никто не мог бы отсканить? Уверен, многие были бы благодарны

Шрам в планах библиотеки Старого Чародея
http://oldmaglib.com/

Заканчиваю вычитку (в смысле уже отсканировал и обработал) Шарон Ли и Стив Миллер "Завтрашняя запись".

надеюсь первый блин не комом :) хотя если честно боюсь что будет последний - уж сильно много времени берет и рука от кликанья по мышке болит , кстати может я чего не так делаю , может есть топик как правильно ?
Если нет то надо создать.
Я например делал так:

1. Сканирую Abby FineReader 9 (по 2 страницы сразу, книги приходится хорошо "прижимать" иначе середина криво выходит и иногда даже часть букв не влазит,600DPI, greyscale).

2. Прохожусь вручную по всем картинкам , смотрю где может какие страницы пропустил сканируя (смотрю на номера страниц), если надо досканирую.

3. Deskew (Page->Edit Page Image->Deskew & Straighten , "Apply to all images" и "Deskew Image")

4. Streighten text lines (Page->Edit Page Image->Deskew & Straighten , "Apply to all images" и "Streighten text lines")

5. Режу пополам (Page->Edit Page Image->Сплит , "Aутосплит all images" )

6. Прохожусь в ручную по всем страницам и помечаю все зоны где текст + ставлю тип как текст, номера страниц и подобные "headers/footers" не включаю. Делаю это потому что FineReader хоть зверюшка умная но иногда такое фигачит , бывает пару букв по краю не захвати, бывает десяток зон налепит там где одна нужна.

7. Document->Read Document.

8. Прохожусь спеллером , чиню все что он начудил, особое внимание переносам, там должно быть не просто тире а такой значок в форме лежащей на боку буквы "г" , если не он надо его поставить (беру через copy-paste).

9. Прохожусь по всем страницам и "чиню" не правильно выбраные фонты, лучше всего это делать через "style" а не через "фонт" ибо в ФайнРидере похоже баг - не всегда меняет. По ходу надо следить чтоб то что italic таким и осталось.

10. Запускаю FB Writer и постранично копирую через copy-paste (тут как им пользоватся нужна отдельная тема но вроде разобрался).

11. Просматриваю (листая) книгу и проверяю опять что все места где italic так и проставленны и так где есть дополнительные отступления (строчки) они на месте.

12. Вычитка , я лично конвертирую полученный FB2 в .rlf и читаю на соньке, по ходу правлю что нашел.

Есть идеи "оптимизации" без того чтобы упало качество ?

Делаю чуть-чуть попроще:
1. Сканирую с помощью ABBYY FineReader 4.0 Sprint с разрешением 300 dpi.
2. Отсканированные страницы перевожу в Word. По ходу дела вычитываю ("неуверенно распознанные" места выделены зеленым цветом).
3. Всё остальное делаю в FBE. В том числе и переносы убираются скриптом "генеральная уборка".
4. Картинки сканирую и обрабатываю через "Photoshop".
5. Вот и всё.

1. Пользуйтесь в FR шаблонами - экономит массу времени, приходится менять размер и тип только отдельных областей.
2. Экспортируйте FR-документ в Word. Там автоматически можно убрать все мягкие переносы (тот самый значок "г").
3. Резать пополам двойные страницы не обязательно - FR и так прекрасно распознаёт и экспортирует.
4. Мягкие переносы FR обычно ставит сам, после окончания просмотра на предмет "неуверенно распознанных фрагментов", следует пройтись по тексту, заменяя дефис в конце строки на мягкий перенос (там, где это нужно). Делается через "заменить" (Ctrl+H).

Не очень понимаю, зачем "чинить" фонты. При конвертировании в fb2 они всё равно не распознаются. Важно сохранить bold и italic, которые при конвертировании, к сожалению, могут потеряться. Поэтому имеет смысл в исходнике doc попробовать разные сочетания стилей, чтобы при конвертации форматирование не терялось.

Это так, на первый взгляд. ;)

блин, и тут баги , ответить не возможно

Это конечно не идея "оптимизации", а скорее нечто из раздела "наша кунсткамера". Но тем не менее:
1. Сканирую "родной" для сканера программой, 300 DPI, greyscale.
2. Сохраняю в bmp.
3. В XnViev применяю эффект "проработка деталей".
4. Распознаю текст в Microsoft Office Document Imaging, настройки по умолчанию.
5. Копирую в Word-документ или txt-файл, правлю.
При таком раскладе у меня получается почти кошерный текст. Единственно, "распознавалка" майкрософта не любит буквы "ы" (гь) и "Я" (51). Зато отлично справляется с современной прозой, различными учебными пособиями (благодаря пункту 3, без этого всё не так радостно).

Хочу добавить к посту golma1. Рекомендую также спеллчек делать в FR, там, по сравнению с Word-ом, куда больше опций и возможностей, плюс просто удобнее (оригинальный скан перед глазами).

Мои пять копеек к процессу сканирования-распознавания:

Сразу же в ФР, после распознавания, встав на первый текстовый блок, ищем поиском по всем страницам пакета неправильно распознанные (склеенные) абзацы:
!^l
:^l
?^l
.^l
-^l

Кстати , golma1 , если не резать , и давать FR самому разбираться то как вы тогда избавляетесь от номеров страниц и подобного ?

Lord KiRon написал:
если не резать , и давать FR самому разбираться то как вы тогда избавляетесь от номеров страниц и подобного ?

Я делаю шаблоны.
1. Выбираете наиболее типичную для скана страницу.
2. Выделяете на ней нужные для распознавания области.
3. Сохраняете как шаблон (меню "Области" --> "сохранить шаблон областей")
4. Загружаю этот шаблон (меню "Области" --> "загрузить шаблон областей")
5. Просматриваю документ, исправляя размер и тип области по необходимости.
6. "Распознать документ".

Последние два пункта можно поменять местами. Тогда страницы, где Вы поменяли размер или тип области, надо распознать ещё раз.

Начал сканировать третий том "Пещеры Лейхтвейса".

предлагаю перейти сюда - http://librusec.ucoz.de/forum/8

конечно же, это реклама

Начал делать "Причуды моей памяти" Даниила Гранина.

Занимаюсь конвертацией "Управление и поддержка Microsoft Windows Server 2003. Учебный курс MCSA MCSE" из PDF в FB2. Если кто заинтересован этой книгой, отпишитесь.

Отсканировал Дэвид Геммел : Оседлавший бурю (Риганты 4) , буду потихоньку делать , дальнейшие планы тут: http://lib.rus.ec/node/122182

Цитата:
дальнейшие планы тут: http://lib.rus.ec/node/122182

Планы, прямо сказать, наполеоновские.
Удачи вам в этом!

Скоро:
Приключенческая повесть А. Шейкина "Резидент".
Веселые сказки венгерского писателя Эрвина Лазара.
Роман Жюля Верна "Дядюшка Робинзон".

Следующим пунктом: "Затеряная Динотопия" Алана Фостера"

Lord KiRon написал:
Следующим пунктом: "Затеряная Динотопия" Алана Фостера"

Не надо. Издание 2005 года я доделываю, выложу завтра. Разве что иллюстрации есть смысл поменять - у меня очень плохие исходники..

Не надо так не надо :) , у меня план еще огромный так что "перейдем к следующему номеру"

Делаю Макмуртри "Одинокий голубь". Скан и OCR сделаны, осталась вычитка и конвертация в fb2. Делаю все в первый раз, так что не откажите в помощи, если что. Сразу первый вопрос: есть FBE, может вычитку и конвертацию совместить, т.е. сразу в FBE делать вычитку? Или все-таки в Ворде удобней?

Я делаю сразу в FBE, намного удобнее, без лишних заморочек.
При помощи скриптов удаляется ненужный мусор в считанные секунды.
Проверить орфографию можно, открыв fb2 при помощи word'а, оставляя теги не тронутыми.

C камрадом Consul-ом заканчиваем сейчас трехтомник "Африка грёз и действительности" Ганзелки и Зикмунда. Книги весьма объемные, но качество скана отличное, текст чистый. Есть, правда, несколько "но": пока отсутствуют полностью фотки (видимо, придется выложить такую, чуть усеченную версию в качестве релиза), с фотографиями каждая книга будет весить метров под 10, не меньше. Еще есть мысль оформить фотки в качестве приложения к каждой книге (надо заметить, что у чехов не только текст хороший, но и фотографии великолепные, хотелось-бы сохранить в hi-res).

Страницы

X