Координация сканирования и вычитки

Аватар пользователя larin

Для лучшей координации сканирования новых книг запустил сервис http://lib.rus.ec/ocr

Комментарии

Аватар пользователя Quae

Не ввести ли у названия книг в списке указание "тип работы" (приобретение, сканирование, распознавание, вёрстка)?
А то книга может быть указана только под "могу достать", а люди подумают, что сразу распознаётся.

Аватар пользователя Ronja_Rovardotter

Да вобщем-то, если книга интересует можно зайти на страничку и посмотреть на какой она стадии. Но можно и показывать - брать, например, последнюю имеющуюся по значимости стадию.

Аватар пользователя larin

можно.

Аватар пользователя Lord KiRon

ОК, для начала немного покритикую :) - подход несколько не правильный ;)

1. В первую очередь добавление должно быть сделано вторым этапом поиска, возможно даже обычного Либрусековского поиска, типа провел поиск - на странице результатов внизу линк добавить. Причем чтоб он (обычный поиск) искал и в обещаниях, то есть обычный пользователь мог получить в результатах что книга сканируется и т,.п. Иначе утонем в планах.

Теперь о мелких пожеланиях:

2. Линк чтобы увидеть все "свои" книги, те что еще не сделаны, то есть те что занес.

3. На "главной" ( http://lib.rus.ec/ocr ) чтобы было видно сразу со списком кто внес + дата последнего изменения статуса.

4. Возможность добавить линк на библиотеку, причем в профиле возможность иметь несколько библиотек с линками и при добавлении книги выбирать (дроп бокс) из них.

5. ББК для старых книг, и чтоб поиск по нему как и по ISBN работал.

6. Сортировка по жанрам.

7. Линк на книгу в магазине (например чаще всего Озон) - не для рекламы а для удобства, причем чтоб поиск искал и по линку, иногда удобно проверить есть ли эта кнуига уже в планах.

8. Переводчики (поле).

9. Возможность выбирать авторов и переводчиков из тех что уже есть в библиотеке.

Аватар пользователя Ronja_Rovardotter

Lord KiRon написал:
В первую очередь добавление должно быть сделано вторым этапом поиска, возможно даже обычного Либрусековского поиска, типа провел поиск - на странице результатов внизу линк добавить. Причем чтоб он (обычный поиск) искал и в обещаниях, то есть обычный пользователь мог получить в результатах что книга сканируется и т,.п. Иначе утонем в планах.

Книга просто так не добавляется. Там такой порядок:
"Кого-то заинтересовала книга. Он создаёт карточку учёта на http://lib.rus.ec/ocr. Если книга с таким названием уже есть, то движок уточнит, надо ли."

Т.е. по идее дублей быть не должно.

Поиск тоже работает. Поищи "иствикские вдовы" - увидишь.

Аватар пользователя Lord KiRon

Ronja_Rovardotter написал:
Lord KiRon написал:
В первую очередь добавление должно быть сделано вторым этапом поиска, возможно даже обычного Либрусековского поиска, типа провел поиск - на странице результатов внизу линк добавить. Причем чтоб он (обычный поиск) искал и в обещаниях, то есть обычный пользователь мог получить в результатах что книга сканируется и т,.п. Иначе утонем в планах.

Книга просто так не добавляется. Там такой порядок:
"Кого-то заинтересовала книга. Он создаёт карточку учёта на http://lib.rus.ec/ocr. Если книга с таким названием уже есть, то движок уточнит, надо ли."

Т.е. по идее дублей быть не должно.

Поиск тоже работает. Поищи "иствикские вдовы" - увидишь.


Позвольте не согласится ;)
Вопрос не про то как можно сделать, а про то как сделать так чтоб было удобно.
Лично для меня стандартное workflow :
1. "Присмотрел" книгу, на Озоне или у себя или у друзей.
2. Проверил по всем библиотекам есть ли она.
3. Если нет - беру в работу.

Думаю что у большинства оно тоже так, вот и хотелось чтоб отражало. Именйно по этому я и хочу чтоб общий поиск работал и по "в работе", то есть сразу забив например название в поиск можно было бы сразу видеть есть ли книга, или может в работе у кого.
Да и не сканировщикам можно было бы знать где, в какой библиотеке, ждать в первую очередь если книга "в работе".

Кстати, дубли это тоже вполне возможный "кошерный" вариант , например если другой перевод или издание, должно учитываться...

Аватар пользователя Ronja_Rovardotter

Lord KiRon написал:

2. Проверил по всем библиотекам есть ли она.

Ой, тут я ничего не скажу. По Либрусеку-то ищет, а все остальное комментировать - я пас.

Lord KiRon написал:

Да и не сканировщикам можно было бы знать где, в какой библиотеке, ждать в первую очередь если книга "в работе".

В карточке есть поле "Библиотека" - указывайте где делается.

Lord KiRon написал:

Кстати, дубли это тоже вполне возможный "кошерный" вариант , например если другой перевод или издание, должно учитываться...

Одновременно несколько переводов? Маловероятно. Но в принципе можно после названия вбить "переводчик такой-то" - вот тебе и другое название.

Ronja_Rovardotter написал:
Кого-то заинтересовала книга. Он создаёт карточку учёта на http://lib.rus.ec/ocr. Если книга с таким названием уже есть, то движок уточнит, надо ли."
Т.е. по идее дублей быть не должно.
Будут. Наткнулся на забавную особенность - чем короче название, тем больше до хренищщща совпадений. Добавлял "Сам" Н. Воронова - получил переспрос и шесть с чем-то десятков названий книг со словами "самый", "самая", "самое", "ансамбль" и т.д., :-( еле нашёл среди них кнопку "Таки настаиваю". :-)
Аватар пользователя golma1

Lord KiRon написал:
ОК, для начала немного покритикую :) - подход несколько не правильный ;)

Ларин ответит подробнее, а пока:

1. Поиск работает и по книгам "В работе". Т.е. на странице результатов поиска ты увидишь, что эта книга в работе, если она уже есть.
2. -
3. Слишком загрузит страницу. Представь, что у тебя 100 книг в работе. Проще пойти на страницу нужной книги и там получить всю информацию. Последний релевантный статус отображается.
4. ??? Для какой библиотеки делается? Есть в планах. Книга из формы не добавляется, там только прописывается её адрес на Либрусеке. Если появился статус "сверстал", а книги на Л. ещё нет, можно будет пойти по линку на ту библиотеку, для которой делалась книга, и там её скачать.
5. -
6. -
7. Вторую часть предложения не поняла. Что касается первой, то линк можно дать в поле "пара слов". Например, как здесь: http://lib.rus.ec/node/258802
8. Указать в поле "Пара слов".
9. - (не поняла смысла и цели).

Аватар пользователя Lord KiRon

golma1 написал:

3. Слишком загрузит страницу. Представь, что у тебя 100 книг в работе. Проще пойти на страницу нужной книги и там получить всю информацию. Последний релевантный статус отображается.

У меня 100? Не смеши, кто сразу 100 книг в работе держит? Даже если я ввожу все книги "в работе" со всей библиотеки, а не только свои. Понятно что те которые сделаны показыватся не должны конечно.
golma1 написал:

7. Вторую часть предложения не поняла. Что касается первой, то линк можно дать в поле "пара слов". Например, как здесь: http://lib.rus.ec/node/258802

Ну например я делаю http://www.ozon.ru/context/detail/id/5396168/ , было бы удобно чтоб я мог бы проверить на наличие ее в планах просто введя линк в поиск, очень удобно для новинок.
golma1 написал:

8. Указать в поле "Пара слов".

Плохо, как я уже сказал вижу как часть общего поиска, да и если например одновременно делается два разных перевода?
golma1 написал:

9. - (не поняла смысла и цели).

Ну просто чтоб удобней было, время сэкономить. И опять же как часть привязке к общей базе данных, чтобы и по псевдонимам искала и по другим формам написания - у меня подход комплексный ;)

Кстати, наличие поля совсем не означает что оно обязательное к заполнению.

Аватар пользователя larin

Lord KiRon написал:

У меня 100? Не смеши, кто сразу 100 книг в работе держит? Даже если я ввожу все книги "в работе" со всей библиотеки, а не только свои. Понятно что те которые сделаны показыватся не должны конечно.

За первые сутки уже больше 100.
Боюсь, к концу месяца перевалит за 1000, придётся городить хитрые фильтры.
Аватар пользователя larin

Lord KiRon написал:
ОК, для начала немного покритикую :) - подход несколько не правильный ;)

Конструктивная критика - это хорошо.
Lord KiRon написал:
1. В первую очередь добавление должно быть сделано вторым этапом поиска, возможно даже обычного Либрусековского поиска, типа провел поиск - на странице результатов внизу линк добавить.

Сделал.

Lord KiRon написал:
Причем чтоб он (обычный поиск) искал и в обещаниях, то есть обычный пользователь мог получить в результатах что книга сканируется и т,.п. Иначе утонем в планах.

Так и есть.

Lord KiRon написал:
2. Линк чтобы увидеть все "свои" книги, те что еще не сделаны, то есть те что занес.

http://lib.rus.ec/ocr/my

Lord KiRon написал:
3. На "главной" ( http://lib.rus.ec/ocr ) чтобы было видно сразу со списком кто внес + дата последнего изменения статуса.

Сделал.

Lord KiRon написал:
4. Возможность добавить линк на библиотеку, причем в профиле возможность иметь несколько библиотек с линками и при добавлении книги выбирать (дроп бокс) из них.

поле есть, дропбокс имхо избыточен

Lord KiRon написал:
5. ББК для старых книг, и чтоб поиск по нему как и по ISBN работал.

Этого вообще пока нет в библиотеке. Если вводить, то надо заполнять для существующих книг.
Бум думать.

Lord KiRon написал:
7. Линк на книгу в магазине (например чаще всего Озон) - не для рекламы а для удобства, причем чтоб поиск искал и по линку, иногда удобно проверить есть ли эта кнуига уже в планах.
8. Переводчики (поле).

Есть текстовое поле общего назначения, можно всё указывать там. Надо ли усложнять форму?
Думаю, посмотрим по опыту. Если большинство будет там указывать нечто одно и то же, добавлю в обязательные поля.
Для поиска достаточно названия, не так уж много книг с совпадающим.

Lord KiRon написал:
9. Возможность выбирать авторов и переводчиков из тех что уже есть в библиотеке.

Видимо будет.
Аватар пользователя Isais

larin написал:
Lord KiRon написал:
5. ББК для старых книг, и чтоб поиск по нему как и по ISBN работал.

Этого вообще пока нет в библиотеке. Если вводить, то надо заполнять для существующих книг.
Бум думать.
На фиг, на фиг такую фичу!
В книгах в 50% вместо ББК стоит бред, по библиотекам кто рыться будет? + в разных библиотеках разные ББК присваивают одной и той же книге. На фиг - говорю по длительному собственному опыту.
Достаточно "жанров".
Аватар пользователя larin

Isais написал:
На фиг, на фиг такую фичу!
В книгах в 50% вместо ББК стоит бред, по библиотекам кто рыться будет? + в разных библиотеках разные ББК присваивают одной и той же книге. На фиг - говорю по длительному собственному опыту.

Не делать какую фичу - это я завсегда готов, только попросите.
Аватар пользователя Lord KiRon

Isais написал:
larin написал:
Lord KiRon написал:
5. ББК для старых книг, и чтоб поиск по нему как и по ISBN работал.

Этого вообще пока нет в библиотеке. Если вводить, то надо заполнять для существующих книг.
Бум думать.
На фиг, на фиг такую фичу!
В книгах в 50% вместо ББК стоит бред, по библиотекам кто рыться будет? + в разных библиотеках разные ББК присваивают одной и той же книге. На фиг - говорю по длительному собственному опыту.
Достаточно "жанров".

А что еще есть у тех книг у которых нет ISBN? В союзе же что-то назначали? Я считал что это "что-то" BBK.
Аватар пользователя Isais

Лорд, я тебе отдельно сделаю обзорную лекцию по издательской фигне, которую назначали книгам при СССР, Российской империи, Московском царстве и Священной Римской империи германской нации, а здесь и сейчас поверь: ББК не спасет надежду русскоязычного книгоделания.

Аватар пользователя Lord KiRon

Спасибо :)

Аватар пользователя Lord KiRon

10. Издательство.

11. Чисто Российская "фича" когда у одной книги могут быть несколько издательств и ISBN.

Аватар пользователя golma1

Lord KiRon написал:
10. Издательство.
11. Чисто Российская "фича" когда у одной книги могут быть несколько издательств и ISBN.

Всё - в доп. поле. Форма должна быть простейшая. ИМХО.
Единственно, с чем могу согласиться - это с переводчиком. И то: у разных переводчиков - разные названия книг. Так что пересечения будут вряд ли.

Аватар пользователя Lord KiRon

golma1 написал:
Lord KiRon написал:
10. Издательство.
11. Чисто Российская "фича" когда у одной книги могут быть несколько издательств и ISBN.

Всё - в доп. поле. Форма должна быть простейшая. ИМХО.
Единственно, с чем могу согласиться - это с переводчиком. И то: у разных переводчиков - разные названия книг. Так что пересечения будут вряд ли.

Голма!!!! :)
Это все для поиска, я же говорю мои предложения "в комплексе" надо рассматривать.

Аватар пользователя golma1

Lord KiRon написал:
Голма!!!! :)
Это все для поиска, я же говорю мои предложения "в комплексе" надо рассматривать.

Ээээ... Ты по издательствам и ISBN книги ищешь?! А если они просто не были внесены в дескрипшен? Мало ли таких файлов!

Насчёт автора - согласна, должно искать. Всё остальное - из серии "а теперь давайте со всей этой херней попробуем взлететь". IMHO.
Давай начнём пользоваться и увидим, чего нам действительно не хватает. А то "лучшее - враг хорошего".

Не мешало бы отображать книги "в работе" либо при поиске по автору, либо на странице автора.

Аватар пользователя Lord KiRon

Рыжий Тигра написал:
Не мешало бы отображать книги "в работе" либо при поиске по автору, либо на странице автора.

Угу, я вообще уже давно утверждаю что книги "в работе" должны быть "равноправными" в библиотеке с обычными книгами, только без файла и с другим статусом, а так все так же. А элементы типа ISBN не помешают и обычным книгам. Ну если не указан так не указан, а если указан - найдет.
Аватар пользователя larin

Lord KiRon написал:
Рыжий Тигра написал:
Не мешало бы отображать книги "в работе" либо при поиске по автору, либо на странице автора.

Угу, я вообще уже давно утверждаю что книги "в работе" должны быть "равноправными" в библиотеке с обычными книгами, только без файла и с другим статусом, а так все так же. А элементы типа ISBN не помешают и обычным книгам. Ну если не указан так не указан, а если указан - найдет.

Я изначально так и хотел сделать. Более того, тут и делать ничего не надо - создаёшь fb2 без текста, вместо текста пишешь (в работе), все остальны поля заполняешь обычно - вот и заглушка.
Потом с Голмой решили разнести на разные сущьности.
Аватар пользователя Lord KiRon

larin написал:
Lord KiRon написал:
Рыжий Тигра написал:
Не мешало бы отображать книги "в работе" либо при поиске по автору, либо на странице автора.

Угу, я вообще уже давно утверждаю что книги "в работе" должны быть "равноправными" в библиотеке с обычными книгами, только без файла и с другим статусом, а так все так же. А элементы типа ISBN не помешают и обычным книгам. Ну если не указан так не указан, а если указан - найдет.

Я изначально так и хотел сделать. Более того, тут и делать ничего не надо - создаёшь fb2 без текста, вместо текста пишешь (в работе), все остальны поля заполняешь обычно - вот и заглушка.
Потом с Голмой решили разнести на разные сущьности.

Тут проблема политическая немного, я такие как старый скандалист-провокатор сразу вижу, если объединить , то могут сказать, что мол улучшаешь свою библиотеку за счет других, "централизируешь" поиск новинок, но с другой стороны нельзя же доходить до маразма, если это удобно и правильно - то почему бы и нет? Нельзя все время жить следуя идеологии "назло кондуктору куплю билет и пойду пешком".
Аватар пользователя larin

Lord KiRon написал:
Тут проблема политическая немного, я такие как старый скандалист-провокатор сразу вижу, если объединить , то могут сказать, что мол улучшаешь свою библиотеку за счет других, "централизируешь" поиск новинок, но с другой стороны нельзя же доходить до маразма, если это удобно и правильно - то почему бы и нет? Нельзя все время жить следуя идеологии "назло кондуктору куплю билет и пойду пешком".

Я, как известно, к скандалам равнодушен, и политику в расчёт не беру.
Важнее удобство для сканировщиков.
Скажем, что делать, если автора на Либрусеке нет. Создавать? Можно, в принципе. Но это сразу всё усложняет.
Или если авторов несколько.
Так у нас есть строчка - и пиши туда что угодно. Заполнил одну простую форму, и дело сделано. Максимум ткнул ещё одну кнопку, если нашлись похожие книги.
С другой стороны, пришёл человек, нашел книгу, а её и нету. Путаница.
Так что книги отдельно, работа отдельно. Так пока получается.
Аватар пользователя larin

Рыжий Тигра написал:
Не мешало бы отображать книги "в работе" либо при поиске по автору, либо на странице автора.

Сделал на странице автора, например http://lib.rus.ec/a/34623 (в конце списка книг, перед впечатлениями)

Сорри оффтоп
(умильно, сидя на заборе) Как приятно видеть, как на глазах скелет обрастает мясом ))

Аватар пользователя larin

wotti написал:
Сорри оффтоп
(умильно, сидя на заборе) Как приятно видеть, как на глазах скелет обрастает мясом ))

Ща ещё шкуркой покроем и красиво расчешем мех.
Аватар пользователя Lord KiRon

Кстати, "статусы" немного не удобны, например я "достал" книгу , но отсканировал ее потом кто-то другой, вычитал третий и т.д. А статусы мониторю и меняю я. Не хотелось бы чтоб везде стояло "вычитал Lord KiRon" , давайте поменяем на что то более нейтральное, типа "вычитано" , "отсканировано" и т.п.
И вообще, мне и многим другим очень не хотелось бы "оставаться в истории", точнее попадать в списки "создателей". Нельзя ли после того как книга закончена залита терять всех "создателей"? Кто хочет - отметится в файле или будет заливщиком.

Lord KiRon написал:
Кстати, "статусы" немного не удобны, например я "достал" книгу , но отсканировал ее потом кто-то другой, вычитал третий и т.д. А статусы мониторю и меняю я. Не хотелось бы чтоб везде стояло "вычитал Lord KiRon" , давайте поменяем на что то более нейтральное, типа "вычитано" , "отсканировано" и т.п.
И вообще, мне и многим другим очень не хотелось бы "оставаться в истории", точнее попадать в списки "создателей". Нельзя ли после того как книга закончена залита терять всех "создателей"? Кто хочет - отметится в файле или будет заливщиком.

Лорд, какие проблемы?? возьмите рабочие аккаунты левые ( тебя что ли учить КАК?)
Аватар пользователя Lord KiRon

wotti написал:
Лорд, какие проблемы?? возьмите рабочие аккаунты левые ( тебя что ли учить КАК?)

Именно это я называю "немного неудобно" :)

Аватар пользователя Ronja_Rovardotter

Lord KiRon написал:
И вообще, мне и многим другим очень не хотелось бы "оставаться в истории", точнее попадать в списки "создателей". Нельзя ли после того как книга закончена залита терять всех "создателей"? Кто хочет - отметится в файле или будет заливщиком.

Если нажмешь на кнопку еще раз, то "потеряешься" из статуса. Книга сделана - пройдись и самовыпились. Через какое-то время карточки можно вообще удалять, чтобы уже неактуальные сущности в списке не болтались.
Аватар пользователя golma1

Ronja_Rovardotter написал:
Через какое-то время карточки можно вообще удалять, чтобы уже неактуальные сущности в списке не болтались.

Если я правильно поняла, они перемещаются в "недавно сделанные". Надо только, наверное, определить срок, сколько они там должны находиться.
Аватар пользователя niksi

А я понял, что удаляются тогда, когда забьешь в карточку номер выложенной книги в строку http://lib.rus.ec/b/ и нажмешь enter.

Аватар пользователя larin

niksi написал:
А я понял, что удаляются тогда, когда забьешь в карточку номер выложенной книги в строку http://lib.rus.ec/b/ и нажмешь enter.

Не удаляются, но переходят в список сделанных.
Аватар пользователя Roxana

Как зафиксировать ссылку на готовую книгу? В окошке добавляю номер книги, но ссылка не фиксируется.

Аватар пользователя larin

Roxana написал:
Как зафиксировать ссылку на готовую книгу? В окошке добавляю номер книги, но ссылка не фиксируется.

ENTER
Аватар пользователя niksi

Мне кажется, что слегка не выверена иерархия статусов. Так, для книги http://lib.rus.ec/node/258782 в списке http://lib.rus.ec/ocr отображается статус "распознал". А должен уже "вычитываю". Предыдущий этап "готов вычитать" тоже не отображался как последний.

Аватар пользователя sem14

Похоже показывает первый из статусов, и пройденный статус надо стереть.

Аватар пользователя niksi

sem14 написал:
Похоже показывает первый из статусов, и пройденный статус надо стереть.

Хотелось бы, что бы и без стирания работало. Но если не получится, то бум тереть.
Аватар пользователя golma1

niksi написал:
sem14 написал:
Похоже показывает первый из статусов, и пройденный статус надо стереть.

Хотелось бы, что бы и без стирания работало. Но если не получится, то бум тереть.

Вообще-то мне казалось, что уже было так, что показывался последний статус. Может, что-то сбилось? Надеюсь, Илья поправит.
Аватар пользователя larin

niksi написал:
Мне кажется, что слегка не выверена иерархия статусов. Так, для книги http://lib.rus.ec/node/258782 в списке http://lib.rus.ec/ocr отображается статус "распознал". А должен уже "вычитываю". Предыдущий этап "готов вычитать" тоже не отображался как последний.

Готов вычитать - вообще не важен, мало ли кто к чему готов. Это так, для вящей координации, не относится к состоянию книге.
А вот какой статус важнее - законченный или текущей работы - вопрос филосовский.

Для удобства сортировки по автору я бы разделил автора на два поля - имя и фамилия. Или сортировал бы по правой части (после последнего пробела).

Аватар пользователя larin

Aldio написал:
Для удобства сортировки по автору я бы разделил автора на два поля - имя и фамилия. Или сортировал бы по правой части (после последнего пробела).

Разделил на два поля - полное название и фамилия для сортировки. Добавил третье поле - id автора на либрусеке, если есть.
Скрипт пытается их заполнить самостоятельно, если не смог - можно поправить.
Аватар пользователя Миррима

Мне кажется, была бы полезной градация по "состоянию" - то есть, что "сканируется", а что "вычитывается". Я не знаю, как правильно сформулировать... Но вот, допустим, отделить сверстанное невычитанное от еще какого-нибудь...

Аватар пользователя golma1

миррима написал:
Мне кажется, была бы полезной градация по "состоянию" - то есть, что "сканируется", а что "вычитывается". Я не знаю, как правильно сформулировать... Но вот, допустим, отделить сверстанное невычитанное от еще какого-нибудь...

Хорошая идея. Может быть, не все фазы, но некоторые было бы интересно сортировать.
1. Запрошены (нет никаких действий)
2. Требуют ОСR (после "отсканирован")
3. Требуют вычитки (после "распознал" или после "сверстал", если нет записей в строке "готов вычитывать-вычитываю-вычитал").

Кстати, "Требуют вычитки" было бы здорово вообще - вместо громоздкой и заполняемой вручную таблицы. Кнопка возле книги - и в динамический список заносится ссылка с названием, автором и жанром.
А, Илья?

Глючок - почему-то в части книг, которые заказала golma1 проставилось "сканирую". Хотя никто ничего не ставил. По крайне мере мне так отображается.

Вопрос - с чем связано, что из всех полей нельзя изменить исключительно Название? :-)

Наиболее неудобная часть страницы это сортировка по автору. Хотелось бы сортировку по фамилии, а не по имени. Тем более частично эти параметры там перемешаны.

И один вопрос. Как можно следить за комментариями оставленными на страницах "планируемых" книг? К примеру я оставил вопрос-комментарий в одной из тем, но на привычной странице http://lib.rus.ec/tracker его появление (как и вся тема целиком) не отображаются.

Страницы

X