Вы здесьОбработка дублей.
Опубликовано сб, 31/05/2008 - 08:16 пользователем xxxyurixxx
Может все-таки стоит запретить удаление книг для всех? Сделать удаление и обработку дублей модерируемыми? Просто некоторые товарищи уже задолбали заменять отличные файлы неправлеными eBookDownloader'овскими. Сборники Лукьяненко, например, заменили. Сейчас залил назад нормальные.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Приключения белочки Рыжки 9 часов
alex-from RE:Оплатил два раза, но абонемента нет 2 дня sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 дня Kiesza RE:На 78-м году жизни скончался советский и российский... 3 дня Aliki RE:Подайте бедному копеечку на книжку с литреса... 3 дня Paul von Sokolovski RE:Бушков умер. 1 неделя lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 неделя mig2009 RE:Багрепорт - 2 2 недели Isais RE:Издательство "Медуза" 2 недели babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 4 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 месяц sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц Isais RE:Игорь Северянин - Том 2. Поэзоантракт 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц sem14 RE:Семейственность в литературе 1 месяц Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 месяц Саша из Киева RE:Подводное течение 1 месяц konst1 RE:Переименовать ник (имя учетки) 2 месяца Впечатления о книгах
Олег Макаров. про Карелин: Архитектор душ (Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
05 11 Идея неплохая, но написано предельно нудно. Сюжет стоит на месте, буксует, шины визжат, но ничего не едет. Почти до конца первую книгу дочитал и бросил Оценка: плохо
Олег Макаров. про Анатолий Н. Патман
05 11 «боец СВО, оказавшийся, на удивление, наследником древней космической, и могущественной цивилизации» обожемой! какой полёт мысли у автора! какая акутальность шыдевра! какая смелая интерпретация событий! ну и так далее. Вот ………
Sanyok89 про Пелевин: A Sinistra | А Синистра | Левый Путь (Триллер, Современная проза)
05 11 Ну хоть одна более-менее читаемая книга из этого цикла. Завершать уже пора этот трансгуманизм, а то Санта Барбара какая то Оценка: неплохо
Олег Макаров. про Андрей Владимирович Курпатов
04 11 Доктор Курпатов, Доктор Курпатов, Доктор Курпатов - многократное повторение этого словосочетания создало у многих превратное представление о том, что А.Курпатов является доктором наук. На самом деле человек имеет только ………
Lena Stol про Искаженный мир
04 11 Прочитала обе книги, пропускала много, особенно во второй части, хороший сюжет, но уж очень автор растянул. Если из двух книг сделать одну, будет интереснее.
udrees про Михеенков: Маргелов (Биографии и Мемуары)
04 11 В книге встречаются интересные упоминания, например про новобранцев с Западной Украины, «командиры были им не рады», они ненавидели оба режима, были коллаборантами, вообще удивительно, как они воевали в рядах Красной Армии, ……… Оценка: неплохо
udrees про Вальтер: Реквием [СИ litres] (Боевая фантастика, Социальная фантастика, Приключения: прочее, Самиздат, сетевая литература)
04 11 Вот и завершилась история четверки отморозков, что портили воздух после начала Армагеддона. Таких отбитых персонажей еще надо поискать, но у автора есть еще похожие циклы произведений с таким же отребьем в роли главных героев. Книга ……… Оценка: неплохо
udrees про Келли: Сатана. Биография (История, Религиоведение, Религия)
04 11 Просто какая-то религиозная муть, что я могу сказать про эту книгу. Автор конечно проделал большую работу, достойную кандидатской или даже докторской диссертации, изучил множество источников, анализировал, сопоставлял, делал ……… Оценка: плохо
udrees про Мантикор: Город, которого нет 2 [СИ] (Фэнтези, Самиздат, сетевая литература)
04 11 Книга все больше начинает напоминать серию книг автора – Покоривший Стену. По крайней мере начинаешь встречать знакомую терминологию – энергет, изнанка, пустотная магия, мертвая магия, цветы эдельвейс, артефакты некоторые. ……… Оценка: отлично!
udrees про Мантикор: Город, которого нет (СИ) (Фэнтези, Самиздат, сетевая литература)
04 11 Первая книга серия захватывает с первых страниц, потому что без предисловий герой, как и в серии книг из Покоривший Стену, просыпается уже в новом мире, в новой Игре. Так что амнезия на старте и изучение непонятного мира, ……… Оценка: отлично!
Belomor.canal про Маттиоли: Темные финансы. Неликвидность и авторитаризм на окраинах Европы [Dark Finance: Illiquidity and Authoritarianism at the Margins of Europe ru] (История, Экономика)
03 11 Впечатляет, что смогли провернуть шустрые македонцы, вместе с евродепутатами! "Скопье 2014" - евро откаты и как это делается в развитой демократии. Оценка: отлично!
Sello про Эшноз: Высокие блондинки [Les grandes blondes ru] (Иронический детектив)
03 11 Разве только что за неимением под рукой другой книги, более приемлемой для чтения, сойдет. Оценка: неплохо |
Комментарии
Re: Обработка дублей.
Зачем заливать? Можно восстановить удаленное. Насчет модерации не согласен - неудобно + много работы модераторам, которых сейчас нет и т.д. Что действительно нужно, если уж делать модераторов, то дать им(и только им!) возможность удаления книг навсегда. Зачем это надо? Есть авторы у которых написано 10 книг, а в удаленных 60+ Причем версии книги идут так: 1 версия --- добавлена анотация --- исправлена опечатка(одна) --- исправлена опечатка(еще одна) и т.д. Нафиг хранить все эти промежуточные вещи? Плюс появляются "доброжелатели", которые восстанавливают все подряд. Итог: каша на полке у автора.
Re: Обработка дублей.
Да-да-да! Я сама недавно только с 3-го раза "правильно" залила книгу. *краснеет*
Промежуточных два варианта никому не нужны.
Re: Обработка дублей.
Не знал. Спасибо. Работы, кстати, не так уж и много. Человек 5-10 вполне справятся. Думаю, что из числа постоянно заливающих книги, желающих быть модераторами наберется достаточно.
И восстанавливать уделенное не очень удобно. То что раньше в библиотеке была книга лучшего качества практически никто не знает и восстанавливать некому.
Re: Обработка дублей.
а что, резонно.
Re: Обработка дублей.
А может быть как-то присваивать "облизанным" вариантам статус незаменимых? Правда как это осуществить программно в Друпале не представляю.
Вот именно статусы "окончательного варианта" и можно было бы оставить модераторам. Или обратный вариант - под замену открыты только невалидные книги. Еще подумать надо. Вообще, задачка логистическая или управленческая, решения должны быть различными. В зависимости от степени ограничений, которые выставляются определенным группам пользователей.
Re: Обработка дублей.
Не знаю, реально ли тут что-то изменить. Сам вики-принцип формирования библиотеки не дает что-то сделать в этом плане. Иначе потеряем больше - затруднится заливка. Наверное, надо заливающим иметь больше ответственности. Дублей, действительно, море. Другое название, другой жанр... И вот вам новая книга, а по сути - та же самая, но хуже. И главное, люди ведь это делают не со зла, а считают, что помогают библиотеке :(. Предложение Ларину: при заливке книг сделать крупное, яркое сообщение - предупреждение, типа: А вы уверены, что заливаемая вами книга отсутствует в библиотеке? А вы уверены, что ваша версия лучше, чем имеющаяся в библиотеке? А модераторы - это несерьезно, увы.
Re: Обработка дублей.
Это не вариант. Я сейчас правлю поэзию - она полностью не отформатированная, зато формально валидная. :-(
Да и "простые" книги, прошедшие валидацию, не всегда могут получить статус "окончательного варианта". Так что валидность не может быть критерием.
Re: Обработка дублей.
"Приходите и модераторствуйте над нами!" - за такие неприличные предложения нужно банить :)
Можно посылать уведомления "залитая вами книга n1 заменена на n2", вывесить на видном месте список удаленных и замененных книг, помечать заведомо валидные книги, и т.д. То есть, следует соблюдать принципы wiki, раз уж взялись.
С этой задачей и простенький скрипт прекрасно справится. Когда понадобиться свободное место на диске.
Re: Обработка дублей.
Отвечу своей собственной цитатой:
Свободное место - последнее что меня волнует. Я же не говорю: давайте уберем возможность "удаления" книг пользователями. Я говорю: давайте выберем групу модераторов и дадим им возможность окончательного удаления промежуточных версий книг.
Не обижайся, но это маразм. Заливается и правится огромное количество книг ежедневно(около двух сотен, а иногда и больше).
Re: Обработка дублей.
И это тоже проще решить техсредствами.
Ну, и?.. Пара модераторов с этим справятся лучше пары сотен добровольцев?.. Не обижайся, но это не меньший маразм :)
Re: Обработка дублей.
Не знаю, как насчёт модераторов - не думала над этим вопросом, да и не чувствую (пока?) необходимости, но вот против рассылки я была бы категорически против.
Тут не получается отписаться от уведомлений об ответах из форума (кстати, кто-то знает, как это сделать?), а если к ним ещё добавятся уведомления о перезаливке книг, то вообще придётся заводить отдельный почтовый ящик только для этих целей. :-(
Представьте себе, что будет делаться у людей, заливающих регулярно книги. УжОс!
Re: Обработка дублей.
На ifolder.ru файлы заливать не доводилось? :)
Почтой слать уведомления совсем не обязательно. Можно в "личку". Можно (и нужно!) сделать страничку персональной статистики по залитым книгам... Само собой разумеется, юзер должен иметь возможность все это отключить.
Re: Обработка дублей.
Нет. А шо, страшно? ;-)
Re: Обработка дублей.
Нудно. Очень неудобный, для тех заливает, обменник.
А никто и не должен эту страничку видеть, кроме самого юзера.
Э... А как их проверять-то? Создадим СБ Либрусека? :)
Меня лично вполне бы устроил и чекбокс "показывать 'сомнительные' книги".
Re: Обработка дублей.
Держать на сервере любую информацию о том кто сколько какого копирайта залил - мягко говоря, нежелательно.
Re: Обработка дублей.
Ну, мне вот, мягко говоря, пофиг. А для кого опасно - тот конечно должен иметь возможность все это отключить.
Re: Обработка дублей.
Да мне как бы тоже пофиг... пока повестка не пришла ;-) (плюет по три раза через все плечи и стучит по всему деревянному - голова, естественно, отзывается глухой болью)
Но мне так кажется что это и для Ларина нежелательно.
И вот кстати попутная мысль - а нельзя ли сделать такой скрипт (локальный на клиенте, как Ваши пользовательские) который бы держал список залитых мною книг - но не на сервере, а на моем компе?
Хотя я пока и не вижу зачем (ну кроме тщеславие почесать) мне такой список был бы нужен... но все равно хочется. Не так чтобы сильно, правда. Я все равно держу в отдельном директории копии залитого.
Re: Обработка дублей.
* задумчиво смотрит на значки мюторрента и емула в трее *
Книжки, говорите?..
Ларину, пожалуй, тоже пофиг. Руки у ебук-копирастов (как звучит!) коротки.
Тогда уж лучше делать нормальный upload manager, на языке уровнем пониже скриптов.
Re: Обработка дублей.
*весело смотрит на зелененький индикатор Флешгета, качающего в двадцать четыре горла очередные хай-дефинишн кинухи с рапиды*
А мы пирингом не занимаемся. Соответственно, и не распространяем. Так что прихватить нас за выступающие части тела совсем не так легко.
Не знаю. Может быть. Я бы на его месте, все-таки, не держал на сервере информацию о том кто что залил.
Ну это явно оверкилл, задача того не стоит.
Re: Обработка дублей.
Ай-яй-яй! Задумайтесь - откуда на рапиде киношки берутся?.. Может, как раз я ее туда и залил? ;)
Как сказать... У JavaScript есть такой недостаток: максимальный размер cookie ~4Kb. Какие уж тут списки файлов...
Впрочем, попробую поиграть с относительно новой фичей "Local Storage" (~60Kb). Посмотрим, что из этого выйдет.
Re: Обработка дублей.
Как - откуда?! Самозарождаются, конечно. Как булки на деревьях.
Re: Обработка дублей.
Логично. И чего к нам защЫтники копирайтов цепляются?..
Re: Обработка дублей.
Я так думаю что исключительно из врожденной вредности.
Re: Обработка дублей.
О-о-о! Так ты тоже из Ксанфа? :D
Re: Обработка дублей.
это что такое?
королевство тёмных эльфов или павильон для уничтожения ядерных отходов?))))))))))
просто звучит немного пугающе название))))))
Re: Обработка дублей.
Энтони Пирс, серия "Ксанф", на русском читал 20 книг. Хотя написано для детей (в основном), но вполне доступно и взрослым :)
Re: Обработка дублей.
согласен, страничка статистики по всем книгам которые я заливал или правил - супер!!
типо watchlist'a на википедии =)
Re: Обработка дублей.
Цитируя pkn: ....мягко говоря, нежелательно.
Re: Обработка дублей.
Все это решается просто: книги отправляются в список не автоматом по факту заливки, а вручную. Если я хочу следить за данной книгой - жму на кнопку "наблюдать" (сейчас я пользуюсь для этой цели книжной полкой, но это не очень удобно). Конечно, наблюдать можно не только за теми книгами, которые залил сам.
Re: Обработка дублей.
отличная идея!!!! мне бы такое в голову никогда не пришло)))
кстати, у меня вопрос, эту случайно не ты в вычитке переводила отсканенные книги djvu в fb2? можно попросить тебя то же самое сделать с одним учебником??
Re: Обработка дублей.
Если ты о "1189 годе", то у меня был текстовый файл из другого источника. А что за учебник? Если в нем много иллюстраций и формул, лучше оставить в djvu, мне кажется.
Re: Обработка дублей.
я не о нем.
у мну есть учебник польского, но там нет ocr слоя.
я хочу оставить книгу в djvu, но!
1. я не знаю как добавить ocr слой
2. не знаю как сделать оглавление
обяснишь?)
Re: Обработка дублей.
Неа, сама не знаю.
Re: Обработка дублей.
Да... Да. Да!! Не нужно хранить на сервере ничего лишнего. Как сказал О. Бендер, - "уберите фотографа, он мешает моей шахматной мысли" ;) А мы тут не междупланетный турнир устраиваем, а всего лишь... Ну, да ладно, все и так знают. Что я заливаю, например, на рапиду, я оставляю у себя в виде ссылки. Там и адрес, и код удаления. И довольно.
Re: Обработка дублей.
Re: Обработка дублей.
Сам не разобрался. :( Пришлось изменить почтовый ящик в настройках на - теперь "спам" с либрусека не доходит.
Re: Обработка дублей.
блин, вот что значит глючный интернет :( Тройной пост
Re: Обработка дублей.
Мне придёт ТРИ уведомления. В-)
Re: Обработка дублей.
Я борюсь с этим путем максимального повышения терпения и максимального понижения нетерпения. Килкнул на "отправить" - оно му-му... му-му... му-му... тогда я не кликаю второй-третий раз, а перехожу к другим делам. Минут через десять возвращаюсь, рефрешу страничку в другом окне - как правило, пост появляется.
Re: Обработка дублей.
Что-то много воды... Вопрос к занимающимся оцифровкой и прочими премудростями, в просторечии именуемыми созданием электронных книг:
Насколько точно можно определить правильность книги и вообще, возможно ли это?
Какие критерии нужно использовать при таком отборе?
Если ответ отрицательный, то никаких рычагов управления, кроме жесткого администрирования (абсолютно не соответствует модели ресурса) не вижу.
Если "правильность" книги поддается определению, (кстати, можно увязать с проектом вычитки - уж там-то должны по определению получатся наиболее правильные варианты), напрашивается введение для таких книг введение статуса "Finish", который не позволяет удалить или заменить данный вариант без снятия статуса. Модераторы не нужны, просто установкой статусов и дальнейшей правкой статусных произведений будет заниматься группа вычитки и коррекции.
Окончательное удаление остается в руках Ларина - слишком серьезные права. Если группа вычитки будет работать и будет достаточно обширной - через некоторое время появится вполне приличная по объему вполне "правильная" подборка.
Еще один плюсик - в подборке будут в основном новинки и наиболее популярные произведения.
А дубли пусть существуют. Пока не стоит вопрос нехватки места, они не очень мешают. А вот статус позволит читателю отобрать из нескольких дублей тот, который наиболее близок к совершенству.
Могу ошибаться, или не видеть каких-то очевидных проблем. Может кто-то подскажет другое решение по данному вопросу...
Re: Обработка дублей.
Во-вторых, заливалка новых книг всегда бодро рапортует "дубль найден и удалён", а должна смотреть и на ebookdownloader'ность с fb2fix'ностью, и на номер версии (отказываться заменять более древнюю на более свежую, версией 1.0 вообще никакую не замещать, версии >= 2 не заменять никакими), и только если заливаемая свежЕе - тогда, так уж и быть, пусть выводит дубля и предлагает между ними выбрать.
В-третьих, при просмотре книги (и даже при наведении мыша на линк на книгу - по крайней мере, при поиске и просмотре обновлений) неплохо бы сообщать ID и номер версии документа, ник его автора и дату заливки. (Часть этой информации можно получить на странице исправления книги, но не всю и это не сильно удобно.)
Re: Обработка дублей.
Можно попробовать такой вариант до кучи:
1) Составить список признаков, явно отличающих более сложное форматирование книги от более простого
(заголовки, эпиграфы, стихи, цитаты, сноски и проч)
2) Наличие/отсутствие признаков ebookdownloader'ности с fb2fix'ностью
3) Размер
4) Картинки-обложки
5) Аннотации
6) Валидность
При попытке менять книгу со сложным форматированием на вариант плэйн-текста - отказывать.
Re: Обработка дублей.
по моему это довольно сложно воплотиьт, чтобы при заливке каждой книги такое делалось...
Re: Обработка дублей.
Помоему, все ушли не в ту степь.
Самый простой вариант, прикрутить оценки качества к книгам.
Книги с неким количеством проголосовавших, но получившие сумму оценок ниже определенного уровня, автоматом пусть убираются в спойлер "Книги сомнительного качества".
Пройдет время и библиотеке будет красота (но тут уже от читателей зависит).
А удаление всеми желающими - зло.
Re: Обработка дублей.
люди и самой книге ставят оценки не очень активно, а вот качеству книги совсем мизерное число будет((((
пусть лучше ларин обратно приделает поиск дублей по id книги.
теперь оно не работает((((((((((
папки "удалённые" и "дубли"
В контроле за удалением есть здравый смысл. Например, приходит какой-то поц с литреса и удаляет книги. В связи с этим предлагаю следующее. Удалённые книги должны лежать в особой папке "удалённые". Такая папка есть на целом ряде почтовых серверов. Файлы в предложенном варианте из папки "удалённые" пользователи удалить не могут, но могут при необходимости восстановить. Если файлы не восстановили в течении какого-то срока, скажем, недели с момента удаления, тогда они удаляются автоматически. Возможно, что есть смысл и в аналогичном контроле сверки дублей. Дубли при этом удаляются окончательно, а отправляются в папку "дубли", если их не затребовали назад на повторную сверку в течении недели - удаляются автоматически.
Re: Обработка дублей.
Возможно, следует делать так: Заменять/удалить книги не сразу, сделав предварительный опрос пользователей. Если какой-либо юзверь решил заменить/удалить книгу, то это происходит не сразу, а оба варианта помещаются в некий лист опроса: "Пользователь такой-то предлагает заменить книгу такую-то". Причина (заполняется инициатором) "более качественное форматирование" (допустим). И рядом голосовалка в простейшем виде. Любой, всяк сюда входящий, сможет просмотреть бегло оба варианта и голосовать "Да"/ "Нет". По итогам n дней книга автоматически заменяется/удаляется. Это защитит библиотеку от чистильщиков с литреса и просто неадекватных пофигистичных ламеров.
От дублей можно оборонятся аналогично "Пользователь такой-то предлагает добавить автору такому-то произведение такое-то". И рядом голосовалка Хотим/Не хотим/Это дубль/. В случае победы по п 3 книга попадает автоматически в опросник замены.
Библиотека выгодно отличается от Википедии в том, что там для того чтобы сделать вывод о качестве / правильности статьи надо обладать специальными знаниями. Здесь же большинство может все-таки отличить разницу между текстами.
Для экономии результат голосования выкладывать рядом с голосовалкой, чтобы, например, при подавляющем "за" люди не тратили время на сравнивание.
Ну если такой механизм не защитит, то уж, звиняйте, ничего не поможет, тогда и жаловаться нех.
Re: Обработка дублей.
У Крайтона Майкла есть дубли романа Крылья
Научная Фантастика Детектив
- Крылья 1118K
Триллер
- Крылья 676K
Первый нужно удалить; плохо отформатирован, без обложки.
Как или кто это сделает? ;-)
Re: Обработка дублей.
это под каждому из пользователей =)
надо просто нажать: исправить и объединить с другой книгой
Re: Обработка дублей.
Т.е. беру неправильную книгу, исправляю и объединяю с правильной? неправильная удалится?
И в чём отличие от просто "удалить"?
Страницы