удаление "двойников"

Аватар пользователя Антонина82
Forums: 

Когда я объединяю писателя, часто возникает ситуация, что одно и то же произведение, но в разное время залитое (один формат fb2), появляется в списке. Программа предлагает мне удалить худший экземпляр. Но поскольку я не обладаю багажом знаний в создании электронных книг, то по короткому вопроснику не могу судить, какой вариант лучше. Для начала список
Бойлен Клер «Эмма Браун»
Наменский Артём «Недра»
Норвилл Мэннинг - "Шаар - скиталец будущего"
Олдисс Брайан Уилсон - "Беспосадочный полет"
"Долгие сумерки Земли"

Янссон Туве - "Волшебная зима"
"Маленькие тролли или большое наводнение"

Брумель Валерий - "Не измени себе"

Наличие в библиотеке двух ОДИНАКОВЫХ книг ни к чему.Наверное, будет лучше, указывать в этой теме о наличии "двойников", а продвинутые пользователи библиотеки будут решать какой экземпляр оставить.

Аватар пользователя tvnic

http://lib.rus.ec/b/7364

http://lib.rus.ec/b/78409
Тексты идентичны вплоть до ошибок. Первая - в оригинальной серии, вторая - непонятно откуда, но структура книги правильнее.
В данный момент правлю книгу и наполняю дескрипшен. Мое мнение - удалять надо вторую, но в то же время создать связь автора (Росс Томас) с псевдонимом (Оливер Блик).

Аватар пользователя s_Sergius

Оставлять нужно как раз вторую, потому что первая: http://lib.rus.ec/b/7364 — бесструктурная rusec’овская версия.

Аватар пользователя tvnic

Какая из них останется, вместо нее и залью новую версию. Со структурой, наполненным дескрипшеном, обложкой и исправленными ошибками разбивки текста на абзацы, которых в такой малой по объему книге ну очень много.

Аватар пользователя PrePress


Это не дубли. Для такой книги djvu-вариант — совсем не лишний.
Аватар пользователя s_Sergius

Сонячна написал:

Двойники:
http://lib.rus.ec/b/178986
http://lib.rus.ec/b/166517


А кто из них лучше? Без знания языка определиться несколько проблематично.
Аватар пользователя s_Sergius

А Вы сами-то отчего их не объединяете? Ничьего разрешения для этого не нужно.

Относительно некоторых этих "дублей" есть кое-какие сомнения... Кроме того, таким образом я хотела "наябедничать" на пользователей, которые при уже имеющихся нормальных книгах в фб2, тащат всякую "дрянь" в библиотеку.
Ех, отработаю свой список сама.

Аватар пользователя s_Sergius

Сонячна написал:
Кроме того, таким образом я хотела "наябедничать" на пользователей, которые при уже имеющихся нормальных книгах в фб2, тащат всякую "дрянь" в библиотеку.

Это можно сделать и после объединения. Ни "удаленные", ни "замененные" книги никуда же на самом деле не исчезают. И ссылки на них продолжают работать.

И сразу возникли вопросы:
1) есть книга в форматах: и в фб2, и в рдф, и в djvu - и все они включают рисунки (аж 8 иллюстраций). Оставлять только фб2?
2) есть книга фб2 и рдф (иллюстраций нет, файл фб2 - отличный, с авторскими курсивами и т.д.). Оставлять только фб2?

Аватар пользователя s_Sergius

Если fb2 отличный, то его и оставлять. Если не очень, то и djvu/pdf (OCR) желательны. Для будущей вычитки.
Но бывают книги с достаточно сложным оформлением, которое fb2 не в силах передать. Например, детские книги. Тут уж графические форматы просто необходимы.

Конечно, надо смотреть в каждом случае конкретно. Но если Вы делаете объединения не с бухты-барахты, а обоснованно, то никто ничего против иметь не будет. В конце концов, если что не так, всегда можно восстановить status quo.

Только что заливала книгу "Шахматный самоучитель" Авербаха,с первого раза почему-то полностью не загрузилась книга,пришлось повторить.
Уважаемые библиотекари,плиз,уберите брак.)

Аватар пользователя laurentina1

А сами? Объедините брак с хорошим файлом просто

УПД: А проверить поиском перед заливкой религия не позволила? http://lib.rus.ec/b/252795
Мало того, что дубль, так сразу и 2 дубля, да еще и новый автор Львович Юрий Авербах, вдобавок к имеющемуся http://lib.rus.ec/a/84495
Убедительно прошу вас, ппроверяйте поиском и по автору и по названию перед заливкой, а то это чревато присвоением статуса Вандал

Кто-то залил дубли http://lib.rus.ec/b/410891 и еще http://lib.rus.ec/b/410890

И лучше ли они имеющихся книжек http://lib.rus.ec/b/92896 и http://lib.rus.ec/b/110951 ?

Вроде бы новые варианты получше, хотя в http://lib.rus.ec/b/410890 свои привнесенные недостатки есть.
Объединил в пользу новых.

В новинках увидел книгу http://lib.rus.ec/b/411391, решил конвертировывать, но гложут сомнения. В указанном rtf 10 глав (изданная?). В книге http://lib.rus.ec/b/211251 17 глав, но указаны два других автора. Текст не совпадает, видно что переделывался.

Аватар пользователя XtraVert

Очередная самиздатовская графомань наихудшей разновидности. Попробуйте разобраться на их СИ страничках
http://samlib.ru/r/remez_e_p/ и http://samlib.ru/c/cailin/

http://lib.rus.ec/b/413471
http://lib.rus.ec/b/413564

Осложено тем, что записаны на разные фамилии (одна на настоящую, другая на псевдоним).
Насколько различаются сами файлы, не проверял.

Аватар пользователя s_Sergius

kozlenok написал:
http://lib.rus.ec/b/413471
http://lib.rus.ec/b/413564

Осложено тем, что записаны на разные фамилии (одна на настоящую, другая на псевдоним).
Насколько различаются сами файлы, не проверял.

Оставил более поздний (правленный) вариант, но автора указал как было в первоисточнике, т.е. И.В.Можейко.

Аватар пользователя tvnic

Первый раз такое заметил - оптовый впрыск в библиотеку двойников: от http://lib.rus.ec/b/414930 до http://lib.rus.ec/b/414941. Или дубли или непонятные сборники из уже выложенных рассказов.
Сомневаюсь, что все это можно назвать помощью.

Аватар пользователя palla

http://lib.rus.ec/b/34780
http://lib.rus.ec/b/414931
Совпадает id, номер версии, название и автор.
Содержание кстати тоже...

Аватар пользователя tvnic

palla написал:
http://lib.rus.ec/b/34780
http://lib.rus.ec/b/414931
Совпадает id, номер версии, название и автор.
Содержание кстати тоже...

Тщательно все не проверял, но вроде почти всё является дублями (тексты, переводчики, издания). И не лень же кому-то было делать такое. Лучше бы добавили лишь одну не имеющуюся в библиотеке книгу.

Аватар пользователя s_Sergius

Все одиночные дубли, залитые этим же пользователем я удалил, а вот что делать с такими вот самопальными "сборниками", я не знаю. Посмотрим, что коллеги скажут.

Upd.
Нет больше этих "сборников"...

Аватар пользователя gav-m

Здравствуйте.

Нашел вот интересную тему, решил отметиться. Например: Война 2017. Мы не рабы! и Черный цвет Отличаются названием, набором опечаток, наличием эпиграфа, ну и, наверное, структурой fb2 документа: я сравнивал текст. Не умея оценить качество fb2 не могу выбрать наилучший вариант.
Попутно хотел бы спросить совета, как лучше выявлять подобные дубли. Т.Е. задача - сравнить 2 текстовых файла различной структуры. Как минимум - 2 fb2 файла, которые делали разные люди в разных редакторах. Как максимум - сравнение текстов разных форматов, например text/xml, text/html, text/plain.

Аватар пользователя s_Sergius

gav-m написал:
Здравствуйте.

Нашел вот интересную тему, решил отметиться. Например: Война 2017. Мы не рабы! и Черный цвет Отличаются названием, набором опечаток, наличием эпиграфа, ну и, наверное, структурой fb2 документа: я сравнивал текст. Не умея оценить качество fb2 не могу выбрать наилучший вариант.
Попутно хотел бы спросить совета, как лучше выявлять подобные дубли. Т.Е. задача - сравнить 2 текстовых файла различной структуры. Как минимум - 2 fb2 файла, которые делали разные люди в разных редакторах. Как максимум - сравнение текстов разных форматов, например text/xml, text/html, text/plain.

Как сравнивать тексты в разных форматах не представляю. А для сравнения fb2 использую программу Beyond Compare 3. Но часто сначала требуется отсечь несущественные отличия и привести их "к общему знаменателю". Например, приходится обработать оба сравниваемых файла парой-тройкой скриптов в FBE (сделать "генеральную уборку", привести кавычки к одному виду, убрать пустые строки в заголовках).

Если проделать эти мероприятия с вышеуказанной парой, то получается следующее.
Черный цвет — как и указано честно, авторский черновик с некоторым количеством опечаток.
Война 2017. Мы не рабы! — непонятно что. Текст получше, чем в черновике, но свои ошибки тоже есть. Похоже, что это не издательский текст, а правленный черновик, хоть там и стоят выходные данные и обложка.
Выбирать не из чего. Пусть побудут оба, наверное, пока не появится что-то более приличное.

Upd.
А для сравнения текстов в разных форматах, видимо, можно сначала выгнать всё в plain text, причесать их слегка, а потом уже и сравнивать с помощью всяких Beyond Compare 3, Compare It, WinMerge, DiffVue...

s_Sergius написал:

Upd.
А для сравнения текстов в разных форматах, видимо, можно сначала выгнать всё в plain text, причесать их слегка, а потом уже и сравнивать с помощью всяких Beyond Compare 3, Compare It, WinMerge, DiffVue...

Для сраванения текста в разных форматах (не fb2) можно использовать самый обычный MS Word. Он работает похуже, чем специализированные программы для сравнения, но работает! Лишь бы были конвертеры для этих сравниваемых форматов, ну и автоматическое распознавание формата для конвертирования тоже отключить нужно. Ну и понятно, что может потребоваться "приведение к общему знаменателю" -- в ворде сравнивание происходит по слишком многим параметрам, а это не всегда нужно.
Да, в Libre Office тоже есть нечно подобное, только работает еще похуже...

Доброго времени суток!
Сегодня была добавлена книга в epub (http://lib.rus.ec/b/415633) при уже имеющейся в fb2 (http://lib.rus.ec/b/130760). Текст в fb2, на первый взгляд, - вычитан и оформлен; в обоих случаях иллюстраций нет. Объединять их?

Сонячна написал:
Доброго времени суток!
Сегодня была добавлена книга в epub (http://lib.rus.ec/b/415633) при уже имеющейся в fb2 (http://lib.rus.ec/b/130760). Текст в fb2, на первый взгляд, - вычитан и оформлен; в обоих случаях иллюстраций нет. Объединять их?
Наверно, да. Калибря откалибрует из fb2 сделает epub. Раз иллюстраций нет, то вряд ли такой калиброванный epub будет сильно отличаться… Хотя, зная, что вытворяет Калибря с экспортом в fb2… Вроде надо, но не загубит ли Калибря epub так же, как она губит fb2?
Аватар пользователя remembecoventry

Zadd написал:
Калибря откалибрует из fb2 сделает epub. Раз иллюстраций нет, то вряд ли такой калиброванный epub будет сильно отличаться… Хотя, зная, что вытворяет Калибря с экспортом в fb2… Вроде надо, но не загубит ли Калибря epub так же, как она губит fb2?
А в библиотеке конвертит не калибря, а fb2epub от Lord KiRon. Никто не жаловался.
Аватар пользователя Evernet

Залили дубль Ромео с большой дороги. Отличается от Ромео с большой дороги отсутствием аннотации, слов в сносках: издательство «Эксмо».

Аватар пользователя XtraVert

Надо бы посравнивать...
"Повелители сумерек"
http://lib.rus.ec/b/245305
http://lib.rus.ec/b/334302
http://lib.rus.ec/b/407518

Аватар пользователя Антонина82

Мисс Свити http://lib.rus.ec/b/396604 и http://lib.rus.ec/b/392244
я бы оставила только литресовский вариант

Аватар пользователя Evernet

В литресовском варианте около 20 случаев разрыва слов: обив ки, помолв ке и т. п. Зато структура лучше.
Во втором файле вместо глав — стиль подзаголовок, т. е. оглавления как такового нет. Что важнее?

Цитата:
Что важнее?

Оставить литресовскую разметку, исправив при этом "разрывы слов" и прочее.

http://lib.rus.ec/b/68649
http://lib.rus.ec/b/321094

Не дает объединить из-за знака качества.

(кстати, неплохо бы это пофиксить - ведь в данном случае книга со ЗК не "затрагивается" - почему же тогда не дает? То же касается, например, прописи серии к книге со ЗК - тоже не дает, хотя собственно файл книги мы не затрагиваем в этом случае.)

Аватар пользователя laurentina1

Сняла ЗК, объединяйте

Аватар пользователя sem14

http://lib.rus.ec/b/423163 и http://lib.rus.ec/b/106830
Вижу, что проведена работа, но из-за 1251 кодировки - одни кракозябры.
Зачем только ублюдочный автор-дубль создан?

Двойники??? Вроде бы отличаются только обложкой и форматированием текста:
http://lib.rus.ec/b/38381 и http://lib.rus.ec/b/412950

Страницы

X