удаление "двойников"

Аватар пользователя Антонина82
Forums: 

Когда я объединяю писателя, часто возникает ситуация, что одно и то же произведение, но в разное время залитое (один формат fb2), появляется в списке. Программа предлагает мне удалить худший экземпляр. Но поскольку я не обладаю багажом знаний в создании электронных книг, то по короткому вопроснику не могу судить, какой вариант лучше. Для начала список
Бойлен Клер «Эмма Браун»
Наменский Артём «Недра»
Норвилл Мэннинг - "Шаар - скиталец будущего"
Олдисс Брайан Уилсон - "Беспосадочный полет"
"Долгие сумерки Земли"

Янссон Туве - "Волшебная зима"
"Маленькие тролли или большое наводнение"

Брумель Валерий - "Не измени себе"

Наличие в библиотеке двух ОДИНАКОВЫХ книг ни к чему.Наверное, будет лучше, указывать в этой теме о наличии "двойников", а продвинутые пользователи библиотеки будут решать какой экземпляр оставить.

Помилуйте, в первом файле одно произведение, во втором файле два произведения...

Два то два, но
- слеплено непонятно из чего.
- сам файл переделан из FB2 (Этот файл создан при помощи конвертера FB2EPUB версии 1.1.5.0 написанного Lord KiRon.).
- форматирование Аркадии уродливое, если делать FB2 то надо править весь текст вручную. Слипшиеся строки, разрывы строк, thomasina внутри абзацев. Проще эту поделку Калибри удалить, оставив лежащий рядом PDF с нормальным форматированием.

http://lib.rus.ec/b/599862 и http://lib.rus.ec/b/664171
Может, можно оставить только одну из?

la-stryge написал:
http://lib.rus.ec/b/599862 и http://lib.rus.ec/b/664171
Может, можно оставить только одну из?

Из старой добавить картинку в новую и можно обьединять.

Сделайте, пожалуйста, кто-нибудь. Я не умею.

Аватар пользователя Антонина82

Исправили

Антонина82 написал:
Исправили

Зря, картинка из старой еще не перенесена.

А вы не можете перенести? Мне кажется, вы в прошлый раз переносили..

http://lib.rus.ec/b/664373 и http://lib.rus.ec/b/664396 - можно объединить или сильно отличаются?

la-stryge написал:
http://lib.rus.ec/b/664373 и http://lib.rus.ec/b/664396 - можно объединить или сильно отличаются?

На первой книге нажимаете: Исправить\обьединить, вводите номер второй книги.
Получается страница http://lib.rus.ec/b/664396/join/664373 .
И смотрите разницу: первая - есть несколько ошибок ОСR, вторая - гигантская обложка (если её убирать, то размер упадет в 7 раз).

У меня нет "объединить", только исправить.
А как убирать обложки или добавлять картинки?

1. Что, на вкладке "Исправить" книги нет такого:
(объединить с другой книгой)
(загрузить другую версию)
(удалить)
??
2. Убирать обложки или добавлять картинки - в ФБ2-редакторе.

Картинка: 

Эти кнопки расположены ниже нижнего края принтскрина и не видны(

Спасибо. Я их наконец-то нашла.
Но все равно не уверена, что смогу оценить, что оставить, а что убрать.

"Рихтанул" обложку, скриптанул - добавил/объединил.

ProstoTac написал:
"Рихтанул" обложку, скриптанул - добавил/объединил.

Файл с картинкой 4 метра весит 6 метров. Убираем картинку - остается всего метр. Такая арифметика :)

"Убираем картинку..." - это Вы про обложку?

ProstoTac написал:
"Убираем картинку..." - это Вы про обложку?

Да, в FB2 картинки перекодируются. И если ложишь jpg, то внутри он лежит в другом формате. Поэтому такая разница в размерах.

Что за бред? Откуда такие измышления?
FB2 - не графический редактор, картинки/изображения НЕ перекодируются. Вставите в FB2-редакторе картинку в .jpg, так и останется - в .jpg, вставите в .png - так и останется в .png.
В каком размере вставите, в таком и будет.

ProstoTac написал:
Что за бред? Откуда такие измышления?
FB2 - не графический редактор, картинки/изображения НЕ перекодируются. Вставите в FB2-редакторе картинку в .jpg, так и останется - в .jpg, вставите в .png - так и останется в .png.
В каком размере вставите, в таком и будет.

Иллюстрации (PNG и JPEG) встраиваются прямо в XML, будучи представленными в кодировке Base64.
Base64 — стандарт кодирования двоичных данных при помощи только 64 символов ASCII. Алфавит кодирования содержит текстово-цифровые латинские символы A-Z, a-z и 0-9 (62 знака) и 2 дополнительных символа, зависящих от системы реализации. Каждые 3 исходных байта кодируются 4 символами (увеличение на ¹⁄₃). - Вики
Так что изображения все-таки перекодируются.
В отличии от Epub, который является контейнером-архивом с всякими разными файлами. ТС позволяет входить в Epub как в архив-папку.

Вы для начала вставьте СВОЮ картинку в СВОЙ ФБ2, посмотрите в каком разрешении и формате, а потом перечитайте недоделанную ВИКИ. Приведите пример - исходная картинка - та же картинка в файле фб2. То Вы путаете картинку/иллюстрацию с обложкой, то приплетаете Epub ни к селу ни к городу. Вас не поймешь, о чем пишете...

Счеты дать?
Видно же что сумма FB2 и графических файлов, вложенных в него, намного меньше объема файла FB2 с вложенными файлами.

Картинка: 

Смотрите - cover.jpg 4 482 566 байцт - о чем я и пишу далее. Только об этом, ни о чем о другом. На фига такое впихивать в фб2?
Речь идет не о том, откуда берется "лишнаяя" неучтенка, пропорциональная залитым графическим файлам. Речь идет о непомерно тяжелых обложках и иллюстрациях.

В файле /b/664396 литресовский "негр" prussol впихнул обложку (а не просто картинку) размером 2412Х1500 (HxW), естественно размером 4.5 Г. И это не в первый раз от литреса такое, бывает часто к 30 кБ тексту прилепляют 1Г (!!!) иллюстрацию. Кто может и умеет - "облегчает" обложку, кто не может и не умеет - заливает абы как есть...

ProstoTac написал:
В файле /b/664396 литресовский "негр" prussol впихнул обложку (а не просто картинку) размером 2412Х1500 (HxW), естественно размером 4.5 Г. И это не в первый раз от литреса такое, бывает часто к 30 кБ тексту прилепляют 1Г (!!!) иллюстрацию. Кто может и умеет - "облегчает" обложку, кто не может и не умеет - заливает абы как есть...

А может все-таки М. а не Г.?
У нас спор не об этом. При запихивании графических файлов в FB2 происходит не преобразование графических файлов (с изменением размеров\битности\формата\кодера сжатия и т.д.), а перекодирование самой информации.
По поводу Литреса - каждый зарабатывает как может... Посмотрите на Либрусеке Белинского - рецензии на пару абзацев с обложкой кило на 150...

Правильно, у нас спор не об этом. Мне все равно, происходит перекодирование в ASCII или нет или куда/во что в каком виде кодируются/сохраняется ВНУТРИ фб2 файла графическая информация. Мне не все равно размер обложки/изображений. Если обложка .jpg размером 4.5 Г впихивается в ФБ2 файл, то она такой и остается - .jpg и такая же по размеру, о чем честно сообщает декскрипшен, а в режиме коды - тег binary id="cover.jpg" content-type="image/jpeg". И если Вы ее выковыряете из ФБ2 файла, то она и останется такой же - размером 4.5 Г формата .jpg.
И такое несоблюдение правил не есть хорошо...

http://lib.rus.ec/b/206223 (названа по части) и http://lib.rus.ec/b/364421

Тут все такие умные...
Читал пост, не понял о чём спор... Да и не хочется вникать Но гражданину Prostotak'у хочу сказать... Уменьшать размер обложки дело конечно благородное (только идиоты "кладут" обложку, которая "весит" в 50 раз больше текста), НО ты умножаешь сущности... физически (в архивах) на жестком диске остается и исходный файл, и твой, правленый. Толку от твоих правок - никакого! Люди которые не понимают - им пох... 1 MB файл книги или 6 MB. Меня больше всего БЕСИТ, что ты уменьшая "вес" обложки, уменьшаешь и его размер в пикселах. Задрало уже смотреть на твои "почтовые марки" вместо обложек! Не знаком с Photoshop'ом или сам читаешь книги на кнопочном телефоне?? При выборе, что оставить у себя на диске, выбираю исходники. Твои правки выкидываю нахрен. Через несколько лет размер обложек, которые ты втюхиваешь будут раздражать всех читающих книгу.

"Задрало уже смотреть на твои "почтовые марки" вместо обложек!"
1. Вам шашечки или ехать? Вы читать или обложки смотреть?
2. При уменьшения "веса" обложки руководствуюсь правилами:
Обложка и 2-я картинка должны быть размером 720х468, причем 468 может быть больше или меньше, картинки не надо растягивать и подгонять под размер; обложка в цвете, размер не более 150Кб.
3. Какой толк от моих правок не Вам судить, Вы не в теме.

Конечно "не в теме" я же не идиот править каждую вторую книжку в библиотеке, чтобы их в два раза больше было. Займись правкой книг с ID от 000001 до 170000. Там тебе больше "раздолья". Обложки добавь...

А насчет"шашечек"... Книга должна быть красивой. А то и у Машкова можно читать в .TXT формате... Все стремятся к лучшему!

ortwone написал:
А насчет"шашечек"... Книга должна быть красивой. А то и у Машкова можно читать в .TXT формате... Все стремятся к лучшему!

Да, да... И лепят на СИ-датовское добро самопальные обложки, с повторяющимися на 90 % картинками. Хороших художников намного меньше чем мазил, владеющих фотошопом.
Меня больше прикалывает на СИ висит и издательская серия и издательская обложка.

ortwone написал:
Тут все такие умные...
физически (в архивах) на жестком диске остается и исходный файл, и твой, правленый. Толку от твоих правок - никакого! Люди которые не понимают - им пох... 1 MB файл книги или 6 MB.

Архивы жестком винте где лежит сайт, или архивы Либрусека расползающиеся по Сети?

и там - и там. Что значит - "расползающиеся"? Это официальные архивы библиотеки, для тек кто "в теме"...

ortwone написал:
и там - и там. Что значит - "расползающиеся"? Это официальные архивы библиотеки, для тек кто "в теме"...

Для тех кто в теме, есть в Сети архив Либрусека, в котором удаляются дубли. Т.е. он наиболее приближен к образу сайта на текущий момент.

Lyka написал:
Для тех кто в теме, есть в Сети архив Либрусека, в котором удаляются дубли. Т.е. он наиболее приближен к образу сайта на текущий момент.
Для тех, кто в теме, такого архива нет. Есть архив Либрусека с fb2-файлами, есть с не-fb2-файлами. В программе (например, MyHomeLib) можно указать опцию, Показывать или НЕ показывать старые версии книг, но физически вы их всё равно скачиваете, просто они будут "скрыты", но это "скрытие" всегда мжно отменить и тогда будете видеть все версии.

Zadd написал:
Lyka написал:
Для тех кто в теме, есть в Сети архив Либрусека, в котором удаляются дубли. Т.е. он наиболее приближен к образу сайта на текущий момент.
Для тех, кто в теме, такого архива нет. Есть архив Либрусека с fb2-файлами, есть с не-fb2-файлами. В программе (например, MyHomeLib) можно указать опцию, Показывать или НЕ показывать старые версии книг, но физически вы их всё равно скачиваете, просто они будут "скрыты", но это "скрытие" всегда мжно отменить и тогда будете видеть все версии.

Подсказываю: ищите торрент "Библиотека Либрусек (lib.rus.ec) + Libruks(19 ноября 2018 г.) - книг в архивах 344.526"... Размером 201.68 GB вместо 231.32 GB в "Библиотека Либрусек по состоянию на 2018-11-30 11:27 + MyHomeLib (2018) [FB2] | Официальная".

Lyka написал:
Подсказываю: ищите торрент "Библиотека Либрусек (lib.rus.ec) + Libruks(19 ноября 2018 г.) - книг в архивах 344.526"... Размером 201.68 GB вместо 231.32 GB в "Библиотека Либрусек по состоянию на 2018-11-30 11:27 + MyHomeLib (2018) [FB2] | Официальная".
Он оно чо, Михалыч! уже и такая появилась! Странно, на официальном трекере
http://trec.to/tracker.php#results написал:
не найдено
в отличие от Библиотека Либрусек (lib.rus.ec) + MyHomeLib. Только FB2.. Т.е. это какая-то самоделка, которая то ли будет поддерживаться, то ли нет, в отличие от официальной. Да и разница в размерах какая-то несерьёзная, я ожидал большей. Не стоит из-за такой ерунды скачивать самоделку, лучше уж официальную.
Кстати, оказалось, что есть и официальная раздача всего Либрусека всех типов файлов

http://lib.rus.ec/b/166725 восстановите, объединили с другой серией
http://lib.rus.ec/b/626671 http://lib.rus.ec/b/665027
Посмотрел Дюма...
Дублей масса... Например: http://lib.rus.ec/b/646940 с указанной серией 28 том из 87 и иллюстрациями в сером; http://lib.rus.ec/b/437436 слитый из двух томов, не соответствует бумажному и картинки загнаны в чб и вроде как вычитывался, http://lib.rus.ec/b/72668 отдельно том 1 и есть второй.
/
http://lib.rus.ec/b/665395 http://lib.rus.ec/b/639021
http://lib.rus.ec/b/652387 http://lib.rus.ec/b/609425

565426 и 220637. 565426 явно лучше, но на 220637 стоит знак качества (что вообще странно)), и объединить не удается.

http://lib.rus.ec/b/467696 http://lib.rus.ec/b/666442
http://lib.rus.ec/b/666443 http://lib.rus.ec/b/99971
http://lib.rus.ec/b/650158 http://lib.rus.ec/b/650173 два варианта со своими ошибками распознавания.
.
http://lib.rus.ec/b/131330 http://lib.rus.ec/b/283747 и есть еще переделка в рпг

http://lib.rus.ec/b/571378 http://lib.rus.ec/b/667473 название слегка разное и отличие в заголовок - цитата

Разные издательства, разный год издания, разные обложки - формально НЕ дубли.

ProstoTac написал:
Разные издательства, разный год издания, разные обложки - формально НЕ дубли.

Одна - издательская книга, вторая слепленная Литресом.

Разный ISBN - ergo уже разные издания. Ну и что, что одна книга не литресом слеплена? Литрес, не литрес - не имеет значения...

А давай зальем все советские издания Жуля Верна... Их немного, до 600-т не дотянет, в большинстве отличаются только обложками...
Или же пост-советские издания "Анжелики"...

Кроме текста книги, ИМХО, имеют значение также: (а) иллюстрации, (б) предисловие, (в) послесловие. Например, из 10 предложенных вариантов книги подчас хочется скачать именно тот, который ты помнишь с детства - именно с теми картинками...

Вот именно об этом и речь. Сейчас Литрес берет произведение поставил одну обложку - запихнул в одну серию, поставил другую - запихнул в другую, поставил третью - запихнул в третью. Больше отличий нету.
А то и версия Литреса оказывается урезанной по сравнению с бумажной. Меньше иллюстраций или берется невычитанный вариант. Пишут "изготовлено из издательского текста" - писали-бы прямо "написано в авторской редакции русского языка"...

Все, что Вы перечислили в данном конкретном случае - "http://lib.rus.ec/b/571378 http://lib.rus.ec/b/667473 название слегка разное и отличие в заголовок..." к делу не относится.
И вообще - Вы о дублях или о том, какие "поделки" делает литрес?
"версия Литреса оказывается урезанной по сравнению с бумажной" - берите бумажную и исправляйте.
"Меньше иллюстраций или берется невычитаный вариант" - берите бумажную и исправляйте.
"Больше отличий нету" - ищите поглубже - я Вам не раз указывал на наличие отличий.

Страницы

X