удаление "двойников"

Аватар пользователя Антонина82
Forums: 

Когда я объединяю писателя, часто возникает ситуация, что одно и то же произведение, но в разное время залитое (один формат fb2), появляется в списке. Программа предлагает мне удалить худший экземпляр. Но поскольку я не обладаю багажом знаний в создании электронных книг, то по короткому вопроснику не могу судить, какой вариант лучше. Для начала список
Бойлен Клер «Эмма Браун»
Наменский Артём «Недра»
Норвилл Мэннинг - "Шаар - скиталец будущего"
Олдисс Брайан Уилсон - "Беспосадочный полет"
"Долгие сумерки Земли"

Янссон Туве - "Волшебная зима"
"Маленькие тролли или большое наводнение"

Брумель Валерий - "Не измени себе"

Наличие в библиотеке двух ОДИНАКОВЫХ книг ни к чему.Наверное, будет лучше, указывать в этой теме о наличии "двойников", а продвинутые пользователи библиотеки будут решать какой экземпляр оставить.

Аватар пользователя ProstoTac


Это все разные издания. Имеют право быть в библиотеке ВСЕ представленные файлы. И в первом и во втором случае.
Аватар пользователя ProstoTac

b/623431 и b/154725 - одно и тоже издание, но во втором случае обложка "левая."

Трилогия http://lib.rus.ec/b/550864 и отдельные романы http://lib.rus.ec/b/175103 http://lib.rus.ec/b/175104 http://lib.rus.ec/b/175105
первая - не соответствует бумажной книге, поделка типа Сундуковской, отсутствует послесловие.


Для оригинальной издательской серии (кроме целиком оригинальных изданий и издательских дублей-компиляций) характерны предисловия\послесловия\статьи.
Если они присутствуют в файле - оставлять. Если простая компиляция из готовых - объединять!

ProstoTac написал:

Это все разные издания. Имеют право быть в библиотеке ВСЕ представленные файлы. И в первом и во втором случае.

http://lib.rus.ec/b/592786 оригинальное издание http://lib.rus.ec/b/156358 - кусок от сборника

http://lib.rus.ec/b/436348 и http://lib.rus.ec/b/607516
В каждом из дублей — свои ошибки OCR, по нескольку десятков.
Не заменить ли обе книги исправленной?

Аватар пользователя W_Z

на страничке Д. Гранина выложены 2 файла (скан журналов "Роман-газета") с романом "После свадьбы":
http://fb4.online/b/596880
http://fb4.online/b/596881

я вычитал из и счёл нужным объединить тексты в один файл, т.к. оригинальный роман никакого разбиения на две книги не имеет. просто из-за ограниченности объёма журнала текст вынуждены были поделить, прчём поделили посредине 2 части: первый журнал оканчивается 4 главой, второй начинается 5 главой.

залил объединённый файл:
http://fb4.online/b/642021

хотел удалить исходники, но сам не решился. но полагаю, что это надо сделать.

спасибо

В описанном Вами случае сохранение доступа к «исходникам» полезно: при подозрении на ошибку в FB2 сохраняется возможность свериться с «честным» (без текстового слоя) PDF. Физическое удаление (с освобождением занятой книгами дисковой памяти) , как я понимаю, рядовым юзерам недоступно.
С «Таинственным джентльменом» иной случай. Несовпадающие ошибки версий, конечно, легко вылавливаются сравнением дублей. Для качественного обнаружения бесспорных совпадающих ошибок понадобится уже сплошная вычитка текста. Даже если предположить, что таких общих ошибок нет (хотя почти всегда есть незамеченные неисправности печатного издания), для уверенного исправления сомнительных мест нужна бумажная книга или «честный» скан.
Вот и возникает вопрос: тратить ли время и ресурс памяти на добавление к двум кое-как вычитанным третьего файла, тоже несовершенного? При том что Макфи — даже не Гранин: по крайней мере этот ее роман (волею издателя незаслуженно попавший в разряд исторических),— мягко говоря, маловысокохудожественный.
P. S. В истории версий книги http://lib.rus.ec/b/642021 ошибочные строки:

<p>v.1.0 — ?</p>
<p>v.3.0 — ?</p>
Аватар пользователя W_Z

Александр, я, честно говоря, не очень понял про "Таинственного джентльмена" и сравнение какой-то Макфи с мастером Граниным.
когда я вычитываю, это значит, что я ЧИТАЮ текст книги, а не запускаю програмнную проверку орфографии. и, при отсутствии бумажного варианта, правку делаю лишь там, где однозначно вижу ошибку.
(эх, жалко раньше не выложили pdf романа! в fb2-файлах фамилия одного героя практически 50/50 значилась где Шуйский, где Шумский. пришлось специально сходить в читалку ЦБ и глянуть. таки Шумский.)

Александр Лагода написал:

P. S. В истории версий книги http://lib.rus.ec/b/642021 ошибочные строки:
<p>v.1.0 — ?</p>
<p>v.3.0 — ?</p>

а я не знал, как поступить.
история в оригинале вообще отсутствовала. но версия проставлена 2.0. пришлось пофантазировать. неужели грех мой потянет на 10 лет с конфискацией? ;)

Олег, еще один страшный грех — офтопик. Но другого места для ответа не вижу.
1. Заниматься вычиткой-ЧТЕНИЕМ нетленки «какой-то» (как Вы правильно ее оценили) Макфи мне не в кайф, а без такой вычитки,— да еще и не сверяясь с бумажной книгой или сканом,— объединить дубли в пользу какого-то одного затруднительно. Потому и написал о проблеме в расчете, что найдется энтузиаст — поклонник этой Макфи, который взялся бы за вычитку-чтение по бумажной книге или скану.
О том, что без бумажной книги или скана в некоторых случаях не обойтись, свидетельствуют такие примеры:

Цитата:
К полуночи в Блэклоке воцарилась гробовая тишина. Доносился лишь шорох ветра по стеклу да легкий всплеск воды. Все, должно быть, уже в постели. Все, кроме Фиби, которая отбросила от себя платок, взяла свечу, украдкой спустилась на несколько ступеней вниз, перегнулась через перила и вгляделась в темный коридор внизу. Слабое мерцание света свидетельствовало о том, что Хантер у себя в кабинете. Она с облегчением вздохнула и поднялась обратно по лестнице.

В дубле http://lib.rus.ec/b/436348 после первого предложения — абзац. Как правильно?
Еще пример.
Цитата:
Она уже направилась к лестнице, но Хантер вдруг схватил ее за локоть, почувствовал, как она вздохнула от его прикосновения, услышал вскрик от неожиданности…

«Однозначную» ошибку, не находимую спеллчеком, вы, если внимательны, заметите: «почувствовал, как она вздохнула». Но, быть может, так у автора? А если тут все же техническая ошибка, то каков единственно правильный текст? (Следует: «почувствовал, как она вздрогнула».)
И таких случаев немало.

2. Об истории версий книги http://lib.rus.ec/b/642021
а) Понятие версии, ИМХО, относится к временнОй последовательности fb2-файлов, имеющих общий ID. Поэтому говорить о паре книг (http://lib.rus.ec/b/596880 + http://lib.rus.ec/b/596881) от remembecoventry как о предшествующей версии книги http://lib.rus.ec/b/642021 можно лишь с натяжкой.
б) для книг http://lib.rus.ec/b/596880 и http://lib.rus.ec/b/596881 указана лишь версия 2.0.
Поэтому я бы о версии 1.0 не упоминал, только указал бы на эту пару книг как на версию 2.0, приведя обе даты, автора и соответствующие ID.
Ну, а строка 'v.3.0 — ?' вовсе не нужна: ведь ниже как 3.0 указана Ваша версия.

3. Считаю, что каждую из книг http://lib.rus.ec/b/596880 и http://lib.rus.ec/b/596881 следовало бы объединить с книгой http://lib.rus.ec/b/642021 в пользу последней. Можно «спрятать» под «исправленной» также pdf-версии http://lib.rus.ec/b/596734 и http://lib.rus.ec/b/596735.

Аватар пользователя W_Z

Александр, но я же не вычитывал Макфи ;)

W_Z написал:
Александр, но я же не вычитывал Макфи ;)

Никому из джентльменов не пожелаю :)
Аватар пользователя W_Z

Александр Лагода написал:
W_Z написал:
Александр, но я же не вычитывал Макфи ;)

Никому из джентльменов не пожелаю :)

чорд! вы меня заинтриговали!

W_Z написал:
Александр Лагода написал:
W_Z написал:
Александр, но я же не вычитывал Макфи ;)

Никому из джентльменов не пожелаю :)

чорд! вы меня заинтриговали!


Пустое... Не берите в голову.

Александр Лагода написал:
В описанном Вами случае сохранение доступа к «исходникам» полезно: при подозрении на ошибку в FB2 сохраняется возможность свериться с «честным» (без текстового слоя) PDF.

Pdf я восстанавливал.
Не стоит удалять графические файлы даже при наличии сделанных из них fb2.
Единственное исключение "текстовые PDF" (сделанные из текстовых файлов - а не файлов с внедренным текстовым слоем - разновидностью графических PDF).

Цитата:
Pdf я восстанавливал.

С поиском инструментов, поднимающих на поверхность графический слой pdf, я однажды обжегся — залетел на вирусняк.
ПодЕлитесь надежными ссылками?

Цитата:
Не стоит удалять графические файлы даже при наличии сделанных из них fb2.

Согласен. Но разве реальное удаление чего-либо тут возможно? Можно либо закопать графический файл заменой фб-двашным, либо оставить его на странице автора вместе с fb2.
Цитата:
Единственное исключение "текстовые PDF" (сделанные из текстовых файлов - а не файлов с внедренным текстовым слоем - разновидностью графических PDF).

Такое извращение в графическом редакторе видно невооруженным глазом. Потому-то, чураясь его, и говорилось о «честных сканах».

Александр Лагода написал:
Цитата:
Pdf я восстанавливал.

С поиском инструментов, поднимающих на поверхность графический слой pdf, я однажды обжегся — залетел на вирусняк.
ПодЕлитесь надежными ссылками?

Имелось в виду, в базе восстановил удаленные ссылки на файлы.

Александр Лагода написал:
Цитата:
Не стоит удалять графические файлы даже при наличии сделанных из них fb2.

Согласен. Но разве реальное удаление чего-либо тут возможно? Можно либо закопать графический файл заменой фб-двашным, либо оставить его на странице автора вместе с fb2.

Или третий вариант: не объединить файлы (при этом будет видна ссылка на графический файл), а удалить. Тогда надо глубоко копаться. На странице книги и автора этих файлов видно не будет. Разве что заходить по номеру книги. В удаленных книгах попадаются оригинальные книги, не дубли.
Да при объединении (автоматом что-ли получились?) много замененных Djvu на Fb2. Например, серия Эврика этим страдала.
Аватар пользователя Foggycat

В этих дублях много ошибок в тексте, причём в обоих...чтобы исправить, нужно два дня сидеть и коптеть...а ПДФ файла я там не видел...

Foggycat написал:
В этих дублях много ошибок в тексте, причём в обоих...чтобы исправить, нужно два дня сидеть и коптеть...а ПДФ файла я там не видел...

Аннотация поста — в точку.
Но еще о с[с]ути: что-то не подтягиваются любительницы истерическоисторическо-любовного чтива

Третий вариант — похоронный. Вряд ли рядовой юзер (даже если он окрылен желанием исправить FB2), докопается таким путем до графического файла.
Впрочем, не знаю — сам такой трюк не пользовал.
Если DJVU автоматом заменяется на FB2, ИМХО, это дОлжно отобразить в дескрипшене новорожденного fb2. И неизвестно, что там автоматом наворочено. Тут батьке надо в колокола бить.

Александр Лагода написал:
Цитата:
Единственное исключение "текстовые PDF" (сделанные из текстовых файлов - а не файлов с внедренным текстовым слоем - разновидностью графических PDF).

Такое извращение в графическом редакторе видно невооруженным глазом. Потому-то, чураясь его, и говорилось о «честных сканах».

Нет, имел ввиду PDF с чисто текстовым слоем, распознаются просто по небольшому размеру. Например, http://lib.rus.ec/b/504010 или http://lib.rus.ec/b/580875 (просится на конвертацию). Для английских копи-паст работает нормально, для русского языка не все программы дают нормально скопировать.
Переместить текстовый слой выше или ниже графического - видел в какой-то из программ. Поищу...
Аватар пользователя Foggycat

Foxit Reader спокойно берёт текст из этих файлов http://lib.rus.ec/b/580875..но эта книга и в ПДФ хорошо смотрится...

Foggycat написал:
Foxit Reader спокойно берёт текст из этих файлов http://lib.rus.ec/b/580875..но эта книга и в ПДФ хорошо смотрится...

Ïîãîâîðèì î ðàçâèòèè ãèáêîñòè â óñëîâèÿõ îãðàíè÷åííîé ïëîùàäè è îã
Çíà÷èòñÿ òàê, åñëè âû îïûòíûé ôèçêóëüòóðíèê, íè÷åãî ïîëåçíîãî äëÿ
óïðàæíåíèÿ ïðåäñòàâëåííûå íèæå, èçâåñ -äàâíî, íåêîòîðûå ïðèä áåç
ïðåóâåëè÷åíèÿ, ñîòíè ëå
Вот так?
И по поводу хорошо смотрится - основной формат в библиотеке FB2. Остальное - от лукавого. На читалках с чтением PDF проблемы. Если FB2 я читаю на кнопочном Самсунге с экраном 2,5 дюйма (увы, вторая книжка сдохла), то PDF А4 на книжке без ухищрений не почитаешь. Надо 10 дюймов.
Аватар пользователя Foggycat

Цитата:
Ïîãîâîðèì î ðàçâèòèè ãèáêîñòè â óñëîâèÿõ îãðàíè÷åííîé ïëîùàäè è îã
Çíà÷èòñÿ òàê, åñëè âû îïûòíûé ôèçêóëüòóðíèê, íè÷åãî ïîëåçíîãî äëÿ
óïðàæíåíèÿ ïðåäñòàâëåííûå íèæå, èçâåñ -äàâíî, íåêîòîðûå ïðèä áåç
ïðåóâåëè÷åíèÿ, ñîòíè ëå
Вот так?

Поговорим о развитии гибкости в условиях ограниченной площади и ограниченного времени.
Значится так, если вы опытный физкультурник, ничего полезного для себя здесь не найдѐте. Все
упражнения представленные ниже, известны давным-давно, некоторые придумали, без
преувеличения, сотни лет назад.

не знаю, как ты копировал текст, но у меня Foxit Reader берёт спокойно...

Попробуй скопировать текстовый слой. И вставить в Ворд. У меня Фоксит не берет.

Аватар пользователя Foggycat

Лука, загрузил для тебя fb2 можешь скачать...
Пятнадцать минут о гибкости (fb2)

Цитата:
Переместить текстовый слой выше или ниже графического

Вот-вот, самое оно. Буду благодарен!
Аватар пользователя ProstoTac

Александр Лагода написал:
Цитата:
Переместить текстовый слой выше или ниже графического

Вот-вот, самое оно. Буду благодарен!

Простите, а смысл?
Детские книжки конвертить?

Почему только детские?
Видеть графический слой = вычитывать по бумажной книге.

Аватар пользователя ProstoTac

Александр Лагода написал:
Почему только детские?
Видеть графический слой = вычитывать по бумажной книге.

А иначе что, его не видно и вычитать невозможно?

ProstoTac написал:
Александр Лагода написал:
Почему только детские?
Видеть графический слой = вычитывать по бумажной книге.

А иначе что, его не видно и вычитать невозможно?

Когда-то пробовал пару-тройку редакторов pdf с расширенными возможностями. Показывающего графический слой вместо текстового не нашел.
С djvu дело обстоит лучше.

Пример чисто текстового PDF - http://lib.rus.ec/b/264688.

Сборник http://lib.rus.ec/b/531394 ошибочно заменен отдельным произведением http://lib.rus.ec/b/69156, к тому же в другой редакции.
Вытащил сборник на страницу автора, отдельное произведение перенес из раздела «Сборники» в раздел «Вне серий».

Аватар пользователя ProstoTac


Что издательские? Дубли? Разных изданий разных годов и разного содержания - дубли/двойники?

ProstoTac написал:

Что издательские? Дубли? Разных изданий разных годов и разного содержания - дубли/двойники?

http://lib.rus.ec/b/367841 полностью входит в http://lib.rus.ec/b/561497. Третья книга - бумажное переиздание первой в том-же издательстве, расширенное.
Вторая - присутствует предисловие (издательское или Литресовское?). Если бы не оно - можно было бы сравнивать содержимое.
ИМХО - оставить вторую и третью, пока не найдется или бумажный или графический электронный.
Аватар пользователя ProstoTac

Lyka написал:
ProstoTac написал:

Что издательские? Дубли? Разных изданий разных годов и разного содержания - дубли/двойники?

http://lib.rus.ec/b/367841 полностью входит в http://lib.rus.ec/b/561497. Третья книга - бумажное переиздание первой в том-же издательстве, расширенное.
Вторая - присутствует предисловие (издательское или Литресовское?). Если бы не оно - можно было бы сравнивать содержимое.
ИМХО - оставить вторую и третью, пока не найдется или бумажный или графический электронный.

Нет и нет. Разные издания - разные файлы. Полностью входит, не полностью - одна книга - один файл. Мало ли что куда входит. Подобных случаев много в библиотеке.
Аватар пользователя Foggycat

Как бы мы ни пытались втиснуть библиотеку в какие-то рамки -- у нас не получится...Библиотека -- живой организм и любые правила только ограничивают её возможности...Поэтому есть библиотекари, которые принимают на себя решение во всех этих случаях...У библиотекарей могут быть разные точки зрения в разное время, поэтому всё нужно хранить, пока позволяет дисковое пространство, чтобы хотя бы в этом месте было изобилие...Рай...для души и разума...чтобы каждый нашёл своё...Я так думаю !!! Хи )))
Посмотрите на нашу библиотеку в Эквадоре...по леснице поднимается Антонина...

Картинка: 
Аватар пользователя ProstoTac

http://lib.rus.ec/b/453713 http://lib.rus.ec/b/578628 переиздание? - для начала В. В. Ионов(/a/210734) и Вячеслав Михайлович Ионов(/a/221022) - это один и тот же переводчик?

ProstoTac написал:
http://lib.rus.ec/b/453713 http://lib.rus.ec/b/578628 переиздание? - для начала В. В. Ионов(/a/210734) и Вячеслав Михайлович Ионов(/a/221022) - это один и тот же переводчик?

Отличия в тексте минимальные у этих двух книг. Таки надо сверять первое с бумагой. Вторая - электронка Литреса. Кто исказил неизвестно.
Аватар пользователя sd

Lyka написал:
http://lib.rus.ec/b/453713 http://lib.rus.ec/b/578628 переиздание?

Да, 2011 и 2016. Разница: кроме Большая в названии - в особенностях верстки (напр. — против –; более точная разбивка на абзацы во второй). И отсутствие посвящения в первой. Так как посвящение есть в оригинале (b/438080) - объединяю в пользу второй.
Аватар пользователя vulgarian

Считаю, что следующие две книги автора Сергея Лукьяненко одинаковы как по форме, так и по содержанию.

1. Холодные берега

1. Холодные берега [= Далекие берега].

Могу ошибаться.

Аватар пользователя s_Sergius

Так и есть. Абсолютные дубли.

Аватар пользователя ProstoTac

у http://lib.rus.ec/b/588316 версия получше.

Аватар пользователя s_Sergius

ProstoTac написал:
у http://lib.rus.ec/b/588316 версия получше.

Это да. Может еще ID красивее? Других отличий нет.

Страницы

X