С однофамильцами Полякова вроде разобрался, теперь с дубликатами...

Интересно, где граница между "современной прозой" и "русской классической прозой"? Или "советсткой классической прозой"?

Безошибочно будет, например, если до революции то "руская классическая проза", если современник - то уже не совсем понятно... Ну "современная проза", это очевидно... А в какой мере она может быть связана с русской прозой? С советсткой прозой?

Ладно, с Поляковыми разобразлся. "Открой раковину" - это вообще статья в каком-то номере "ЮТ" для умелых рук (djvu могу приложить), поэтому к Ю.М. Полякову скорее всего отношения не имеет (ну разве что хобби у него такое тогда было, что маловероятно:-) ). Выделил отдельно автора этой статьи.

Из Ю.М. Полякова залил "Работа над ошибками", "Подземный художник", "Порнократия", правда эту в rtf, ну когда руки дойдут, может быть переделаю.

А как определять какой из дублей правильный? Например, из обнаруженных двух разных версий "Грибного царя" в одной нет эпиграфа, а в другой - картинки в начале. В остальном они практически ничем не различаются, только в одной в некоторых местах использованы длинные тире (но не везде, где нужно, ну это мелочи), а в другой - короткие тире и дефисы, ну и еще опечатки немного по-разному расположены, а в остальном весь текст совпадает. И какую выбрать? Или пусть обе будут? И так со всеми дубликатами...

Комментарии

Основная тусовка разработчиков и пользователей формата fb2 - http://www.fictionbook.org/forum/viewforum.php?f=3
Я особо не вникал, взял жанры их их стандарта. Можно там спросить, может кто и объяснит.
На мой взгляд классическая - до революции, советская - при советской власти, современная - после. При этом одна книга вполне может иметь несколько жанров одновременно. Теоритически в формате даже есть возможность указывать процент соответствия, типа книга на 70% советская и на 50% классическая, но этим никто не пользуется.

Если один из дублей очевидно хуже - то удалять. Если, как в данном случае, у каждого свои плюсы - пока оставить оба, как будет время - слить в один. Чтоб и картинка была, и эпиграф. Заодно и опечатки поправить. Не думаю, что дубль - это так уж страшно, потерпим.

X