Фата Моргана

Аватар пользователя Captain Scarlett

По мотивам свежего флэйма, так сказать...

Заглянула я в профиль одного из ярых обличителей произвола библиотекарей и обнаружила его вклад в пополнение библиотеки: 9 книг с загадочным названием "Фата моргана".
http://lib.rus.ec/b/130643
http://lib.rus.ec/b/130644
http://lib.rus.ec/b/130645
http://lib.rus.ec/b/130646
http://lib.rus.ec/b/130647
http://lib.rus.ec/b/130648
http://lib.rus.ec/b/130649
http://lib.rus.ec/b/130650
http://lib.rus.ec/b/130651

Все это никакие не fb2, это txt, переименованные в fb2 (да, вот такой новый способ создания fb2-файлов). Содержание - сборники зарубежной научной фантастики, судя по списку авторов - неплохие. Есть желающие заняться конвертацией и вычиткой? Я сейчас делаю первый сборник.

(Прошу прощения за несколько раздраженный тон, но какого хрена...).

У меня вопрос ко всем такого плана. Про разрядку, мать ее.. Делается путем втискивания между букв неразрывных пробелов, это понятно. Когда одно-два слова так выделены, еще ничего, но вот мне тут попалась одна повесть, где это чуть ли не в массовом порядке. В одном месте даже целый абзац так сделан. Это же опупеть можно, если вручника (по другому не знаю как) втыкать em dash, а потом все это в читалке проявляется как длинное-предлинное нечитаемое слово. Можно конечно между словами доп.пробел ставить, однако подряд идущие пробелы безжалостно вычищаются при генеральной уборке.
В общем, я пока делаю так: если одно-два слова выделены разрядкой, так и оставляю. Если больше, выделяю курсивом. Или цитатой, в зависимости от контекста. У кого какое мнение?

Аватар пользователя Captain Scarlett

Я разрядку обычно заменяю на курсив.

"разрядка" в fb2 только в самом крайнем случае, когда уже заняты emphasis, strong, emphasis+strong, ЗАГЛАВНЫЕ. Лучше вобще без "разрядки".

Я как и izaraya - курсивом.
А соединяю вручную.

Аватар пользователя Captain Scarlett

В FBE есть скрипт - "сжатие разрядки". Правда, он пробелы между словами тоже удаляет.

МихалЫч написал:

В общем, я пока делаю так: если одно-два слова выделены разрядкой, так и оставляю. Если больше, выделяю курсивом. Или цитатой, в зависимости от контекста. У кого какое мнение?

Я и отдельные слова не оставляю в разрядку. Всегда выделяю их то ли курсивом, то ли болдом, то ли двумя сразу. Зависит от уже имеющегося форматирования в тексте. Они должны отличаться - в этом же и есть цель выделения их разрядкой. ;)

Тэгом "цитата" для этих целей не пользуюсь.

Вернулся устыдившийся дезертир. Но поздно Жора пить боржоми - 8-й, последний, сборник Алексей забрал. И бес, посрамлен бе, плакаси горько...

Есть шабашка: http://lib.rus.ec/node/123572
Надо бы помочь, тем более книжки заслуживают того.
А тексты (для сравнения) можно выцепить все в той же публичной библиотеке.

Там почему-то коменты не проходят, как отмечаться, что взял?
На всякий случай - забрал 1975 год.

Там при попытке добавить коммент сообщается, что "Your comment will be posted once it's been approved."
Во блин, зашифровались..

Проверка текста на СПИД и взрывчатые вещества. Раз не прошел - что-то обнаружили. Теперь или к доктору или к саперу

Алексей_Н написал:
Есть шабашка: http://lib.rus.ec/node/123572
Надо бы помочь, тем более книжки заслуживают того.
А тексты (для сравнения) можно выцепить все в той же публичной библиотеке.

Что-то есть у меня некоторые подозрения, что аккуратнее и быстрее будет именно из ершовских исходников переделать, чем сравнивать непонятно что с хорошим исходником...

У Ершова не все, где-то половина.

Всё! [и с облегчением вздохнул] Сделал...

Фата-Морган 8

Алексей_Н написал:
Всё! [и с облегчением вздохнул] Сделал...

Какие же вы все молодцы!

Ага. Мы такие :) У меня тоже все - Фата-Моргана 7.

Осталась только 6-я книга )

Кста, набросал списки для поиска мусора в ФБЕ

мусорные знаки после скана (прямо как есть в квадратных скобках):
[/\\*>|'<_×]
(включаем галку "Регулярное выражение")

строки, не заканчивающиеся знаками препинания:
[^»….,:;!\?]$
(включаем галку "Регулярное выражение")
Отлавливаются стихи, фразы без точек и тп,

TaKir написал:
…набросал списки для поиска мусора в ФБЕ…

А зачем изобретать велосипед? Есть скрипт по поиску мусора (в томчисле) – «Слипшиеся слова». Один из тамошних регэкспов отлавливает следующие непотребные символы посреди кириллицы:
([\\\.,…\\"„“”!\\\?\\\|:;\\\*%\\\^\\\dA-z\\\(\\\)]+)
Если этого мало – что-то пропущено – добавляйте своё, какие проблемы? Но это же проще чем каждый раз сочинять регулярное выражение… Во-первых, не каждый это умеет; во-вторых, так и нет выклянчиваемого банка регэкспов, типа, раз написал и сохранил его в редакторе, а не где-то на бумажке – всё равно потеряется.

TaKir написал:
…строки, не заканчивающиеся знаками препинания…
Так они отлавливаются «Разрывами абзацев»… А если искать пропущенные стихи, то этим регэкспом придётся прошерстить все уже имеющиеся стихи, цитаты… Нужен скрипт поиска стихов (с заданием длины строки - они обычно короткие), ЗАГОЛОВКОВ, Глав… с предварительным выбором искомого. Но это к Sclex'у.

Я пользуюсь этими скриптами.
Только "Слипшиеся слова" глючат не по-деццки. :( Зачастую обрезается фраза и в конце появляется $7.
С этим можно что-то поделать?

jurgennt написал:
TaKir написал:
…набросал списки для поиска мусора в ФБЕ…

А зачем изобретать велосипед? Есть скрипт по поиску мусора (в томчисле) – «Слипшиеся слова». Один из тамошних регэкспов отлавливает следующие непотребные символы посреди кириллицы:
([\\\.,…\\"„“”!\\\?\\\|:;\\\*%\\\^\\\dA-z\\\(\\\)]+)
Если этого мало – что-то пропущено – добавляйте своё, какие проблемы? Но это же проще чем каждый раз сочинять регулярное выражение…

Скрипт менять как раз не каждый умеет )
Только что напихал в текст символов из своего списка ([/\\*>|'<_×]) - не ловит скрипт и половины...

jurgennt написал:

TaKir написал:
…строки, не заканчивающиеся знаками препинания…
Так они отлавливаются «Разрывами абзацев»…

Скрипты "Ликвидация разрывов" и "Разрыв предложения" не ловит конец абзаца с кавычками, но без знаков препинания.

Чтобы не появлялась $7 нужно в строке 195 заменить $7 на $6:

Невозможные союзы
var re153 = "$6";

Я эту опечатку видел, исправил, но пока выложить некуда. Пока сами у себя поправьте. То же касается и остального мусора.
С кавычками в конце строки сложнее: разрывы морально устарели, а по ликвидации к Sclex'у. Сейчас и сам ему об этом напишу, хотя уже и так много ему навалил. Кстати, если вы будете молчать, то кто об этом узнает. Да и мотивация страдает - создается впечатление, что эта фигня никому не нужна. Постятся скрипты на форуме фикшена, а т.к. местные редакторы уже не ловят мусор от скана, то и реакции совсем нет.

И вдогонку, типа голосования.
Вставляю картинки - иногда получается, что сверху есть пустая строка, а снизу нет или наоборот. Хочу сделать чтобы пустышки были и вверху и внизу (возможно кто-то предпочитает чтобы их совсем не было). Предлагаю Sclex'у добавить при запуске скрипта «Заголовки, подзаголовки…» вывести запрос: «Пустые строки вокруг иллюстраций. Добавить? Убрать? Ваще забыть об этой теме и не тормозить комп.» Возможные возражения: подписи к рисункам, это совсем другой тип пустышек - надо делать еще один скрипт. Чё скажете?

TaKir написал:
Скрипты "Ликвидация разрывов" и "Разрыв предложения" не ловит конец абзаца с кавычками, но без знаков препинания.

Старенькие «Разрывы предложения» в случае, когда в конце абзаца строчные буквы и закрывающие кавычки, а в начале следующего строчные, предлагают соединить абзацы. Аналогично поступает и скрипт «Ликвидация разрывов». Если же второй абзац начинается с Прописной, то, действительно, «Ликвидация» такой случай игнорирует, а вот старичок предлагает сначала поставить точку в конце первого абзаца, при отказе - объединение.
Возможно ты что-то упустил при описании ошибки.

jurgennt написал:
Чтобы не появлялась $7 нужно в строке 195 заменить $7 на $6:

Спасибо, сработало. А баг был очень неприятный - заметить можно было только после повторной вычитки, а если уже все вычитал и просто зачищаешь - результат "правки" так и сохранялся.

Ой, спасибо большое. А то я иногда пропускала этот скрипт, именно из-за этой ошибки. А вообще он очень удобный. И в целом подборка скриптов очень удачная.

Насчёт картинки и пустой строки: по-моему, без пустой строки файл будет невалидным. Поэтому для однообразия можно сделать две пустышки - сверху и снизу.
Насчёт подписи к рисункам - тоже актуально. Не очень понимаю, как различить, когда нужна пустышка снизу, а когда, вместо неё, должна быть подпись к картинке. Но верю, что Вы это можете. ;)

golma1 написал:
по-моему, без пустой строки файл будет невалидным

Открываю только что скачанную книгу, все нормально, валидна, но пустышек вокруг картинок – нет. Или что не заметил?

sd написал:

Открываю только что скачанную книгу, все нормально, валидна, но пустышек вокруг картинок – нет. Или что не заметил?

Нет, это я неправильно сформулировала.
Если картинка в отдельной секции, то без пустой строки файл получается невалидным. Если я ничего не путаю...

Аватар пользователя Captain Scarlett

Цитата:
Насчёт картинки и пустой строки: по-моему, без пустой строки файл будет невалидным.

Только если в секции кроме картинки ничего больше нет.

golma1 и izaraya, простите, буду читать внимательней

Собрал все скрипты на одну страницу.
Но прошу учесть тот факт, что если у вас папка со скриптами называется не «Scripts», то некоторые, например «Ликвидация разрывов», работать не будут. У них в коде надо править адреса. Чуть позже слеплю вариант для «cmd».

Нелепые символы после скана тоже пока не добавлял. Кстати, какие для них могут быть хитрые условия: искать только в конце\начале строки; только среди кириллицы или вообще, где ни попадется?..

Так по пустышкам воrруг иллюстраций, настаивать или не стоит?

jurgennt, если будет время, может удастся поправить:
Структура секций – багрепорт
При перетаскивании секции с эпиграфом он исчезает, стирается напрочь.
А скрипт очень удобный, сразу видно: что, где, на каком уровне.

sd написал:
...может удастся поправить: Структура секций...

А вот это - чистая неожиданность.
Что, еще кто-то пользуется этим скриптом, в FBE?
Скрипт умер, когда появилось перетаскивание в боковушке «Структура книги». Его, что, надо реанимировать?
То-то Sclex удивится. ))

Честно говоря, я эти примочками вообще не пользовался - вполне хватает «Опустить секцию». Порубал на части - опустил внутренности, где надо; порубал на главы - опустил... Может чуть дольше и без понтов, но зато стопроцентная гарантия от ошибок.

jurgennt написал:
sd написал:
...может удастся поправить: Структура секций...

А вот это - чистая неожиданность.
Что, еще кто-то пользуется этим скриптом, в FBE?
Скрипт умер, когда появилось перетаскивание в боковушке «Структура книги». Его, что, надо реанимировать?
То-то Sclex удивится. ))

Пользуюсь исключительно "стрелочками" в "Структуре книги" в сочетании с "опустить секцию". Очень удобно.

Насчёт картинок: не люблю ненужных вопросов, но хочу иметь возможность автоматизировать максимум процессов.
Отдельный скрипт - оптимальный вариант. Если можно...

jurgennt написал:
Так по пустышкам воrруг иллюстраций, настаивать или не стоит?

Я сторонник единообразия. Посему я "за" пустышки вокруг иллюстрации.
Кстати, тогда решается вопрос об иллюстрациях в отдельной секции.

golma1 написал:
...Посему я "за"...

Чувствуется глубокая порядочнось — вставила «до», значит надо вставить и «после». Однако, есть ряд несознательных товарищей, которым не нравится этим заниматься ни до, ни после. И это реальность, которую надо принимать как данную.
Т.о. а самом начале скрипта должен быть выбор: вставлять, не вставлять?

Но этим скриптом пользуюся не только при иллюстрировании, скорее, значительно чаще по тексту без картинок... Не кажется ли вам, что постоянные вопросы про рисунки будут раздражать?..
Получается, что Sclex был прав и ему-так придется писать отдельный скрипт на этот случай.

jurgennt написал:

Нелепые символы после скана тоже пока не добавлял. Кстати, какие для них могут быть хитрые условия: искать только в конце\начале строки; только среди кириллицы или вообще, где ни попадется?..
Так по пустышкам воrруг иллюстраций, настаивать или не стоит?

Мусор лучше искать везде.
Но, очень желательно показывать в тексте места с мусором, а не в панельке поиска, потому что иногда вообще непонятно, что там должно быть, а остановить скрипт и найти очередное место в тексте вроде бы никак нельзя.

А пустышки возле иллюстраций прибивать везде, где они не являются обязательными.

TaKir написал:
Мусор лучше искать везде.
Но, очень желательно показывать в тексте места с мусором...

У-у-у, я такое в «Слипшихся…» не потяну. Подсветку я уже пытался кое-где прикрутить (сначала по-крестьянски чистил код от всех тегов, ссылок и пр., потом искал по чистому искал искомое совпадение. Бр-р-р. В абзацах с одной заменой вроде работало, с несколькими - начиналась чехарда с временными заглушками в местах уже произведенных замен и как следствие сползание в сторону). С тормозами тоже экспериментировал - после сотни-другой замен выводиось предложение: «А может хватит?»
Да и снова залазить в скрипт большого желания нет - явно что-нибудь отвалится.
Может выдать Sclex'у ТЗ на скрипт «Мусоролов»? И пусть у него голова болит. ))

Ура, товарищи! Пятилетка выполнена за три года!!! :))
Серия «Фата-Моргана» полностью переведена в fb2. Смотреть/Читать здесь.
izaraya, респект за 6-ой том.

Родина гордится своими ударниками производства!

Кроме шуток, какие же вы молодцы!

Страницы

X