Вы здесьОбновление скрипта "Поиск по набору регэкспов" для FBE - тестируем!
Опубликовано пт, 06/09/2019 - 04:13 пользователем TaKir
Дошли руки существенно дополнить, обновить, почистить и структурировать по смыслу скрипт "Поиск по набору регэкспов" для Fiction Book Editor (FBE). Автор этого скрипта (как и многих других скриптов для FBE) - Sclex, за что ему отдельное гран мерси. Наполнение скрипта мое, Sclex-а + учтены все возможные пожелания книгоделов из двух старых здешних тем: Типичные ошибки распознавания... Пользоваться и тестировать могут все желающие, отзывы, примеры, предложения по улучшению категорически приветствуются. Просьба приводить конкретные примеры: - ошибок скрипта, ложных срабатываний Очень приветствуется помощь тех, кто хорошо знаком с регулярными выражениями для дальнейшего совершенствования скрипта. Ссылка на последнюю версию скрипта (30-09-2019): альтернативные ссылки: Заменить этим файлом имеющийся файл (или положить новый вариант скрипта рядом) в папке: Скрипту удобнее назначить горячую клавишу F2 (меню: Сервис-Настройки-Клавиши-Скрипты-Поиск по набору регэкспов). Перед запуском данного скрипта лучше обработать текст скриптами "Генеральная уборка", "Латиница в кириллице" По мере накопления отзывов о работе скрипта, планирую периодически пополнять скрипт и выкладывать обновленную версию. P.S. На Флибусте открыта аналогичная тема, можно писать в любую.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
weis RE:Подайте бедному копеечку на книжку с литреса... 4 дня
Саша из Киева RE:СССР - великое содружество народов-братьев 1 неделя weis RE:Прошу переформатировать, распознать, etc... 1 неделя Саша из Киева RE:Латинская Америка 1 неделя Саша из Киева RE:Сказки старого филина 1 неделя Саша из Киева RE:Микроюморески со всего света 2 недели Саша из Киева RE:Звёзды на рейде 2 недели Trinki RE:Цензура в книжном магазине 2 недели Саша из Киева RE:Улицы моего города 2 недели Isais RE:Древний Рим. Подборка книг 2 недели Саша из Киева RE:Обновление FictionBook Editor 3 недели Саша из Киева RE:Лучезарный феникс 1 месяц PrePress RE:Что случилось с FTP? 1 месяц Саша из Киева RE:Нефритовый чайник эпохи Мин 1 месяц Саша из Киева RE:Ва-банк 1 месяц Саша из Киева RE:Ведомственный притон 1 месяц konst1 RE:Fb27 1 месяц nehug@cheaphub.net RE:Что случилось с либрусеком? 1 месяц Впечатления о книгах
Chita-Drita про Пирс: Yours Cheerfully [en] (Старинная литература: прочее)
19 03 Продолжение истории про Эмили Лейк. Война, Англия. Она вся такая помощница. Можно почитать, хотя не шедевр. Оценка: хорошо
Chita-Drita про Грубер: Смертный приговор [Todesurteil ru] (Триллер, Детективы: прочее)
19 03 Триллер на твердую четверку. Не шедевр, но прочитать можно. Оценка: хорошо
Chita-Drita про Старобинец: Лисьи броды [litres] (Ужасы)
19 03 Мне очень понравилось. Старобинец умеет писать, конечно. Весь этот мир, куча кусочков-паззлов, которые потом собираются в одну картинку. Было интересно. Оценка: отлично!
Chita-Drita про Диккер: Дело Аляски Сандерс [litres] (Триллер, Детективы: прочее)
19 03 Хуже, чем "Правда о деле Гарри Квеберта" и тем более "Книги Балтиморов". Но в целом прочесть можно. Загадка интересная. Герои уже полюбились. Для продолжения серии хорошо. Оценка: хорошо
Chita-Drita про Барри: Скрижали судьбы [The Secret Scripture ru] (Историческая проза, Современная проза)
19 03 Очень нудная книга. Много ненужных подробностей. Неправдоподобные события, финал тяп-ляп. Не понравилась. Оценка: плохо
Chita-Drita про Роуч: Секс для науки. Наука для секса [Bonk: The Curious Coupling of Science and Sex ru] (Психология, Научная литература: прочее, Секс и семейная психология)
19 03 Читать было интересно. У автора хорошее чувство юмора. И проделала она огромную работу для написания этой книги. Не могу сказать, что открыла для себя много нового. Но в целом потраченного времени не жалею. Оценка: хорошо
decim про Уоттс: Эхопраксия [Echopraxia ru] (Научная фантастика)
17 03 В подлиннике - отлично. Увы, не могу продраться через перевод. Без оценки.
udrees про Михайлов: Низший 7 [СИ litres] (Боевая фантастика, Героическая фантастика, Киберпанк, Самиздат, сетевая литература)
17 03 Раздражает иногда поведение главного героя, который шлет всех на три буквы, заслуженно или нет. Уважение какое-то испытывает только перед детьми, стариками и некоторыми женщинами. Герой просто безбашенный, сумасшедший ……… Оценка: отлично!
udrees про Михайлов: Низший 6 [СИ litres] (Боевая фантастика, Героическая фантастика, Киберпанк, Самиздат, сетевая литература)
17 03 На мой взгляд, книга слабее предыдущих двух. Все действие происходит в Зомбилэнде, герой все так же действует напролом, прямолинейно и жестоко. Описания довольно кровавые, часто отдают пошлостью, через слово в диалоге звучит ……… Оценка: отлично!
udrees про Михайлов: Низший 5 [СИ litres] (Боевая фантастика, Героическая фантастика, Киберпанк, Самиздат, сетевая литература)
17 03 1 и 2 книги были конечно шикарны, но герою тоже нужно расти, поэтому 3 и 4-я книги тоже по своему интересны, по мере продвижения героя вверх по миру. В этом плане 5-я книга выделяется своим сюжетом и описанием, которое отличается ……… Оценка: отлично!
Олег Макаров. про Павел Воронин
15 03 Lee321 «В феврале 2020 года была выпущена новеллизация первого сезона под названием «Триггер. Как далеко ты можешь зайти»[13], состоящая из 30 глав. Автором новеллизации выступил Павел Воронин, а предисловие написал Сергей Насибян» Wikipedia
decim про Стивенсон: Синдром отката [litres] (Социальная фантастика, Научная фантастика)
14 03 Неплохо. Не отлично и не хорошо, т.к. затянуто, многословно и к тому же автор натащил в креатив всё, что нынче носят, часто лишнее. Глобальное потепление, по автору, можно затормозить человеческой техникой - смело! Для ……… Оценка: неплохо |
Комментарии
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Ну, я не специалист-филолог, но мне кажется, скрипт должен ориентироваться на литературный, а не на просторечный вариант.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
В FBE есть проверка по словарю. "Орфография" F7 тыц. У поиска по набору регэкспов другая задача.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Не буду спорить. Свою задачу я вижу в том, чтобы набрать статистику. Что из нее учитывать, а что не учитывать, думаю должны решать разработчики.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Идеальный скрипт в любом случае не сделать.
Писалось выше - улучшить бы "Генеральную уборку".
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Пока не вижу примеров для доработки скрипта, кроме прилипшего многоточия и удаления пробела перед маркером сноски.
Какие улучшения нужны?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
А апостроф?
...предусмотреть замену всех возможных различных вариаций апострофов - ´ ʼ ′ ˙ ΄ - на ' (буква «э» на англ. раскладке), который U+0027.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, вы, вообще, в курсе, что пробел и нижнее подчеркивание, это разные символы?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Прошу прощения, но не совсем понял, в связи с чем возник этот вопрос? Если ответить коротко - да, в курсе, но, по-моему, про нижнее подчеркивание я ничего не писал? И на его проверку не жаловался. Может, конечно, что-то запамятовал, уточните, если не сложно, почему вы меня об этом спрашиваете.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, потому что во многих ваших книгах, загруженных сюда, в названии книги вместо пробелов стоят нижние подчеркивания.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Можно попросить ссылку? И уточните, о чем идет речь: о названии книги (печатное издание) или имени файла? Нижнее подчеркивание использую в имени файла. Это давняя привычка, обусловленная определенными причинами. А вот в названии книги - что-то за собой такого не помню. Если дадите ссылку, проверю по своим оригиналам. Может быть, это какая-то ошибка, тем более, что она есть "во многих файлах". Надо посмотреть, что это такое.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Теперь еще по поводу работы скрипта, столкнулся с моментами, вызвавшими легкое удивление:
скрипт иногда обнаруживает, а иногда пропускает полужирное начертание отдельной буквы предлог "и", местоимение "я". Удивило, что иногда полужирное начертание обнаруживается, а иногда нет. Может, конечно, он реагирует на что-то иное, совпадающее с полужирным начертанием.
Также пропускает сочетание ., (точка и запятая). Также пропускает слово нащ (должно быть - наш). Но это, видимо, тоже относится к орфографическим ошибкам, которые скрипт не проверяет?
Добавлено позже:
Обрабатывал скриптом книгу, в которой при распознавании был пропущены все дефисы в словах типа как-то, кто-то кто-либо, когда-либо и т.д. Заметил, что скрипт пропускает словосочетание дватри (два-три); и тотмто (том-то в выражении "в том-то и дело")
Страницы