Вы здесьОбновление скрипта "Поиск по набору регэкспов" для FBE - тестируем!
Опубликовано пт, 06/09/2019 - 04:13 пользователем TaKir
Дошли руки существенно дополнить, обновить, почистить и структурировать по смыслу скрипт "Поиск по набору регэкспов" для Fiction Book Editor (FBE). Автор этого скрипта (как и многих других скриптов для FBE) - Sclex, за что ему отдельное гран мерси. Наполнение скрипта мое, Sclex-а + учтены все возможные пожелания книгоделов из двух старых здешних тем: Типичные ошибки распознавания... Пользоваться и тестировать могут все желающие, отзывы, примеры, предложения по улучшению категорически приветствуются. Просьба приводить конкретные примеры: - ошибок скрипта, ложных срабатываний Очень приветствуется помощь тех, кто хорошо знаком с регулярными выражениями для дальнейшего совершенствования скрипта. Ссылка на последнюю версию скрипта (30-09-2019): альтернативные ссылки: Заменить этим файлом имеющийся файл (или положить новый вариант скрипта рядом) в папке: Скрипту удобнее назначить горячую клавишу F2 (меню: Сервис-Настройки-Клавиши-Скрипты-Поиск по набору регэкспов). Перед запуском данного скрипта лучше обработать текст скриптами "Генеральная уборка", "Латиница в кириллице" По мере накопления отзывов о работе скрипта, планирую периодически пополнять скрипт и выкладывать обновленную версию. P.S. На Флибусте открыта аналогичная тема, можно писать в любую.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Приключения белочки Рыжки 1 день
alex-from RE:Оплатил два раза, но абонемента нет 3 дня sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 4 дня Kiesza RE:На 78-м году жизни скончался советский и российский... 4 дня Aliki RE:Подайте бедному копеечку на книжку с литреса... 4 дня Paul von Sokolovski RE:Бушков умер. 1 неделя lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 2 недели mig2009 RE:Багрепорт - 2 2 недели Isais RE:Издательство "Медуза" 2 недели babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 1 месяц Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 месяц sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц Isais RE:Игорь Северянин - Том 2. Поэзоантракт 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц sem14 RE:Семейственность в литературе 1 месяц Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 месяц Саша из Киева RE:Подводное течение 2 месяца konst1 RE:Переименовать ник (имя учетки) 2 месяца Впечатления о книгах
ne_fanat про Александр Александрович Бушков
06 11 Земля пухом, Сан Саныч. Спасибо за написанное, жаль, что больше ничего не напишете. Мне будет вас не хватать.
ne_fanat про Дронт: Первый в фамилии [СИ] (Социальная фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
06 11 Не соглашусь с предыдущим оратором:) Серенько и простенько только если рассматривать это как самостоятельное произведение. А вот если как вбоквел "Придворного", да с возможностью продолжения, да с раскрытием туманных моментов ……… Оценка: хорошо
Perca про Киров: Рыцарь Огненной кавалерии [СИ] (Фэнтези, Самиздат, сетевая литература)
06 11 Очень неплохо. Такое впечатление, что "Никит Кировых" двое, один регулярно пишет откровенный треш, а другой выдает неплохие вещи, хоть и достаточно редко. Оценка: отлично!
Perca про Киров: Молот империи 1 [СИ] (Боевая фантастика, Городское фэнтези, Самиздат, сетевая литература)
06 11 Серия неплохая, на удивление. Беда в том, что чтобы быть в теме, надо сначала прочитать откровенный шлак, приквел "Я - палач" аж в трех томах.
Олег Макаров. про Лагин: Старик Хоттабыч [litres] (Советская классическая проза, Сказка)
06 11 2 RedRoses3: не распространяйте фейки. Крон был только соавтором Лагина в работе над сценарием фильма «Старик Хоттабыч» (в 50-е годы). В процессе работы они разругались. После этого Крон чего только не говорил
RedRoses3 про Лагин: Старик Хоттабыч [litres] (Советская классическая проза, Сказка)
06 11 В 1938 году Лазарь Лагин написал детскую повесть-сказку «Старик Хоттабыч»! - хм... а со временем хороший писатель Александо Крон признался, что в молодости подрабатывал литрабом и Хоттабыча написал он... А Лагин так больше ничего выдающегося и не натворил....
Олег Макаров. про Карелин: Архитектор душ (Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
05 11 Идея неплохая, но написано предельно нудно. Сюжет стоит на месте, буксует, шины визжат, но ничего не едет. Почти до конца первую книгу дочитал и бросил Оценка: плохо
Олег Макаров. про Анатолий Н. Патман
05 11 «боец СВО, оказавшийся, на удивление, наследником древней космической, и могущественной цивилизации» обожемой! какой полёт мысли у автора! какая акутальность шыдевра! какая смелая интерпретация событий! ну и так далее. Вот ………
Sanyok89 про Пелевин: A Sinistra | А Синистра | Левый Путь (Триллер, Современная проза)
05 11 Ну хоть одна более-менее читаемая книга из этого цикла. Завершать уже пора этот трансгуманизм, а то Санта Барбара какая то Оценка: неплохо
Олег Макаров. про Андрей Владимирович Курпатов
04 11 Доктор Курпатов, Доктор Курпатов, Доктор Курпатов - многократное повторение этого словосочетания создало у многих превратное представление о том, что А.Курпатов является доктором наук. На самом деле человек имеет только ………
Lena Stol про Искаженный мир
04 11 Прочитала обе книги, пропускала много, особенно во второй части, хороший сюжет, но уж очень автор растянул. Если из двух книг сделать одну, будет интереснее.
udrees про Михеенков: Маргелов (Биографии и Мемуары)
04 11 В книге встречаются интересные упоминания, например про новобранцев с Западной Украины, «командиры были им не рады», они ненавидели оба режима, были коллаборантами, вообще удивительно, как они воевали в рядах Красной Армии, ……… Оценка: неплохо |
Комментарии
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Ну, я не специалист-филолог, но мне кажется, скрипт должен ориентироваться на литературный, а не на просторечный вариант.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
В FBE есть проверка по словарю. "Орфография" F7 тыц. У поиска по набору регэкспов другая задача.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Не буду спорить. Свою задачу я вижу в том, чтобы набрать статистику. Что из нее учитывать, а что не учитывать, думаю должны решать разработчики.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Идеальный скрипт в любом случае не сделать.
Писалось выше - улучшить бы "Генеральную уборку".
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Пока не вижу примеров для доработки скрипта, кроме прилипшего многоточия и удаления пробела перед маркером сноски.
Какие улучшения нужны?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
А апостроф?
...предусмотреть замену всех возможных различных вариаций апострофов - ´ ʼ ′ ˙ ΄ - на ' (буква «э» на англ. раскладке), который U+0027.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, вы, вообще, в курсе, что пробел и нижнее подчеркивание, это разные символы?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Прошу прощения, но не совсем понял, в связи с чем возник этот вопрос? Если ответить коротко - да, в курсе, но, по-моему, про нижнее подчеркивание я ничего не писал? И на его проверку не жаловался. Может, конечно, что-то запамятовал, уточните, если не сложно, почему вы меня об этом спрашиваете.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, потому что во многих ваших книгах, загруженных сюда, в названии книги вместо пробелов стоят нижние подчеркивания.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Можно попросить ссылку? И уточните, о чем идет речь: о названии книги (печатное издание) или имени файла? Нижнее подчеркивание использую в имени файла. Это давняя привычка, обусловленная определенными причинами. А вот в названии книги - что-то за собой такого не помню. Если дадите ссылку, проверю по своим оригиналам. Может быть, это какая-то ошибка, тем более, что она есть "во многих файлах". Надо посмотреть, что это такое.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Теперь еще по поводу работы скрипта, столкнулся с моментами, вызвавшими легкое удивление:
скрипт иногда обнаруживает, а иногда пропускает полужирное начертание отдельной буквы предлог "и", местоимение "я". Удивило, что иногда полужирное начертание обнаруживается, а иногда нет. Может, конечно, он реагирует на что-то иное, совпадающее с полужирным начертанием.
Также пропускает сочетание ., (точка и запятая). Также пропускает слово нащ (должно быть - наш). Но это, видимо, тоже относится к орфографическим ошибкам, которые скрипт не проверяет?
Добавлено позже:
Обрабатывал скриптом книгу, в которой при распознавании был пропущены все дефисы в словах типа как-то, кто-то кто-либо, когда-либо и т.д. Заметил, что скрипт пропускает словосочетание дватри (два-три); и тотмто (том-то в выражении "в том-то и дело")
Страницы