Вы здесьОбновление скрипта "Поиск по набору регэкспов" для FBE - тестируем!
Опубликовано пт, 06/09/2019 - 04:13 пользователем TaKir
Дошли руки существенно дополнить, обновить, почистить и структурировать по смыслу скрипт "Поиск по набору регэкспов" для Fiction Book Editor (FBE). Автор этого скрипта (как и многих других скриптов для FBE) - Sclex, за что ему отдельное гран мерси. Наполнение скрипта мое, Sclex-а + учтены все возможные пожелания книгоделов из двух старых здешних тем: Типичные ошибки распознавания... Пользоваться и тестировать могут все желающие, отзывы, примеры, предложения по улучшению категорически приветствуются. Просьба приводить конкретные примеры: - ошибок скрипта, ложных срабатываний Очень приветствуется помощь тех, кто хорошо знаком с регулярными выражениями для дальнейшего совершенствования скрипта. Ссылка на последнюю версию скрипта (30-09-2019): альтернативные ссылки: Заменить этим файлом имеющийся файл (или положить новый вариант скрипта рядом) в папке: Скрипту удобнее назначить горячую клавишу F2 (меню: Сервис-Настройки-Клавиши-Скрипты-Поиск по набору регэкспов). Перед запуском данного скрипта лучше обработать текст скриптами "Генеральная уборка", "Латиница в кириллице" По мере накопления отзывов о работе скрипта, планирую периодически пополнять скрипт и выкладывать обновленную версию. P.S. На Флибусте открыта аналогичная тема, можно писать в любую.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 18 часов
babajga RE:Повесть о чудесном одуванчике 1 день Саша из Киева RE:Ночной пассажир 3 дня larin RE:Оплатила,но абонемент не отображается 4 дня tvnic RE:Maxima-library - новый адрес 4 дня Саша из Киева RE:Хождение во власть. После путча 6 дней weis RE:Прошу переформатировать, распознать, etc... 1 неделя babajga RE:Алиса в стране чудес 1 неделя tanyaguscha RE:Грушевое дерево 1 неделя babajga RE:Ёжик, который хотел обнять Луну 1 неделя babajga RE:Самый храбрый совёнок 1 неделя babajga RE:Похититель домофонов 1 неделя Саша из Киева RE:Неудавшийся священник 1 неделя Саша из Киева RE:Хочу быть лётчиком 1 неделя Саша из Киева RE:Бессмертен подвиг ваш 1 неделя sem14 RE:Искатель жемчуга 2 недели Larisa_F RE:Жизнь не отменяется 2 недели Larisa_F RE:Из озера взметнулись молнии 2 недели Впечатления о книгах
iggy71 про Каллаган: Клятва Люка Болдуина (Природа и животные, Детские приключения)
30 04 Трогательная книга. Учит человечности. Оценка: отлично!
Skyns71 про Никитин: 2024-й (Социальная фантастика)
30 04 Только что увидел, еще не открыл... А там будет ковид, война, дебильная пропаганда, озверение... что там еще главного случилось?
Синявский про К. Дж. Сэнсом
29 04 Писатель Кристофер Джон Сэнсом, известный по историческим детективам, умер на 72-м году жизни, сообщило издание Pan Macmillan.
Дей про Вязовский: Столичный доктор. Том II [СИ] (Альтернативная история, Самиздат, сетевая литература)
29 04 Я долго думал, чем можно удивить аристократов. Совсем уж что-то типа супа том ям может не пройти. Мало ли — кинза кому не нравится, или вообще кисло-сладкий вкус. ... Сюрстрёмминг — заманчиво, но до завтра селедка не протухнет ………
vadim_kz про Мазур: Тот самый сантехник (Эротика, Юмористическая проза, Самиздат, сетевая литература)
29 04 Первая часть была прикольная. Оценка: неплохо
serafim68 про Курзанцев: Жрон (Альтернативная история, Фанфик, Самиздат, сетевая литература)
29 04 Жёстко, пессимистично, но отлично. Вместо Жрона, надо было назвать Яжрон. Оценка: отлично!
serafim68 про Курзанцев: Не наследник, которому по… [СИ] (Фэнтези, Самиздат, сетевая литература)
29 04 Вау, я думала, что мне показалось. Горшков в очках и с метлой. Ржунимагу. Позолоченный мальчик, поржавевший мальчик и ржавая девочка. Параллели перпендикулярны. Такой стёб на маму Ро и парочку других произведений (лабиринт ничего не напоминает?),что аплодирую автору. Оценка: отлично!
serafim68 про Курзанцев: Наследник, которому по... (Городское фэнтези, Самиздат, сетевая литература)
29 04 Отлично провела время с этой книгой. Человек, пресытившийся приключениями и властью, начинает всё сначала. Гнётся, но не ломается. Напоминает даже не растение, а воду, которая всегда найдёт дырочку и потечёт, как ей надо. ……… Оценка: отлично!
voloduav про Беличенко: Помещик. Книга 1 [СИ] (Альтернативная история, Самиздат, сетевая литература)
28 04 Довольно неплохо для своего жанра. Живенько. На автора набросились, почему-то, за ошибки, а вы зашли на сайт, чтобы грамматику править или, что...??? Жаль, что автор забросил книгу, а хотелось бы дочитать!
Sello про Моруа: Дон Жуан, или Жизнь Байрона (Биографии и Мемуары, Литературоведение)
27 04 Все, кто бывал в Греции и интересовался, посещая музеи, историей борьбы этой страны за независимлсть, мог обратить внимание на то, что Байрона там называют национальным героем, но как-то сопровождается данное определение отдельными, ……… Оценка: отлично!
udrees про Варламов: Пришвин [2022] (Биографии и Мемуары, Литературоведение)
27 04 Очень странно было открывать жизнь этого писателя. Я его представлял по милым и красивым лесным историям, сказкам о животных, рассказам о лесных обитателях, а тут на страницах биографии вырисовывается обида на первого учителя, ……… Оценка: плохо
udrees про Форд: Ротшильды против Путина. Удушающий прием (Публицистика)
27 04 Автор книги слишком скатывается в эмоции и свои оценочные суждения, эмоциональные утверждения, которые не красят его с точки зрения серьезного произваедения: «Путин превзошел во лжи всех правителей России за ее тысячелетнюю ……… Оценка: плохо |
Комментарии
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Ну, я не специалист-филолог, но мне кажется, скрипт должен ориентироваться на литературный, а не на просторечный вариант.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
В FBE есть проверка по словарю. "Орфография" F7 тыц. У поиска по набору регэкспов другая задача.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Не буду спорить. Свою задачу я вижу в том, чтобы набрать статистику. Что из нее учитывать, а что не учитывать, думаю должны решать разработчики.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Идеальный скрипт в любом случае не сделать.
Писалось выше - улучшить бы "Генеральную уборку".
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Пока не вижу примеров для доработки скрипта, кроме прилипшего многоточия и удаления пробела перед маркером сноски.
Какие улучшения нужны?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
А апостроф?
...предусмотреть замену всех возможных различных вариаций апострофов - ´ ʼ ′ ˙ ΄ - на ' (буква «э» на англ. раскладке), который U+0027.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, вы, вообще, в курсе, что пробел и нижнее подчеркивание, это разные символы?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Прошу прощения, но не совсем понял, в связи с чем возник этот вопрос? Если ответить коротко - да, в курсе, но, по-моему, про нижнее подчеркивание я ничего не писал? И на его проверку не жаловался. Может, конечно, что-то запамятовал, уточните, если не сложно, почему вы меня об этом спрашиваете.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, потому что во многих ваших книгах, загруженных сюда, в названии книги вместо пробелов стоят нижние подчеркивания.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Можно попросить ссылку? И уточните, о чем идет речь: о названии книги (печатное издание) или имени файла? Нижнее подчеркивание использую в имени файла. Это давняя привычка, обусловленная определенными причинами. А вот в названии книги - что-то за собой такого не помню. Если дадите ссылку, проверю по своим оригиналам. Может быть, это какая-то ошибка, тем более, что она есть "во многих файлах". Надо посмотреть, что это такое.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Теперь еще по поводу работы скрипта, столкнулся с моментами, вызвавшими легкое удивление:
скрипт иногда обнаруживает, а иногда пропускает полужирное начертание отдельной буквы предлог "и", местоимение "я". Удивило, что иногда полужирное начертание обнаруживается, а иногда нет. Может, конечно, он реагирует на что-то иное, совпадающее с полужирным начертанием.
Также пропускает сочетание ., (точка и запятая). Также пропускает слово нащ (должно быть - наш). Но это, видимо, тоже относится к орфографическим ошибкам, которые скрипт не проверяет?
Добавлено позже:
Обрабатывал скриптом книгу, в которой при распознавании был пропущены все дефисы в словах типа как-то, кто-то кто-либо, когда-либо и т.д. Заметил, что скрипт пропускает словосочетание дватри (два-три); и тотмто (том-то в выражении "в том-то и дело")
Страницы