Бета-версии новых скриптов от Alex2L

Уважаемый Alex2L http://lib.rus.ec/user/33502 предложил новые серипты.
1. Первый скрипт - проверка отсутствия/пропуска точки перед заглавной букой в середине предложения.
Скрипт позволяет проверить каждое сочетание типа [маленькая буква][пробел/запятая+пробел][Заглавная буква]
Скрипт наполняемый - в конце работы он высвечивает все проблемные мечта и предлагает внести исключения в базу скрипта.

2. Второй скрипт - "поиск прилипших предлогов"
Он позволяет проверить и исправить текст, когда в нём встечается что-то типа такого: (мой вариант эти слова стопроцентно не существуют в оригинальном виде и должны быть разделены)
******************************************************
* Файл с эталонами слипшихся предлогов
*
* Строки, начинающиеся со знаков "*", "#", "/", ";",
* пустые строки, строки с более чем одним словом -
* игнорируються
* ~ внутри слова - слипшийся предлог многобуквенный,
* либо присутствующая в тексте комбинация слившихся
* слов - обозначает место разъединения
*
Вто
кнему
кней
стого
атакже
Кконцу
стех
стем
отом
аты
сним
Ая
во~имя
ая
кним
онём
оней
сним
сней
-----------------
Скрипт позволяет дополнять/редактировать базу.
Сами скрипты (оба-вместе) здесь: http://narod.ru/disk/55118271001.fdc1c11f2d53ec101742f799ce3c523a/script_version_270612.zip.html

Как разложить файлы:
1. Папку XML положить в корень ФБЕ. то-есть окрыть папку ФБЕ и просто вставить папку XML
2. открыть папку из архива Scripts,- 06_Чистка и вставить содержимое в соответствующую папку "06_Чистка".
3. Содержимое папки HTML добавить в соответствующую вашу папку HTML

Иконка на первый скрипт - в архиве. на второй скрипт - ждём предложений.
Автор сериптов - юзер Либрусека, Алекс, ответит на все ваши вопросы.
Просьба не забывать о том, что скрипы тестируются и багрепорт со скринами - приветствуется.

Комментарии

В связи с тем, что я, практически, без сети (командировка в далеко и в полную ж...) просьба - пробуем и ВСЕ вопросы и косяки. дополнения пишем здесь.
Несколько скринов:
Первый скрипт:

2.


У меня почему-то после работы скрипта "поиск прилипших предлогов" выпадает ошибка 2146828218.

Во-первых, вы увы, не одиноки. Во-вторых:

Цитата:
после работы скрипта
- это врядли. Скорее всего был дан утвердительный ответ на вопрос о редактировании файла эталонных ошибок. Как выход - редактировать этот файл вручную. Скрипт без проблем должен работать на 32-х битных ОС Windows.
Что до ошибки 2146828218 - явление довольно распространенное, если погуглить и вариантов решения - хватает. Связано с разрешениями на допуск к работе с файлами. И не связано с конкретным скриптом. Надо экспереминтировать! Но учитывая отсутствие под рукой 64-х битной винды - вопрос пока открыт. (Уважаемый wotti не упомянул об этом факте: на 64-битных ОС могут быть проблемы!). Если ошибка 2146828218 выпадает по иному - любопытно было бы поточнее сформулировать что да как.
Аватар пользователя Isais

Цитата:
Сами скрипты (оба-вместе) здесь: http://narod.ru/disk/55118271001.fdc1c11f2d53ec101742f799ce3c523a/script_version_270612.zip.html
Не понял шутку. Скрипты-то где? По ссылке указан архив, а скачивается страница 404!
...А у меня как раз файлик для тестирования - просто песня! Ни одной точки внутри.
Аватар пользователя tvnic

Isais написал:
Цитата:
...А у меня как раз файлик для тестирования - просто песня! Ни одной точки внутри.

Что-то типа этого, но не так мрачно.
Аватар пользователя XtraVert

Спасибо за скрипты. Скачалось нормально, будем тестить...

Альтернативная ссылка - http://rusfolder.com/31461805.

Аватар пользователя Isais

Спасибо! Сейчас скачал.
Очень вовремя - пойду чертей гонять точки ставить. :))

UPD. Поиск пропущенных точек работает удовлетворительно.
Скрипт не нашел следующие контексты:


По примерам кажется, что скрипт не видит двухбуквенные и трехбуквенные сочетания. Это фича?

Проверить прилипшие предлоги оказалось не на чем. Пока советую исправить текст внутри скрипта:

Цитата:
пустые строки, строки с более чем одним словом -
* игнорируються
.

Исправлено и дополнено: http://rusfolder.com/31480888

21_Точка_Запятая.js — текущая версия v.2.03 — исправлены ошибки. Добавлен случай проверки:
После Прописной через пробел Прописная, после которой строчная — подозрительная пунктуация!, возможно пропущена точка.

22_Поиск прилипших предлогов.js — текущая версия v.1.22 — новый вариант замены и подсчета кол-ва замен.
(ранее однотипное изменение в пределах абзаца считалось за одно).

Исправлены замеченные опечатки.

Аватар пользователя Isais

Иконка (простенькая и не слишком квадратная, но прозрачная и заметная) для "прилипших предлогов" (не архивирована, формат .ico).

Аватар пользователя izekbis

Isais написал:
Иконка (простенькая и не слишком квадратная, но прозрачная и заметная) для "прилипших предлогов" (не архивирована, формат .ico).

Используя идею, сделал такю иконку http://narod.ru/disk/55957697001.83ab9aa0e1402dfdf1178ca2f5e8bbe0/22_%D0%9F%D0%BE%D0%B8%D1%81%D0%BA%20%D0%BF%D1%80%D0%B8%D0%BB%D0%B8%D0%BF%D1%88%D0%B8%D1%85%20%D0%BF%D1%80%D0%B5%D0%B4%D0%BB%D0%BE%D0%B3%D0%BE%D0%B2.zip.html

Свежий вариант скрипта: http://rusfolder.com/31537350

Текущая версия: v.2.13.
— добавлены новые режимы проверки (с диалогом выбора).
— выбор поддержки файла-словаря имён Собственных (отказ от использования — для мазохистов);
— добавлен режим ПРЕЦЕДЕНТ. Т.е. если ответили утвердительно, что перед таким-то Словом должна стоять ТОЧКА, то в сл. раз (это наше слово со Строчной и нет точки) —
точка проставиться АВТОМАТИЧЕСКИ.
— добавлен режим позиционирование точки автоматически - в pop-up окне правки — чтобы лишний раз не мудохаться.
— ведется протокол работы скрипта: 'XML/Protocol.hta' — независимый просмотр, после сеанса работы скрипта, где ЗЕЛЁНЫЙ фон — слово из нашего словаря - типа "легально", что отсутствует точка(/запятая присутствует). ЖЁЛТЫЙ фон - правили "в ручную", КРАСНЫЙ фон - при выборе соответствующего режима (ПРЕЦЕДЕНТ) ТОЧКА проставилась
АВТОМАТИЧЕСКИ. Т.к. КАЖДЫЙ АБЗАЦ проверяется ТРЕМЯ(/ДВУМЯ) проверками ("Пропущена Точка?", "Запятая перед Прописной?" и "Подозрительная пунктуация!") - то в отчет может попасть один и тод же абзац с разными вариантами проверки (не более ТРЁХ).
(в дальнейшем планирую побороть).
Протокол ПЕРЕТИРАЕМЫЙ!!! На посмотреть запускается по "тюк-тюк" мышкой - это безбраузерный HTML-файл.
ВНИМАНИЕ!!! в XML-папке ДОЛЖНА быть подпапка CSS!!! В которой должен лежать файл "Протокол.css"

Гонял на своих файлах - глюков не обнаружил.

Аватар пользователя tvnic

Очень полезная весчь - как раз правлю давно выложенную книгу с очень большим количеством запятых (вместо точки) перед прописными буквами начала следующих предложений. Жаль, что скрипт предлагает ввести (исправить) свой вариант, а не предлагает замену на выбор.
В любом случае - автору благодарности.

Спасибо!
Э... не совсем уловил смысл "хотелки". Если не сложно - поясните на примере, как скажем, Isais в посте от 3-го 7-го.
Если будет возможность - почему бы нет.
Может имеется в виду, что вместо ЗАПЯТОЙ должна быть ТОЧКА?!

Аватар пользователя tvnic

Alex2L написал:
Может имеется в виду, что вместо ЗАПЯТОЙ должна быть ТОЧКА?!

Хотелось бы, чтобы скрипт предлагал окно с выбором замены.
Аватар пользователя tvnic

Типа

Аватар пользователя tvnic

Я лежал, неудобно сложенный вдвое на полу в заднем отсеке машины. Судя по всему, это наш «мини-купер». Было страшно холодно. И я сообразил, что на мне нет ни пальто, ни пиджака. Я остался в рубашке с короткими рукавами, а руки мои просунуты между двумя передними сиденьями так, чтобы я не мог сорвать пластырь. Лежать в такой позе было чудовищно трудно. Я попытался освободить руки, приподнял их и изо всех сил дернул. Но они были крепко привязаны, И на них с такой зверской силой обрушился кулак (так мне показалось), что больше я и не пробовал. Видеть, кто ведет машину и гонит ее изо всех сил, я не мог. Но в том не было надобности, Лишь один человек на свете мог придумать такую ловушку — злостную, но хитрую, вроде «ягуара», поставленного поперек дороги, Лишь у одного человека мог быть повод, пусть совершенно безумный, чтобы похитить меня. Никаких иллюзий у меня не было: Морис Кемп-Лор не желал, чтобы я выиграл Зимний Кубок, и принял меры.

Перед "И" скрипт предложил замену. В окне заменил запятую на точку. Далее - "Да". Замена не произошла, скрипт перешел к другому месту. Здесь меняю запятую на точку - происходит замена здесь и в предыдущем месте. Третье место скрипт проскакивает, но там результат "дороги,. Лишь"

Аватар пользователя tvnic

В этом абзаце
Некоторое время ничего не происходило, Он медленно топтался вокруг меня, потом останавливался, Шагал и останавливался, Решает, как поступить. Но что он хочет сделать?
первые две замены запятой на точку скрипт проигнорировал, но после третьего заменил во всех трех местах сразу.
При запуске скрипта оставляю все четыре галочки.

1. "Хотение" прояснилось. Подумаю.

2. Скрипт ИЗМЕНЯЕТ проделанные коррекции в абзаце ПОСЛЕ перехода на СЛЕДУЮЩИЙ - такова специфика работы. Более того на достаточно многословном абзаце видно, что подстветка найденных регеспов может "скакать" произвольным образом. Это - НОРМАЛЬНО!
Так во всех скриптах. При выходе (кнопка Отмена) - проделанные изменения в последнем абзаце - не сохраняються.

Аватар пользователя tvnic

Alex2L написал:
2. Скрипт ИЗМЕНЯЕТ проделанные коррекции в абзаце ПОСЛЕ перехода на СЛЕДУЮЩИЙ - такова специфика работы.

Да, это я понял.
Alex2L написал:
При выходе (кнопка Отмена) - проделанные изменения в последнем абзаце - не сохраняються.

Осторожно предполагаю, что скрипт пропускает какие-то места. Только после трех прогонов файла не осталось мест с запятой перед прописной буквой. Допускаю, что вместо кнопки ДА кликал на НЕТ и при выходе кнопку Отмена. Короче, надо собирать статистику.

Всем - обновления!
Версия v.2.14 — устранены недочеты при замене "Запятая перед Строчной" на "Точка перед Строчной" в т.ч. режиме ПРЕЦЕДЕНТ
Здеся:

Для tvnic - на обновленной версии все ваши "узкие" места обрабатываються за один проход. Если есть возможность перепроверить на исходной книге с ошибками (хотя бы немного) -желательно сделать. Насчет изменить

Цитата:
окно с выбором замены
" - вполне возможно, но уже в августе. Т.к. неумолимо приближаеться двухнедельный отпуск вдали от цивилизации. Сейчас это решено иначе - нужно внимательно смотреть на "узкое" место и четко отвечать на вопросы скрипта.
Аватар пользователя tvnic

Проверил на небольшом куске текста - судя по всему норма. Или я внимательнее был? :)
Очень приятно, что скрипт теперь предлагает замену на точку. Спасибо.
Парочка нюансов. Специально проигнорировал замену запятой на точку. Результат - скрипт убирает запятую без замены. Это место находится повторной прогонкой. Если вручную в этом месте снова поставить запятую, то скрипт ее не находит.

Ага... Посмотрим... Поправим...

Внимание!
В версии 2.14 обнаружился баг - пропадала запятая перед Строчной при отрицательном ответе. Устранено.
Спасибо tvnic !
Версия 2.15:

Аватар пользователя Like Indigo

у меня при запуске скрипта Точка-запятая вылазит окошко с названием Диалоговое окно веб-страницы (на нем иконка Interntet explorer), оно белое и ничего не делает. Висит, пока не закроешь((((. Скрипт брала из последнего сообщения, версия v.2.15

М-да... Моя вина! Выкладывал только скрипт (в последнем сообщении), а ранее (в полном архиве) - был еще файл "Точка-Запятая - выбор режимов.htm" - он-то и нужен! И еще voc_1.txt в соответствующей подпапке! См. начало ветки, то что Wotti написал, или мой пост от 4-го 7-го (здеся:

)
Обратите ВНИМАНИЕ на структуру папок! Итак - 1. распаковываем версию 2.03, а затем поверх - 2.15.
Удачи!

Алекс, активно пользуюсь косяков пока не увидел
Скажи, при пополнении базы скрипта ПРЕДЛОГИ скорость парсинга падает?

Падать должна, но врядли заметно. Всё зависит от компа. Каждый отдельный "ПРЕДЛОГ" - отдельный регесп. Регеспы обрабатываються быстро. Наверное, даже тысячи "ПРЕДЛОГОВ" погоды не сделают. Ну, добавит пару-тройку лишних секунд.

Alex2L написал:
Падать должна, но врядли заметно. Всё зависит от компа. Каждый отдельный "ПРЕДЛОГ" - отдельный регесп. Регеспы обрабатываються быстро. Наверное, даже тысячи "ПРЕДЛОГОВ" погоды не сделают. Ну, добавит пару-тройку лишних секунд.

Это хорошо!))) Буду наполнять без опасений
Аватар пользователя Ergo80

nочему-то после запуска обеих скриптов такая ошибка лезет

Аналогично. Поэтому и скриптами этими нет желания пользоваться.

Пользоваться скриптами или с гневом и возмущением добровольно отказаться от их использование - каждый решает индивидуально.
По поводу ошибок:
1. Желательно сообщать не только номер ошибки, а хотя бы еще тип операционной системы, установленные сервис-паки и версии Frameworka, в т.ч. XML-парсеры. В предположении, что установлены свежие сервис-паки и пр., касательно ошибки следующий комментарий. Системная ошибка 2146697211 - access denied - т.е. либо нет прав на доступ к файлу (об это далее), либо - скрипт НЕ НАХОДИТ нужный файл. В самом первом посте ветки уважаемый wotti писал

Цитата:
Как разложить файлы:...
Если что-то не получается, прочтите, наконец, инструкцию...
2.Теперь о доступе - на 64-х битных Viste и 7-ке НЕ УСТАНАВЛИВАЙТЕ FB-Editor в директорию "Program Files (x86)" - инсталлируйте в корень C: или D: или в какую-нить поддиректорию. И будет вам счастье.
Аватар пользователя Ergo80

Alex2L написал:
установленные сервис-паки и версии Frameworka, в т.ч. XML-парсеры.

А разжевать не? Я в том не шарю а пользоваться хоцца
ВиндаХР все разложила как сказал уважаемый вотти

Alex2L написал:
И будет вам счастье.

(мечтательно) Хорощо бы...

Установите MSXML 4.0 Service Pack 2 (Microsoft XML Core Services) - http://www.microsoft.com/en-us/download/details.aspx?id=19662
В каталоге \XML файлы adh_1.txt, voc_1.txt - присутствуют? А также подкаталог CSS с файлом "Протокол.css"?

X