Вы здесьFR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Опубликовано сб, 25/04/2020 - 17:23 пользователем Civilizator
В общем давно уже не распознавал книжки, весь софт ставил заново, многое старое забыл, а умные люди сделали многое полезного нового. В общем замечательно распозналась книжка в ФайнРидере 15-ом, сохранил её в формате ФБ2, загрузил в FBE чтобы прописать там все нужные мелочи и вообще причесать. А оно не сохраняет. Пишет, что незакрытые какие-то "th, td". Файнридер все картинки впихнул внутрь таблиц. Я подозреваю, что надо как-то избавится от таблиц? Но 78 иллюстраций в книжке, замучаешься вручную. запустил скрипт "чистка" - осталось 4 картинки из 78 - явно ненормальная ситуация. Кто-то может подскажет как это правильно сделать? Заранее благодарен.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
mazay RE:Беженцы с Флибусты 3 часа
babajga RE:Подайте бедному копеечку на книжку с литреса... 3 дня Isais RE:DNS 1 неделя Саша из Киева RE:Приключения белочки Рыжки 1 неделя alex-from RE:Оплатил два раза, но абонемента нет 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 недели Kiesza RE:На 78-м году жизни скончался советский и российский... 2 недели Paul von Sokolovski RE:Бушков умер. 3 недели lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 3 недели mig2009 RE:Багрепорт - 2 4 недели Isais RE:Издательство "Медуза" 1 месяц babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 1 месяц Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 месяц sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц Isais RE:Игорь Северянин - Том 2. Поэзоантракт 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц sem14 RE:Семейственность в литературе 4 дня Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 месяц Впечатления о книгах
alexk про Резанова: Чудо и чудовище (Историческое фэнтези)
18 11 дурацкий знаккачества и мания величия isais, ничего не поправить, ничего не дополнить
mazay про Arladaar
18 11 Жеке сегодня, как минимум, под 70. Так что Аня могла бы быть Жекиной внучкой. Тем более, что писал, всё-таки, мужчина. Или диктовал!
Олег Макаров. про Максимушкин: Бомбардировщики (Альтернативная история)
17 11 строители коммунизма и последователи национал-социализма решили объединиться" ... вот это аттракицон срывания всех и всяческих масок Удивительно, что автор не привлечён до сих пор ни по какой статье
mysevra про Панов: Яр(к)ость [litres] (Социальная фантастика)
17 11 Хорошо, но преследует ощущение, что это компиляция старых текстов и идей, вплоть до того, что начинаешь заранее узнавать ещё не прочитанные диалоги и сюжетные повороты. Продолжение не заинтересовало. Оценка: хорошо
mysevra про Гитин: Эта покорная тварь – женщина (Психология, Эротика, Секс)
17 11 Читано давно, во времена босоногой юности. И впечатление произвело ошеломительное. Мерзкое, но ошеломительное. А сейчас бегло просмотрела: ну да, как в той притче, в которой кто за что подержал слона, тот так его и описал. ……… Оценка: плохо
mysevra про Смеклоф: Тайны Кипеллена. Дело о запертых кошмарах (Детективная фантастика, Самиздат, сетевая литература)
17 11 Водянистое какое-то. Натужное. Словно неотредактированное школьное сочинение. Оценка: плохо
Belomor.canal про Сэнсом: Камни вместо сердец [litres] [Heartstone ru] (Исторический детектив, Триллер)
16 11 Вполне на общем уровне серии книга. Как ни странно присутствует современная проблематика и мерин Метью имеет самую оригинальную кличку из всех данными ему переводчиками! Оценка: отлично!
Belomor.canal про Сэнсом: Соверен [Sovereign ru] (Исторический детектив)
16 11 Одна из лучших книг серии! Здесь ещё мерин Мэтью имеет кличку Предок, но в следующей книге будет по другому. Как именно? Читайте и узнаете! Оценка: отлично!
Belomor.canal про Сэнсом: Мертвая земля [litres] [Tombland ru] (Исторический детектив, Детективы: прочее)
16 11 Прочитав все семь "сезонов" очень не хочется расставаться с полюбившейся компанией Тамазин Ридбурн, Джек Барак, Гай Малтон и конечно наш Мэтью. Так и хочется проехать до станции метро Holborn и пойти в Линкольнс-Инн к сержанту ……… Оценка: отлично!
Lan2292 про Бобров: Чужак. Том 1, том 2 [СИ] (Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
16 11 начинала три раза,дошла до второго тома, не нравится, скучно Оценка: плохо
udrees про Саркисянц: Английские корни Третьего Рейха. От британской к австро-баварской «расе господ» [Adolf Hitlers englische Vorbilder: Vom britischen zum ostmärkisch-bajuwarischen Herrenmenschentum [Vorlesungen[,] gehalten an der Heidelberger Universität.] ru] (История, Политика, Публицистика)
15 11 Поначалу интересно было читать, но потом книга кажется скатилась в один повтор, как все в Англии восхищались Гитлером и помогали ему начать войну. Первая половина книги ничего, описывается как Британия правила в колониях, ……… Оценка: неплохо
udrees про Мантикор: Город, которого нет 4 [СИ] (Фэнтези, Самиздат, сетевая литература)
15 11 По сравнению с предыдущими тремя книгами серии больше занимает поиск героем истины, своего пути. Боевых сцен достаточно немного, они есть и тоже имеют свою специфику, но идут не так непрерывно как в первых книгах. В целом ……… Оценка: хорошо |
Комментарии
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
...
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Сам впихнул или ему кто-то это позволил не изменив тип распознанной области?
Откройте fb2 в текстовом редакторе и воспользуйтесь поиском.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Сам впихнул. Картинки он типизирует как картинки, но при сохранении в ФБ2 из изображения и подписи делает таблицу.
Открыть в редакторе и искать - это и есть "вручную". Это я и без подсказки могу, но лениво столько вручную редактировать, хочется узнать как это правильно автоматизировать. Тем более не последнюю книгу распознаю, на будущее в очереди еще много книжек с большим количеством иллюстраций.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Воспользоваться текстовым редактором чуть сложнее, чем стандартный Блокнот. Применив в нем функцию Поиск/Замена.
Если вы ищете готовое однокнопочное решение вашей проблемы, то вряд ли найдете. А вот правильное средство посоветовать могу - скрипты.
P.S. Кстати, нельзя ли увидеть образец "проблемной" страницы? Как в виде скрина после распознавания, так и после сохранения в fb2.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Ковыряться в FR 15 на предмет "нормализации" дольше, чем вручную "выковыривать" картинки из таблиц.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Открыть в FBE режиме сорцев, запустить тотальную замену в тексте:
<td> > <p>, </td> > </p>и так далее, всё,<table> > пустое местои так далее.Может, конечно, получиться, что у вас какой-то
<p>окажется без</p>-- тогда вручную в этом же режиме найти и вставить.RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Именно так.
И ещё.
В стареньком ФР12 программа после распознавания выдает список проблемных страниц. Если их не миллион, то можно отменить в них распознанные таблицы и перераспознать.
Наверняка, и в ФР15 так же.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Наверное мой совет не подойдет, поскольку вопрос был о том, как автоматизировать удаление таблиц. Но по собственному опыту могу сказать, что после файнридера автоматический поиск и замену нужно применять крайне осторожно - может возникнуть ситуация, когда файл просто не будет сохраняться. Сам я обычно сначала правлю структуру, до уровня, когда наличие tr, td и tн выводится как единственная ошибка, а потом, поскольку картинки, вставленные файнридером, далеко не идеальны, расставляю их по новой, после правки в фотошопе. И тут уже необходимости в автоматизации особой нет - все делается вручную. Но процесс контролируем и неожиданных ошибок не возникает. Но если хочется автоматизировать, то после правки структуры поиск с заменой (tr, td. th. table и т.д.) может оказаться вполне достаточным.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
И следи за пустыми строками там, где они были в книге: Фаня любит их игнорировать. Но опять же: часто в книге пустые строки ставятся, чтобы отделить цитату или эпиграф или стихи от текста, тогда оформить соответственно, а пустая строка не нужна.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Вы не находите, что несколько нелепо поучать человека, который восемь лет на сайте и сделал уже больше сотни книг? Причем технических претензий к его книгам не возникает -- это не Сундук, будь он неладен!
А поучать опытного верстальщика в таком тоне, как Вы это сделали, вообще ни в какие ворота не лезет.
Язык придерживайте. Невзирая на желание его почесать.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
А я никого не поучаю, просто делюсь своим опытом, которого у меня огого! :))
Ну и ты бы поделился, чивоущтам! Я ж ведь знаю, что ты опытный.
"Опытный" верстальщик
так бы не накосячилтоже может ошибаться. В данном случае я даю ему совет как ещё более опытный.RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
В очередной раз убеждаюсь: комплекс полноценности не лечится.
Тогда придется объяснять
по лбув лоб:и я не скажу, куда вам идти. Не ваше это собачье дело -- решать за меня;Доступно?
Или повторить?
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
себе повтори!
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Вы ведете себя отвратительно! Флибустянский срач пахнет издали. Не "тыкайте" незнакомым людям, хотя бы... А впрочем, кому это я о культуре...
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Блин. Чисто технический вопрос. Ожидался чисто технический ответ. Ну как, как даже в этом народ умудряется найти темы для посраться? Я это понимать отказываюсь! Жалко, что никак это позорище удалить не могу отсюда...
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
можно и так
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
В общем, копипаст - наше всё!
Да, ещё: следите, чтобы не потерялись пустые строки, где они были в книге: Фаня любит их игнорировать. Но опять же: часто в книге пустые строки ставятся, чтобы отделить цитату или эпиграф или стихи от текста, тогда оформить соответственно, а пустая строка не нужна.
Не сохраняйте в doc: потеряются кавычки(точнее, преобразуются из «» в ""). Имеет смысл сохранять в txt UTF8, только опять же нужно следить, чтобы не пропали emphasis и strong там где это надо, а не subtitle или title, ну и стихи надо по особому оформлять: у Фани вообще нет стихов, каждую строку стиха нужно размечать отдельной областью распознавания, чтобы Фаня не слил все строки стиха в одну строку.
Насчёт IrfanView и сохранения картинок: чтобы png получился минимального размера, нужно использовать плагин pngout, этот плагин активен только в версии IrfanView 32бит, поэтому пришлось сносить 64разрядный IrfanView, хоть в нём и было больше плагинов, чем в 32разрядном, но конкретно этот плагин не хотел работать. Для наибольшего сжатия уровень сжатия должен быть 9, но иногда при таком уровне IrfanView может почистить скан от артефактов, а если это не артефакты, а деталь рисунка? Тогда безопасный уровень сжатия 6: рисунок не будет самовольно чиститься от артефактов или деталей рисунка, похожих на артефакты, но размер рисунка будет несколько больше.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Возможно кому-то пригодится.
В PHP есть подходящая функция strip_tags()
Удаляет все HTML теги, какие найдет, кроме разрешенных.
Пример использования.
<?php$text = 'Какой-то текст содержащий HTML';
strip_tags($text, '<p><a><i><strong><img>');
echo $text;
?>
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Чувствую, лучше всего будет потратить пару дней и разобраться с тем, как самостоятельно написать скрипт для FBE.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Совсем необязательно изобретать скрипт под "php, что джаваскрипт", достаточно написать простенький регексп и под Notepad++ довести ФБ2 до ума. Notepad++ понимает регекспы, если чё.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Благодаря Violontan проблема решена самым удобным и правильным образом - добавлением скрипта в FBE.
Скрипт "Превратить таблицы в простой текст v1.1" залил в git-хранилище исходников FBE:
github точка com слэш sensboston слэш fictionbookeditor
Лежит в папке
/files/Scripts/19_Обработка форматирования/
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
не работает, при запуске программы "Ошибка выполнения скрипта"
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Попробуйте скачать с такого адреса:
scripts точка fictionbook точка org слэш files3 слэш ConvertTablesIntoText_v1_1.zip
На GitHub.com, я думаю, файл тоже корректный, но его оттуда надо сохранять правым кликом мыши по кнопке "Raw", и далее - "Сохранить объект как...".
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Автор уже дал альтернативную ссылку, но я и по первоначальной всё скачал. Перед запуском просто просмотрел сохраненный файл и, сравнив с другими скриптами, убрал лишние символы. Всё заработало с первой попытки применения.