Achtung!!! Утилита Any to FB2 есть абзацы!!!

Forums: 

Hi All! Возможно это уже проходили. Вычитывая книгу созданную сперва в MS Word а потом преобразованную в FB2 утилитой "Any to FB2" обнаружил съеденными 20 тыс знаков! (поправленный текст 622 тыс знаков, после преобразования 604 тыс знаков) Кстати как эту инфу сравнить с тем что даёт MS Word знаков с пробелами 617 тыс?

Расскажи, как считал знаки. Тоже хочу проверить.
Upd. Для преобразования хорошо использовать копипаст из всего (браузера, редактора, word viewer'а, ...) непосредственно в FBE2. Получается быстро и почти аккуратно (например, если в оригинале абзац заканчивался пробелом, то и после копипаста будет заканчиваться им же - так что немножко уборки таки надо).

1 Как считал FBE2.6 Скрипты-> Статистика показывает Общий размер текста" в MS Word понятно как
2 Обнаружил случайно по смысловым разрывам в тексте. Выброшенными, иногда(!!!), оказывались абзацы последние га странице если в них есть сноски
3 Copy&Paste из MS Word даёт много "чешуи" вставок тэгов и прочее. Для большого текста неудобно.
4 Альтернатива OpenOffice + Tools хороший вариант, но для данной книги почему то не прошёл

Belomor.canal написал:
3 Copy&Paste из MS Word даёт много "чешуи" вставок тэгов и прочее. Для большого текста неудобно.

Прочее вычищается скриптом, со стилями - не знаю, не сталкивался, но наверно можно убрать заменой. В любом случае, геморрроя меньше, чем с этой прогой, сделанной Грибовым для личного пользования.

Так это, есть же doc2fb. Она вроде ничего не теряет. Только сноски в вордовском тексте нельзя делать курсивом и жирным.

Аватар пользователя s_Sergius

Belomor.canal написал:
4 Альтернатива OpenOffice + Tools хороший вариант, но для данной книги почему то не прошёл

А что с данной книгой не так? У меня с OOoFBTools ни разу трудностей не возникло.
Нельзя ли ссылочку на этот DOC получить? Просто взглянуть для интереса.

s_Sergius написал:
Нельзя ли ссылочку на этот DOC получить? Просто взглянуть для интереса.

1 Я положил файл на ftp://lib.rus.ec в папку /OpenToolsError/ найду ещё то "куды ложить?"
2 Используя связку OpenOffice+OOTool cделал не менее 50 текстов. Но иногда работа кончалась полным аутом
3 AnyToFb2 прекрасно работает с html! Просто и ясно! Так что если исходник в html то рекомендую!
Аватар пользователя s_Sergius

Посмотрел. OOoFBTools всё сделал нормально. Честно перенес всё в FB2. Дело было в исходном DOCe. В сносках №№ 38, 187 и 194 между табуляцией и пробелом присутствует какой-то паразитный невидимый символ, на который валидатор и ругается.
После удаления этих символов, файл становится валидным. Я использовал для исправления AkelPad, а можно автоматизировать это дело через FB2Fix.

s_Sergius написал:
Посмотрел. OOoFBTools всё сделал нормально. Честно перенес всё в FB2. Дело было в исходном DOCe. В сносках №№ 38, 187 и 194 между табуляцией и пробелом присутствует какой-то паразитный невидимый символ, на который валидатор и ругается.
После удаления этих символов, файл становится валидным. Я использовал для исправления AkelPad, а можно автоматизировать это дело через FB2Fix.

Увы ссылка недоступна! У меня был случай (если найду то выложу) что OpenOffice.Writer почему то посчитал, что весь текст состоит из многих таблиц и при использования тулзы получился fb2 из таблиц! Нельзя ли добавить опцию в тулзе игнорировать таблицы?
Аватар пользователя s_Sergius

Belomor.canal написал:
Увы ссылка недоступна!

Странно. Ну ладно, посмотрите здесь: http://biblioteka.cc/topic/92159-fb2fix-ffshell/
Графическая оболочка другая, но сам FB2Fix тот же.
Belomor.canal написал:
У меня был случай (если найду то выложу) что OpenOffice.Writer почему то посчитал, что весь текст состоит из многих таблиц и при использования тулзы получился fb2 из таблиц!

Да, на это было бы интересно посмотреть. Сам не сталкивался.
Belomor.canal написал:
Нельзя ли добавить опцию в тулзе игнорировать таблицы?

Да кто ж его знает? Это к разработчикам, наверное.
Аватар пользователя s_Sergius

Belomor.canal написал:
3 AnyToFb2 прекрасно работает с html! Просто и ясно! Так что если исходник в html то рекомендую!

Не, иногда «простота хуже воровства».
Аватар пользователя s_Sergius

Интересно, почему столько народу, при всех этих заморочках, так упрямо пользуется «Any2FB2»? Прямо мазохизм какой-то.

Цитата:

Утилита Any to FB2 ест абзацы!!!

Ну надо же ей чем-то питаться...

Hi All!
1 посмотрел другие книги - везде по разному. Есть удачно конвертируемые. Конкретно в этой книги мне надо было глянуть errorlog там имеется весь выкинутый текст типа

XML Validation failed (2 pass) at line 138, in text: /Слово θΰω, жертвовать, значит еще бушевать, т. е. то же действие, что русское буря[6] По-видимому, это действие, жертвоприношение, сопровождалось какими-то бурными движениями, страстями — ведь не чисто формальное же это было занятие./
Fixing and retrying...

2 Про Copy&Paste - как засобачить целую книгу? Получается типа
[style name="MsoFootnoteReference"][style name="MsoFootnoteReference"][4][/style][/style] и т.д.

Если в в doc файле много стилей то конечно в Notepade++ RegularExp но уж очень много возни

3 Про OpenOffice + Тулза
Я кладу файл на ftp://lib.rus.ec в папку /OpenToolsError/
но здесь легко исправимый случай были и похуже! Постараюсь найти!

X