Вопрос по OOoFBTools

Суть вопроса такова.
Беру док-файл и конвертирую его в FB2 с помощью OOoFBTools. При этом заполняю только обязательные поля в дескрипшене. Структуру документа вообще не трогаю. В полученном FB2-файле по всему тексту в режиме Source вижу id="_bookmark0" и т.д. по счету. Почему эти заметки появляются и как с ними бороться?
При аналогичной операции с помощью doc2fb получаю девственно чистый от всего этого мусора FB2-файл.

Комментарии

Аватар пользователя s_Sergius

Дайте ссылочку на doc. Для экспериментов.
А то с ходу, вслепую, ставить диагноз как-то не хочется. (Опыт работы с OOoFBTools есть).

s_Sergius написал:
Опыт работы с OOoFBTools есть.

Я бы тоже попробовала, но боюсь, что ОО будет конфликтовать с моим Вордом. Или?
Аватар пользователя s_Sergius

golma1 написал:
s_Sergius написал:
Опыт работы с OOoFBTools есть.

Я бы тоже попробовала, но боюсь, что ОО будет конфликтовать с моим Вордом. Или?

OpenOffice (сейчас, пожалуй, лучше использовать LibreOffice) ничуть с Word'ом не конфликтует. При установке надо только отказаться от ассоциаций с какими-либо типами файлов. Так, на всякий случай.

Я всю работу в Word'e и делаю, все-таки он привычнее, плюс там всякие макросы, клавиши и т.д.
Редактор же LibreOffice использую только для запуска OOoFBTools.

golma1 написал:

Я бы тоже попробовала, но боюсь, что ОО будет конфликтовать с моим Вордом. Или?

Есть у меня портабельная версия. Для экспериментов самое то. Ща залью куда-нибудь.

upd: Вот - http://ifolder.ru/24434994
OOoFBTools-1.20 уже подключено.

J_Blood написал:

upd: Вот - http://ifolder.ru/24434994
OOoFBTools-1.20 уже подключено.

Вот спасибо. Огромное.
Теперь точно попробую.

J_Blood написал:
golma1 написал:

Я бы тоже попробовала, но боюсь, что ОО будет конфликтовать с моим Вордом. Или?

Есть у меня портабельная версия. Для экспериментов самое то. Ща залью куда-нибудь.

upd: Вот - http://ifolder.ru/24434994
OOoFBTools-1.20 уже подключено.


Как раз портабельную и не советую: могут не конвертиться картинки. Могут быть глюки. При передаче из Файнридера в портабельный ОО будут траблы. При работе с портабельным траблы у ОООFBTools. В руководстве к OOOFBTools написано, что устанавливаемый лучше, чем портабельный. И ещё: при работе с OOoFBTools, OpenOffice НЕ должен висеть в трее, иначе картинки не сконвертятся.
Для того, кто привык к Word 2003 перейти на OpenOffice гораздо легче, чем на Word2007.
Не пользуйтесь портативками: огребёте по самое не могу
http://finereader.abbyy.ru/forum/actualthread.aspx?tid=1051

Если мы об одном и том же... Лично я жму F5, открывается окно навигации:

Удаляю все эти закладки и разделы. Структуру формирую потом в FBE.
Вся эта фигня передается, похоже, из файнридера, на заголовках, даже если текст без форматирования. Может и есть там какие хитрые настройки, я не нашел.

s_Sergius написал:
Дайте ссылочку на doc. Для экспериментов.
А то с ходу, вслепую, ставить диагноз как-то не хочется. (Опыт работы с OOoFBTools есть).

Давать ссылку наверно не буду, так как выяснена причина появления этого мусора. См. ниже.

J_Blood написал:
Если мы об одном и том же... Лично я жму F5, открывается окно навигации:

Удаляю все эти закладки и разделы. Структуру формирую потом в FBE.
Вся эта фигня передается, похоже, из файнридера, на заголовках, даже если текст без форматирования. Может и есть там какие хитрые настройки, я не нашел.

Сделал, как Вы посоветовали - закладок не стало. Только вот удаляются по одной, а не все оптом (у меня было 79 шт.).
Судя по всему мусор пришел из файнридера. Я этот док-файл сохранил как тхт, а потом конвертировал в FB2 - тоже норма.

Но возникает вопрос. Почему с этой мутью doc2fb справляется, а OOoFBTools бессилен?

Аватар пользователя s_Sergius

tvnic написал:
Но возникает вопрос. Почему с этой мутью doc2fb справляется, а OOoFBTools бессилен?

Мне кажется, doc2fb не справляется с этой мутью, а просто игнорирует, OOoFBTools же пытается извлечь из разметки текста как можно больше, что в данном случае и излишне.

Лично я для очистки от подобного использую copy+paste в AkelPad, а потом обратно. Это помогает и от других проблем, типа списков вместо нормальных диалогов с тире.
Если же текст одновременно содержит и полезную разметку, то сложнее. Приходится чистить ручками. Только я делаю в Word'e.

Можно сделать копипаст в ОО

Спасибо всем за советы.
Спрошу еще вот что. Создавать FB2-документы стал пару недель назад. Мне интересно, похожи ли по эффективности скрипты в OOoFBTools и FBE. Вообще текст обрабатываю скриптами в FBE, но возможно и OOoFBTools имеет свою фишку.

Аватар пользователя s_Sergius

tvnic написал:
Мне интересно, похожи ли по эффективности скрипты в OOoFBTools и FBE. Вообще текст обрабатываю скриптами в FBE, но возможно и OOoFBTools имеет свою фишку.

Может и имеет. Но искать смысла особого нет.


Ради интереса можете еще покрутить LOPyFB2Tools — аналог OOoFBTools, точнее он же, перенесенный на Pyton. Работает примерно так же, но только гораздо быстрее.

s_Sergius написал:
tvnic написал:
Мне интересно, похожи ли по эффективности скрипты в OOoFBTools и FBE. Вообще текст обрабатываю скриптами в FBE, но возможно и OOoFBTools имеет свою фишку.
Может и имеет. Но искать смысла особого нет.

http://finereader.abbyy.ru/forum/actualthread.aspx?tid=840

Угу, и я - спасибо. Ещё бы ссыль, где основы почитать. Собственно, меня интересует в основном, с точки зрения обработки таблиц

wotti написал:
Угу, и я - спасибо. Ещё бы ссыль, где основы почитать. Собственно, меня интересует в основном, с точки зрения обработки таблиц

Сильно в дебри не влезал, но вот что эта штука хорошо конвертит по дефолту, так это сноски и таблицы (не сильно навороченные), если они в исходном doc/rtf нормально оформлены. За то и держу:))

Отчёт.
Взяла обычный свой док после распознавания и конвертировала его двумя способами OOoFBTools и doc2fb.
Первый работает раза в 3-4 дольше, нашел более 30 bookmarks, которые удалить можно было только по одному (ЧЯДНТ?). Основное время уходит на абсолютно ненужную валидацию (с файлом после этого всего равно много работы). Можно это где-то отключить?

Единственный плюс - получение сразу валидного файла за счёт заполнения дескрипшена. Не нашла раздел для оригинала книги. Где-то не поставила нужную галочку?

В общем, пока не заметила больших преимуществ. Разве что доступность ОО.
Пропустила я что-то важное или действительно особых различий нет?

Валидатор можно отключить. Экспорт в fb2 -> настройки. Вот с оригиналом книги разработчики похоже промахнулись, это да. А преимущества - корректно сноски и таблицы конвертит, хотя сноски я таки предпочитаю в FBE. Больше от привычки зависит по-моему. Некоторые от FBE плюются:))

J_Blood написал:
Валидатор можно отключить. Экспорт в fb2 -> настройки. Вот с оригиналом книги разработчики похоже промахнулись, это да. А преимущества - корректно сноски и таблицы конвертит, хотя сноски я таки предпочитаю в FBE. Больше от привычки зависит по-моему. Некоторые от FBE плюются:))

Ага, без валидации быстрее, но всё равно довольно медленно. К тому же программа зависла после изменения настроек. :(
А если учесть, что таблицы я почти никогда не делаю, а сноски всегда переношу к слову, то... ;)
В общем, привычка - наше всё. У каждого свой алгоритм. :)))

Но сохраню обязательно. Запас карман не рвёт. В-)
Так что ещё раз Вам большое спасибо.

Аватар пользователя s_Sergius

Валидацию можно отключить в настройках.
Для меня основным преимуществом OOoFBTools перед остальными конвертерами является умение делать fb2-таблицы. Всё остальное, в принципе, делают и другие. Плюсом считаю и способность сразу заполнять description (вот раздела для информации об оригинале для переводных книг тоже не нашел) и делать разметку сразу всеми нужными стилями, т.е. применять заголовки нужного уровня, стихи, эпиграфы, цитаты, сноски, иллюстрации и т.д. Помнится doc2fb эпиграфы вообще не признавал.
Cкорость обработки актуальной не считаю. Но если это важно, использую LOPyFB2Tools. Делает всё гораздо быстрее. В разы.


Использовать portable-версии OO смысла нет. Самые последние версии OpenOffice, LibreOffice и OOoFBTools для любых ОС и языков доступны и свободны. Ссылки есть на нашей страничке Программы.

В комплекте с OOoFBTools идут примеры сложно размеченных документов, а также OOoFBTools_Help.pdf, где достаточно информации для начала работы. А дальше уж как пойдет. Если пойдет, конечно.

s_Sergius написал:

Для меня основным преимуществом OOoFBTools перед остальными конвертерами является умение делать fb2-таблицы. Всё остальное, в принципе, делают и другие.

Ну, значит, ничего фундаментального я не пропустила. ;)

Останусь пока при своём doc2fb. ;)
Но если что - буду просить помощи. :)))

Аватар пользователя s_Sergius

Да я не настаиваю.

Хотя, после того как распробовал OOoFBTools (и LOPyFB2Tools), я не очень понимаю, как без них обходился раньше, и как другие до сих пор не видят их очевидных преимуществ...
Привычка, наверное. :(

Насчет помощи — без проблем.

Сноски. если они нормально оформлены и док2фб без проблем делает. Тем более я достиг в этом виртуозности, благодаря макросу Сергиуса. (имхо, научился из почти любого документа сделать болванку под этот макрос)
А таблицы, да. Сейчас у меня довольно сомнительная метода их делания. Сам удивляюсь, что получаются

Аватар пользователя s_Sergius

wotti написал:
А таблицы, да. Сейчас у меня довольно сомнительная метода их делания. Сам удивляюсь, что получаются

А что за метода? Не поделишься?

s_Sergius написал:
wotti написал:
А таблицы, да. Сейчас у меня довольно сомнительная метода их делания. Сам удивляюсь, что получаются

А что за метода? Не поделишься?

Не...
Стыдно )))

tvnic написал:
Суть вопроса такова.
Беру док-файл и конвертирую его в FB2 с помощью OOoFBTools. При этом заполняю только обязательные поля в дескрипшене. Структуру документа вообще не трогаю. В полученном FB2-файле по всему тексту в режиме Source вижу id="_bookmark0" и т.д. по счету. Почему эти заметки появляются и как с ними бороться?
При аналогичной операции с помощью doc2fb получаю девственно чистый от всего этого мусора FB2-файл.

В настройках FBTools снять галку с "Обработка ссылок внутри документа".

Сохраняю из док в текст, потом обратно. Все эти проблемы снимаются.

tvnic написал:
Сохраняю из док в текст, потом обратно. Все эти проблемы снимаются.

А с курсивами-болдами тогда как?

Давненько конвертировал с помощью OOoFBTools - без проблем. Понадобилось doc в FB2 - не получается. Кликаю кнопку "экспорт" - процесс идет, но результат:

XML 6 поврежден, похоже.

Аватар пользователя remembecoventry

tvnic написал:
Давненько конвертировал с помощью OOoFBTools - без проблем. Понадобилось doc в FB2 - не получается. Кликаю кнопку "экспорт" - процесс идет, но результат.

По картинке видно, что система ищет скрипт валидатора fb2-valid -win32.vbs в директории C:\Temp, но файла там нет, а может и самой директории C:\Temp нет.

remembecoventry написал:
tvnic написал:
Давненько конвертировал с помощью OOoFBTools - без проблем. Понадобилось doc в FB2 - не получается. Кликаю кнопку "экспорт" - процесс идет, но результат.

По картинке видно, что система ищет скрипт валидатора fb2-valid -win32.vbs в директории C:\Temp, но файла там нет, а может и самой директории C:\Temp нет.

Есть и директория и скрипт.
Файл FB2 создается (порядка 500 Кбайт), открывается, но содержимое не отображается.
Аватар пользователя remembecoventry

tvnic написал:
Есть и директория и скрипт.
Файл FB2 создается (порядка 500 Кбайт), открывается, но содержимое не отображается.

1. Попробовать скачать свежий OOoFBTools. Снести в ОпенОффисе старый OOoFBTools и поставить новый.
2. Возможно скрипт валидатора как-то блочит ваш антивирус. У меня Аваст постоянно запускает валидатор в сандбоксе.

remembecoventry написал:

1. Попробовать скачать свежий OOoFBTools. Снести в ОпенОффисе старый OOoFBTools и поставить новый.
2. Возможно скрипт валидатора как-то блочит ваш антивирус. У меня Аваст постоянно запускает валидатор в сандбоксе.

Попробовал с отключенным антивирусом - то же самое.
Снести-поставить. Я вроде одним присестом устанавливал все вместе ОпенОффисе и OOoFBTools. И как это делается по отдельности?

Аватар пользователя remembecoventry

tvnic написал:
Снести-поставить. Я вроде одним присестом устанавливал все вместе ОпенОффисе и OOoFBTools. И как это делается по отдельности?

1. Сносится так — в меню Writer ОпенОфиса выбираем пункт «Сервис», в нём выбираем «Управление расширениями». Получаем список расширений. При щелчке на расширение появляется кнопка «Удалить». Удаляем.
2. Свежую версию OOoFBTools взять можно здесь — http://sourceforge.net/projects/fbtools/files/release/
3. Установка аналогична пункту 1. — «Сервис», «Управление расширениями», в списке расширений — кнопка «Добавить» и добавляем скачанное расширение.

remembecoventry написал:

1. Сносится так — в меню Writer ОпенОфиса выбираем пункт «Сервис», в нём выбираем «Управление расширениями». Получаем список расширений. При щелчке на расширение появляется кнопка «Удалить». Удаляем.
2. Свежую версию OOoFBTools взять можно здесь — http://sourceforge.net/projects/fbtools/files/release/
3. Установка аналогична пункту 1. — «Сервис», «Управление расширениями», в списке расширений — кнопка «Добавить» и добавляем скачанное расширение.

Спасибочки remembecoventry. Как часы.

remembecoventry написал:
1. Попробовать скачать свежий OOoFBTools. Снести в ОпенОффисе старый OOoFBTools и поставить новый.
Кстати, нельзя ли инструкцию с картинкаме, для самых альтернативно одаренных, как именно снести старый.
Как поставить новый, инструкция есть в файле Help.pdf, который сопровождает каждый OOoFBTools.
Аватар пользователя remembecoventry

Zadd написал:
remembecoventry написал:
1. Попробовать скачать свежий OOoFBTools. Снести в ОпенОффисе старый OOoFBTools и поставить новый.
Кстати, нельзя ли инструкцию с картинкаме, для самых альтернативно одаренных, как именно снести старый.
Как поставить новый, инструкция есть в файле Help.pdf, который сопровождает каждый OOoFBTools.

В строке меню пункт «Сервис» — в выпадающем меню пункт «Управление расширениями».

Щелкаем в ненужное расширение. Появляется кнопка «Удалить».

А какой именно из 6 требуется?
Стоит MSXML 6.0 Parser

Аватар пользователя Isais

А стоит ли? Похоже, система его потеряла, и ОО не находит.

Очередная проблема.
Экспортируется, валидация проходит, но при открытии файла выскакивает сообщение

Кликаю ОК, файл открывается, но:
D - все есть
В - пусто
S - 25 строк

Аватар пользователя s_Sergius

Такого не встречал.
Бывали проблемы с заглушками вместо картинок, если генерировал fb2 из несохраненного doc или odt, но не это.

Попробуйте еще раз, на всякий случай, сохранить документ, выйти из OpenOffice, потом зайти и по-новой сгенерировать fb2.

Вот такой картинки не должно быть:

Аватар пользователя Isais

Не хватает памяти FBE.
На этот случай держите текстовый редактор, который покажет натуральный source в виде текста.
Бывает иной раз, FBE вякает: "Ошибка line ***" и не открывает. Текстовый редактор открывает и такое и позволяет исправить ошибку/ошибочный тег и т.д.
Я пользуюсь Notepad++, другие - AkelPad и т.д. - продвинутыми текстовыми редакторами.
Вот откроете текст и будете разбираться, в чем дело... По моим предположениям, в исходном ДОКе вместо знака абзаца был знак "перевод строки". ООо его не понимает и чешет всё одним абзацем. Т.е. у Вас получился большой файл без секций и абзацев. На таких файлах FBE реально вешается.
Как исправить: заново прогнать конвертацию, предварительно заменив в исходнике "перевод каретки" на "абзац".

s_Sergius написал:
Попробуйте еще раз, на всякий случай

Да, эта картинка сперва была. Не стал читать до конца. По Вашему совету все вышло.

Isais написал:
Не хватает памяти FBE.
На этот случай держите текстовый редактор, который покажет натуральный source в виде текста.

В Compare It все отображалось.
Аватар пользователя s_Sergius

tvnic написал:
s_Sergius написал:
Попробуйте еще раз, на всякий случай

Да, эта картинка сперва была. Не стал читать до конца. По Вашему совету все вышло.

Значит, все-таки дело в этом.
В общем, желательно выработать для себя железное правило: сохранился, вышел, вошел, сгенерировал.
Тогда проблем не возникает.

Или привычку.

Isais написал:
По моим предположениям, в исходном ДОКе вместо знака абзаца был знак "перевод строки". ООо его не понимает и чешет всё одним абзацем. Т.е. у Вас получился большой файл без секций и абзацев. На таких файлах FBE реально вешается.
Как исправить: заново прогнать конвертацию, предварительно заменив в исходнике "перевод каретки" на "абзац".
Возможно. Интересно, что такая ошибка сплошь и рядом встречается в .shtml-файлах с СИ, если их прогнать через http://web2fb2.net. Лечится элементарной подстановкой в АкелПаде.(Если, конечно, открыть в АкелПаде ДО того, как откроешь в FBE, в противном случае ничего уже исправить нельзя)
В .html и .htm такой ошибки нет.
X