Школа начинающего книгодела

Аватар пользователя Антонина82

haramuha написал:

з.ы. в последующем я собираюсь досконально разобраться с самим форматом и тонкостями вычитки и конвертации, чтобы делать всю работу по книге самому...

Нас уже двое!!!!!
Первого сентября начинается новый учебный год. Предлагаю открыть при Либрусеке «Школу книгодела» имени….. (насчёт имени пока не знаю), где новичкам будут растолковываться прописные истины.
Итак. Что надо иметь к первому сентября? Списочек, пожалуйста. Только, чтоб не очень затратный, а то желание пропадёт самому (самой) делать книжки.
1. Компьютер
2.

Комментарии

Аватар пользователя Антонина82

Like Indigo написал:
Есть скрипт, называется Точка. Ищет слова, которые в середине предложения с большой буквы. Обучается, т.е. на одном и том же не тормозит. Правда, у меня всегда делает примерно треть книги и падает. Приходится по 2-3 раза запускать.

Угу... Когда делаешь ЖЗЛовскую книжку, а там сплошные ФИО... Очень неудобно.
Аватар пользователя alexej36

Цитата:
Что заставляет Вас сомневаться в его ...
Теперь понятно. Спасибо за ответ.
Аватар пользователя Isais

alexej36 написал:
Цитата:
Что заставляет Вас сомневаться в его ...
Теперь понятно.

Уточняю: не я (С)! Но догадываюсь (скорее всего, ошибочно), чей рабочий клон.

Подскажите, пожалуйста, есть ли возможность вытащить текст книги, выложенной в Adobe flash player?

wvd написал:
Подскажите, пожалуйста, есть ли возможность вытащить текст книги, выложенной в Adobe flash player?
Есть программы, которые умеют. Посмотрите в Google - SWF Decompiler.

wvd написал:
Подскажите, пожалуйста, есть ли возможность вытащить текст книги, выложенной в Adobe flash player?

Там есть книги с текстовым слоем и без него (картинка). Если там есть текстовой слой то можно постранично копировать, как текст. Если нет – постранично Print screen, а потом ФР. Получается как постраничное сканирование. И ничего сканируют же.
Аватар пользователя Антонина82

В первый раз столкнулась, поэтому переспрошу. Автор книги - итальянец. А перевод книги был сделан по французскому изданию Я поставила язык, с которого переводится - французский. Или надо итальянский указывать. В оригинальном произведении указан - итальянский.
В книги задействовано 9 языков (русский, английский, французский, немецкий. итальянский, румынский, испанский, финский, польский). Когда попросила ФР11 распознать, он возмутился и потребовал для корректного распознавания сократить количество языков. Пришлось постранично распознавать. Мой опыт подсказывает, что ФР спокойно распознает одновременно 4 языка.
А как у вас с многоязычными книгами получается?

Антонина82 написал:
В первый раз столкнулась, поэтому переспрошу. Автор книги - итальянец. А перевод книги был сделан по французскому изданию Я поставила язык, с которого переводится - французский. Или надо итальянский указывать. В оригинальном произведении указан - итальянский.
В книги задействовано 9 языков (русский, английский, французский, немецкий. итальянский, румынский, испанский, финский, польский). Когда попросила ФР11 распознать, он возмутился и потребовал для корректного распознавания сократить количество языков. Пришлось постранично распознавать. Мой опыт подсказывает, что ФР спокойно распознает одновременно 4 языка.
А как у вас с многоязычными книгами получается?
Вы правильно указали, но надо было ещё в титле оригинальной книги указать, что она является переводом с итальянского на французский. И не забудьте указать, что жанр у оригинальной книги тот же самый, что и у переводной! Нелепость, но это требование схемы валидации.
Аватар пользователя Антонина82

Zadd написал:
Вы правильно указали, но надо было ещё в титле оригинальной книги указать, что она является переводом с итальянского на французский. И не забудьте указать, что жанр у оригинальной книги тот же самый, что и у переводной! Нелепость, но это требование схемы валидации.

Я могу указать это, но для этого мне надо знать, кто переводил. Се мне неведомо. Поэтому ограничусь тем, что укажу итальянский язык - оригинальный.

Вот, вроде всё разжевал, а язык оригинала укажите всё-таки французский, т.к. перевод делался с французского, а не с итальянского. А в поле дескрипшена французской книги указать, что она, в свою очередь, является переводом с итальянского. Впрочем, в спойлере я подробно всё это нарисовал.

Антонина82 написал:
Я могу указать это, но для этого мне надо знать, кто переводил. Се мне неведомо. Поэтому ограничусь тем, что укажу итальянский язык - оригинальный.
Заблуждение! Кто переводил, знать желательно, но необязательно, главное - знать название книги, с которой(французской) переводили.
Итальянский в качестве языка, с которого переводили, тоже нелепость, ведь перевод был осуществлен с французского издания. Вот французский и надо указать в качестве языка оригинала!
А когда зальете французскую, можете указать у неё язык оригинала итальянский.
Аватар пользователя Антонина82

Можно ли добавить в FBE словарь французского языка? И если можно, то как?

Антонина82 написал:
Можно ли добавить в FBE словарь французского языка? И если можно, то как?

В самых первых версиях ФБЕ, которыми занимался SeNS, были и немецкий, и французский словари.
Может, у кого-то сохранились?

Антонина82 написал:
Можно ли добавить в FBE словарь французского языка? И если можно, то как?

Взять из оупен офиса Program Files\OpenOffice.org 2.3\share\dict\ooo\
и скопировать в Program Files\FictionBook Editor\Dict\
Переименовать оба файла de_DE_comb в de_DE - так должны называться словари

Я для Вас уже переименовал фр. и ит., а также добавил очень расширенный мной укр.
http://f-bit.ru/282002

Другие словари можно нагуглить (например, http://extensions.openoffice.org/en/search?f[0]=field_project_tags%3A157 - тут скачается расширение, его можно зипом распаковать и взять только файлы .dic и .aff)

Аватар пользователя Антонина82

Спасибо, я скачала, скопировала в папку Dict. Но не проверяет. Может еще в настройках надо что-то поменять?

Антонина82 написал:
Спасибо, я скачала, скопировала в папку Dict. Но не проверяет. Может еще в настройках надо что-то поменять?

У Вас книга наверное в utf-8 (юникод)? Вот словари под юникод
http://f-bit.ru/282025
Чтобы проверяло французский, надо язык(или язык оригинала) в дискрипшине поставить французский (ну и после добавления словарей ФБЕ перегрузить)
В настройках должно стоять "Проверять орф-ю" "Выделять слова с ошибками"
Аватар пользователя Антонина82

Vadi написал:
Антонина82 написал:
Спасибо, я скачала, скопировала в папку Dict. Но не проверяет. Может еще в настройках надо что-то поменять?

У Вас книга наверное в utf-8 (юникод)? Вот словари под юникод
http://f-bit.ru/282025
Чтобы проверяло французский, надо язык(или язык оригинала) в дискрипшине поставить французский (ну и после добавления словарей ФБЕ перегрузить)
В настройках должно стоять "Проверять орф-ю" "Выделять слова с ошибками"

Я потренировалась на Золе (без учета Вашего последнего замечания), не проверяет слова, где есть диакритические знаки. А как я поставлю в дискрипшине французский, когда книга на русском и есть французский текст. Я указала наличие оригинала на французском.
ЗЫ: сейчас проверю, может юникод влияет.

Vadi написал:
Антонина82 написал:
Можно ли добавить в FBE словарь французского языка? И если можно, то как?

Взять из оупен офиса Program Files\OpenOffice.org 2.3\share\dict\ooo\
и скопировать в Program Files\FictionBook Editor\Dict\
Переименовать оба файла de_DE_comb в de_DE - так должны называться словари

Я для Вас уже переименовал фр. и ит., а также добавил очень расширенный мной укр.
http://f-bit.ru/282002

Помедленнее, пжалста, я зписсваю... Мну на fbit не пускает, выложьте, пожалуйста на что-нибудь менее экзотическое: напр. на rghost, mediafire, ifolder наконец. Да даже и на турбобит, в конце концов, всё лучше, чем
Цитата:
Ресурс недоступен. Попробуйте поискать в Яндексе.
Аватар пользователя Антонина82

Выложила сюда http://rusfolder.com/38836235

Аватар пользователя Антонина82

Все, спасибо, получилось. Одна странность, слова, начинающиеся на букву "œ" - не проверяются. Но это мелочь.

Антонина82 написал:
Все, спасибо, получилось. Одна странность, слова, начинающиеся на букву "œ" - не проверяются. Но это мелочь.

Вот такие дела: в файле .aff указана первоначальная кодировка и набор символов словаря
SET ISO8859-15
TRY eiarsntolucéÉmpdgbhfvqjyxèÈzâÂkêÊçÇîÎïÏwûÛôÔàÀëËüÜöÖóÓíÍùÙáÁäÄ

(и правила словообразования)

Можно поискать словарь с "œ"
upd Ага, это баг словаря (недоработка) https://issues.apache.org/ooo/show_bug.cgi?id=54980 Ну, может и исправят когда...

Книга на русский переведена с немецкого перевода греческого(антик) оригинала. Переводчик на немецкий неизвестен. Какой язык оригинала – немецкий или греческий?

izekbis написал:
Книга на русский переведена с немецкого перевода греческого(антик) оригинала. Переводчик на немецкий неизвестен. Какой язык оригинала – немецкий или греческий?

Для японских книг, переведённых с английского я делала так:

<lang>ru</lang>
   <src-lang>en</src-lang>

  </title-info>
  <src-title-info>
   <genre></genre>
   <author>
    <first-name></first-name>
    <last-name></last-name>
   </author>
   <book-title></book-title>
   <date></date>
   <lang>en</lang>
   <src-lang>ja</src-lang>

  </src-title-info>

Может, Вам эта информация поможет.

Аватар пользователя Антонина82

Где можно скачать только скрипт "спецсимволов"? Я пыталась добавить туда дроби, а в результате он сломался. Без этого скрипта будет неудобно. Переустанавливать FBE мне бы не хотелось.
ЗЫ: на Флибусте говорят, что можно добавить 1/3 и 2/3. У меня это не получилось. Может кто-нибудь это сделает? И даст ссылку для скачивания.

Аватар пользователя Isais

Нужен тот, кто в яваскриптах шарит. Иначе у меня, например, тоже сломается.
Ссылки на символы у меня с прошлой зимы живут в паблике:
https://dl.dropboxusercontent.com/u/71408463/07_%D0%A1%D0%B8%D0%BC%D0%B2%D0%BE%D0%BB%D1%8B2.rar
https://dl.dropboxusercontent.com/u/71408463/07_%D0%A1%D0%B8%D0%BC%D0%B2%D0%BE%D0%BB%D1%8B.rar

Аватар пользователя Антонина82

Isais написал:
Нужен тот, кто в яваскриптах шарит. Иначе у меня, например, тоже сломается.
Ссылки на символы у меня с прошлой зимы живут в паблике:
https://dl.dropboxusercontent.com/u/71408463/07_%D0%A1%D0%B8%D0%BC%D0%B2%D0%BE%D0%BB%D1%8B2.rar
https://dl.dropboxusercontent.com/u/71408463/07_%D0%A1%D0%B8%D0%BC%D0%B2%D0%BE%D0%BB%D1%8B.rar

Скачала. А там уже прописаны 1/3 и 2/3 )))

Цитата:
Ссылки на символы у меня с прошлой зимы живут в паблике

В диалоговом окне 03_Математические символы и 09_Транскрипция пусто.
Аватар пользователя Isais

tvnic написал:
Цитата:
Ссылки на символы у меня с прошлой зимы живут в паблике

В диалоговом окне 03_Математические символы и 09_Транскрипция пусто.

А Вы правильно файлы разложили?
.js и .ico в папку "Scripts", .htm - в папку "HTML".
Аватар пользователя Антонина82

Isais написал:
tvnic написал:
Цитата:
Ссылки на символы у меня с прошлой зимы живут в паблике

В диалоговом окне 03_Математические символы и 09_Транскрипция пусто.

А Вы правильно файлы разложили?
.js и .ico в папку "Scripts", .htm - в папку "HTML".

У меня тоже не работают эти символы. Я даже не знала об их существовании.

Работают.
Делал так:
В архиве 07_Символы.rar открыл папку 07_Символы. Файлы на 03 (2 штуки) и на 09 (2 штуки) перенес в папку Program Files\FictionBook Editor\Scripts\07_Символы
Из того же архива файлы spez_math.htm и trans.htm перенес в папку Program Files\FictionBook Editor\Scripts
Работают так: ставите курсор в нужном месте, идете в Скрипты/Символы/Математические символы (или Транскрипция) и кликаете по нужному символу. Закрываете скрипт - символ стоит там, где был курсор.
FictionBook Editor Release 2.6.6 Apr 6 2012 05:04:19
----
Могу Математические символы и Транскрипции прописать в Спецсимволы - будет один длинный скрипт.

Аватар пользователя Антонина82

sd написал:

Могу Математические символы и Транскрипции прописать в Спецсимволы - будет один длинный скрипт.

Если Вас не затруднит. А то я пыталась добавить 1/3 и 2/3 - и у меня всё поломалось.Пришлось по новой загружать скрипт в программу.

Сделаю, но только к утру.
А пока можете воспользоваться этим - там пики и трефы заменены на 1/3 и 2/3. Сохраните файл к себе на компьютер, переименуйте в spez.htm и забросьте в Program Files\FictionBook Editor\Scripts
---
Прежний spez.htm лучше переименовать (spez_.htm, например) и оставить, где был - вдруг еще пригодится.
---
UPD
Готово.
Сохранить прикрепленный spez.txt на диск, переименовать в spez.htm и пренести в Program Files\FictionBook Editor\Scripts
Убрал повторы и символы, которые есть на клавиатуре (больше, меньше, делить - их код соответствовал угловым кавычкам и двоеточию), поставил правильный символ славянской тысячи. Таблицу пришлось сделать 6x15.

Ошибка: Сохранить прикрепленный spez.txt на диск Надо: Сохранить прикрепленный spez_0.txt на диск
---
Если кто решит сам добавлять и удалять символы - сайт в помощь.
---
Если что пойдет не так - прикрепляю обычный файл из ФБЕ (переименовать в spez.htm)

Не мог я не сделать ошибку - сделал. Выбросил ударение. Исправляю - ударение в конце таблицы. Прошлому не верить, теперь так:

sd написал:
Сохранить прикрепленный spez_1.txt на диск, переименовать в spez.htm и пренести в Program Files\FictionBook Editor\Scripts
Аватар пользователя Антонина82

Спасибо, установила.

sd написал:
Работают.
Делал так:
В архиве 07_Символы.rar открыл папку 07_Символы. Файлы на 03 (2 штуки) и на 09 (2 штуки) перенес в папку Program Files\FictionBook Editor\Scripts\07_Символы
Из того же архива файлы spez_math.htm и trans.htm перенес в папку Program Files\FictionBook Editor\Scripts
Работают так: ставите курсор в нужном месте, идете в Скрипты/Символы/Математические символы (или Транскрипция) и кликаете по нужному символу. Закрываете скрипт - символ стоит там, где был курсор.
FictionBook Editor Release 2.6.6 Apr 6 2012 05:04:19
Да, так работают! Странно? Обычно htm кладутся папку Html. Только угол отображается квадратиком, но его нет в кодировках Виндов.

izekbis написал:
Только угол отображается квадратиком, но его нет в кодировках Виндов.

Программы которые используют шрифты из Офиса показывают угол. Забавно повел себя ФБЕ - сперва квадратик отображал, потом (поумнел как бы) стал показывать угол ))
Он что, между системой и офисом может выбирать - где шрифты брать?

sd написал:
izekbis написал:
Только угол отображается квадратиком, но его нет в кодировках Виндов.

Программы которые используют шрифты из Офиса показывают угол. Забавно повел себя ФБЕ - сперва квадратик отображал, потом (поумнел как бы) стал показывать угол ))
Он что, между системой и офисом может выбирать - где шрифты брать?

А у меня не умнеет. Может ему подсказать надо?
Угол есть только в некоторых шрифтах: Arial unicode, Lucida unicode, Tiger expert. Если их установить в FBE то угол отображается и в файл записывается. Но читалки этих шрифтов не понимают.

Цитата:
¡¿¦§©ªº«»¬­®¯´µ¶†҂ѻ¨¸ʼʽˇ˘˙˛˝΄΅·―‾←↑→↓↔♠♣♥♦™•ˆ¹²³¼½¾⅔⅓‰ƒ−·×÷√≈≡≠≥≤∞∫∑°′″±∠ðʤŋθʃʍʒʊɔɛʌɑæəˈˌ
та́йны

Загадочная история. В ФБЕ в настроках: для текста - Требуше эмэс, код - Лусида консоль. Показывает всё, кроме ударения. Система старая, ХР лет восьми, шрифт обновлялся только один - Вердана. Перетаскиваю цитируемое в Ворд (2010) - показывает все. Проверяю шрифты: только половина - Требуше, остальное - Ариал и Камбрия мат. Значит в ФБЕ тоже при отображении происходила подмена шрифов? Совсем непонятка с ударением - в Ворде отображается правильно, причем в "та́йны" никаких следов других шрифтов, кроме Требуше не обнаруживается.
---
Планшет, андройд, алридер - шрифт: Сериф - показал все, даже угол, кроме "ʽ".
еБукДройд (шрифт ?) показывает и угол, и ударение. Квадраты вместо ҂ѻ ʽ ΄΅

Сперва не так сделал. Исправил, но без толку. Все остальные символы отображаются.

tvnic написал:
Сперва не так сделал. Исправил, но без толку. Все остальные символы отображаются.

И у меня Математические символы и Транскрипция пустые таблицы.

izekbis написал:
tvnic написал:
Сперва не так сделал. Исправил, но без толку. Все остальные символы отображаются.

И у меня Математические символы и Транскрипция пустые таблицы.

Так есть нормальный скрипт Математические символы?

Файл spez.htm можно редактировать простым блокнотом, добавлять и удалять символы. Порядок действий можно скопировать

(сейчас spez.htm лежит в папке Scripts).
Код 1/3 &#8531;, 2/3 &#8532;
---
Заменил пики на 1/3, трефы на 2/3

Аватар пользователя alexej36

Символы лучше вставлять в FR. Их там достаточно. Удобно: скан перед глазами.

Аватар пользователя Антонина82

alexej36 написал:
Символы лучше вставлять в FR. Их там достаточно. Удобно: скан перед глазами.

Мне в FR неудобно работать. Разные шрифты мешают.
В FBE один шрифт -глаза уже приноровились к нему -ошибки лучше видно. Я ещё в FBE установила светло-желтый фон -так меньше мои глазки устают

При использовании всяких спецсимволов есть нюанс.
Не нужно забывать о будущих читателях, ведь во многих шрифтах этих символов может и не оказаться!

Тут может помочь стандартное windows’кое приложение Таблица символов (Character Map).
Вызывается:
Программы —> Стандартные —> Служебные —> Таблица символов
(Programs —> Accessories —> System Tools —> Character Map).

Во-первых, символы можно вставлять в любой редактор, во-вторых, сразу видно, есть ли в данном шрифте требуемый символ.
Например, в используемом мной для чтения шрифте Verdana (и Tahoma тоже) символ ⅛ есть, а вот ⅓ — нет.

⅔⅓⅛⅜⅝⅞
С другой стороны - если в тексте используются дроби, то отображать , как один символ, а 1/3, как сборку из трех символов - тоже не выход.
Если вы в документ, который делаете используя Вердану, вставите , то Ворд заменит шрифт на Ариал - только для этого символа. Так же и либрусек, раньше в его коде был прописан шрифт Вердана, сейчас это набор разных шрифтов.
Постепенно и программы-читалки начнут более гибко использовать шрифты. Может быть. Да и Вердане пора повзрослеть, научилась же она правильно ставить ударение, значит не совсем пропащая.

Задача: разместить несколько эпиграфов подряд после картинки титульного листа, которую тоже хочется добвавить. (Если что -- картинка просто в отдельной секции и все.) Эпиграфы относятся ко всей книге (ну, может быть кроме пояснительной статьи), поэтому помещать их в начало первой секции с текстом нежелательно, так как она первая, но не единственная на этом уровне.

Помещать же блок эпиграфов в самое начало тоже нежелательно, так как тогда он будет перед титульным листом.

Я вижу два выхода:
1) блок эпиграфов загнать в свою отдельную секцию с пустой строкой для валидности и поместить куда угодно;
2) все секции, к которым относится этот блок, поместить еще в одну, безымянную, но более высокого уровня, а в ее начало поставить блок эпиграфов.

Как лучше сделать?

kozlenok написал:
Задача: разместить несколько эпиграфов подряд после картинки титульного листа, которую тоже хочется добвавить. (Если что -- картинка просто в отдельной секции и все.) Эпиграфы относятся ко всей книге (ну, может быть кроме пояснительной статьи), поэтому помещать их в начало первой секции с текстом нежелательно, так как она первая, но не единственная на этом уровне.

Помещать же блок эпиграфов в самое начало тоже нежелательно, так как тогда он будет перед титульным листом.

Я вижу два выхода:
1) блок эпиграфов загнать в свою отдельную секцию с пустой строкой для валидности и поместить куда угодно;
2) все секции, к которым относится этот блок, поместить еще в одну, безымянную, но более высокого уровня, а в ее начало поставить блок эпиграфов.

Как лучше сделать?


Можно так:
<body>
  <image l:href="#titul_list.jpg"/>
  <title>
   <p>Название книги</p>
  </title>
  <epigraph>
   <p>Эпиграф</p>
  </epigraph>
  <epigraph>
   <p>Эпиграф</p>
  </epigraph>
  <epigraph>
   <p>Эпиграф</p>
  </epigraph>
  <section>
   <title>
    <p>Глава 1 </p>
   </title>
   <p>текст</p>
   <p>текст</p>

Или title "Название книги" вообще выкинуть и после картинки сразу эпиграфы. Проверено - валидно.

Оба варианта годятся. И третий тоже.

А можно еще и так:

<body>
  <title>
   <p>Название произведения</p>
   <p><image l:href="#titul.jpg"/><p>
  </title>
  <epigraph>
   <p>Эпиграф 1</p>
  </epigraph>
  <epigraph>
   <p>Эпиграф 2</p>
  </epigraph>
  <epigraph>
   <p>Эпиграф 3</p>
  </epigraph>
  <section>
   <title>
    <p>Глава 1 </p>
   </title>
   <p>Текст</p>
   <p>...</p>
  </section>
</body>

Лишние секции и вложения тоже не понадобятся.

Страницы

X