Предлагаю во всех книгах исправить тире... для начала

То есть расставить на свои места тире, цифровые тире и дефисы. Многие книги вместо этого многообразия имеют только скудные дефисы. Сделать замену:

<p>-[space] = <p>—[space]
[space]-[space] = [space]—[space]
и так далее.

p.s.
В форуме не работает тэг Strike эта строка перечёркнута

В форуме не работает тэг Strike

Цитата:
В форуме не работает тэг Strike

Неужели ...жирный
сработало? ...зачёркнутый
Сделал ...курсив
"просмотр" ...надстрочный
всё равно ...подстрочный
тэги не работают (( ...подчёркивание
может Opera виновата? Хотя тэги и в Африке они самые...
проверил, в Эксплорере тоже самое.

Не знаю
почему
Вы капризничаете
нет, знаю

А, может... и т.д.
Нет, всё-таки... и т.п.

Видимо, потому, что

Вот это - <sub>не работает</sub>

Вот это - не работает

А так - [ sub]не умеет намродник[ /sub]

А так - не умеет намродник

Ну тире это конечно хорошо, но может сначала в UTF книги перекодировать?

Присоединяюсь к просьбе: где-то зафиксировать среди требований к правке выкладываемых текстов замену короткого тире на длинное тире.

Напомню, что короткое тире традиционно не употреблялось в отечественной типографике (только в последнее время короткое тире стали иногда употреблять для знак препинания между цифрами — раньше в таких случаях употреблялось длинное тире или дефис). Тогдак как длинное, «типографское» тире — стандартный знак препинания.
Употребление короткого тире вместо длинного, принятое на ЛитРесе, есть свидетельство типографской безграмотности и дурного вкуса.

У ёёё...... моё. Только-только комплекс неполноценности начал рассасываться, и тут такое... :)
Ну а если серьезно - существуют ли кодифицированные правила предпечатной подготовки книг, творчески переосмысленные с учетом специфики электронных библиотек ? И возможно ли их, именно в адаптированном и одобренном Либрусеком виде выложить на сайте ?

Хе-хе, расстановка правильных тире только усугубит рассасывание означенного комплекса! :)
Насчёт «кодифицированных правил предпечатной подготовки» — таковых для электронных документов типа fb2 не особо много и надо. Потому как нет ни разбивки на страницы, ни установки междустрочных расстояний, ни абзацных отступов и т. д., и т. п.
Нужно только расставить типографские тире (вместо ублюдочных коротких или дефисов), кавычки («первого» и „второго“ уровня), знаки сносок (сразу после слов, а не после точек или запятых), апострофы («’», а не одиночные прямые кавычки «'» или грависы «`») да троеточия (вместо трёх точек подряд) — и текст приобретёт вполне пристойный вид. :)

nonduc написал:
Хе-хе, расстановка правильных тире только усугубит рассасывание означенного комплекса! :)
Насчёт «кодифицированных правил предпечатной подготовки» — таковых для электронных документов типа fb2 не особо много и надо. Потому как нет ни разбивки на страницы, ни установки междустрочных расстояний, ни абзацных отступов и т. д., и т. п.
Нужно только расставить типографские тире (вместо ублюдочных коротких или дефисов), кавычки («первого» и „второго“ уровня), знаки сносок (сразу после слов, а не после точек или запятых), апострофы («’», а не одиночные прямые кавычки «'» или грависы «`») да троеточия (вместо трёх точек подряд) — и текст приобретёт вполне пристойный вид. :)

Всё это, кроме сносок и кавычек, делает замечательный скрипт "генеральная уборка" в FBE. Но для замены кавычек есть собственный скрипт.
А насчёт сносок (втискивать ли их между словом и знаком препинания), насколько я знаю, единого мнения нет. Или?

golma1 написал:

Всё это, кроме сносок и кавычек, делает замечательный скрипт "генеральная уборка" в FBE.

(представил себе скачивание 100+ тысяч книг, взятие их в FBE... по одной... сто тысяч кликов по кнопке "Запуститьскрипт Генеральная уборка"...)(дальше представлять не стал)

pkn написал:
golma1 написал:

Всё это, кроме сносок и кавычек, делает замечательный скрипт "генеральная уборка" в FBE.

(представил себе скачивание 100+ тысяч книг, взятие их в FBE... по одной... сто тысяч кликов по кнопке "Запуститьскрипт Генеральная уборка"...)(дальше представлять не стал)

Тебе бы только подразниться. :Р
А я, между прочим, любую книгу, попавшую мне в руки, "генерально убираю". Так что, глядишь, постепенно... ;)

golma1 написал:
Так что, глядишь, постепенно... ;)

По десять книжек в день - всего за тридцать лет... ;)

На самом деле я ужасную мысль думаю. Вот такую. Ведь если есть этот скрипт "генеральная уборка", значит задача алгоритмизируема и, следовательно, автоматизируема. Более того, написавший скрипт тем самым её уже и автоматизировал. Осталось взять этот скрипт, переписать его да хоть на том же Перле, чтобы он мог обрабатывать книги пакетно... и вперёд...

pkn написал:
golma1 написал:
Так что, глядишь, постепенно... ;)

По десять книжек в день - всего за тридцать лет... ;)
На самом деле я ужасную мысль думаю. Вот такую. Ведь если есть этот скрипт "генеральная уборка", значит задача алгоритмизируема и, следовательно, автоматизируема. Более того, написавший скрипт тем самым её уже и автоматизировал. Осталось взять этот скрипт, переписать его да хоть на том же Перле, чтобы он мог обрабатывать книги пакетно... и вперёд...

Ну, так я и не одна. :Р Может, за 2 года и управимся. ;)

А вообще-то, конечно, автоматизация процессов - вещь хорошая. Только я в ней ничего не понимаю, оттого и мыслей никаких по этому поводу не возникает. А ты - спец, ты и думай. :)

"спецов" (ну, в смысле публики, способной писать код) тут хватает.
не хватает хорошей постановки задачи.
т.е. (1) формулировки целей и (2) подробного описания (желательно - процесса, но можно и результата).
крайне желательно - не на примерах скриптов конкретных изделий (там, где я пишу программы не заведётся ФБЕ, например).

в свой скрипт я замену мниусов на тире добавил - не знаю уж, тех ли...

Цитата:
Всё это, кроме сносок и кавычек, делает замечательный скрипт "генеральная уборка" в FBE

Скрипт - это замечательно, но правила ...эээ... "русского типографского" все равно знать бы хотелось. Опять же, скрипты программисты пишут, а это - таакие сволочи, любезная Golma :)))
- кавычки "первого" и "второго" уровня - то же ли, что и "открывающая" и "закрывающая" ?
- was ist типографское тире ? (Если назвать мне его UNICODE-код, я пойму :)
- то же по поводу "троеточия"
Аватар пользователя Captain Scarlett

Цитата:
- кавычки "первого" и "второго" уровня - то же ли, что и "открывающая" и "закрывающая" ?

Кавычки второго уровня - это кавычки внутри кавычек. Кавычки первого уровня - внешние кавычки.
Пушкин писал Дельвигу: «Жду „Цыганов“ и тотчас тисну». (пример из Вики :)
Цитата:
was ist типографское тире ? (Если назвать мне его UNICODE-код, я пойму :)

код 151 (в литресовских книгах используется среднее тире - код 150)
Троеточие - код 133

Поправочка: «код 151», «код 150» и «код 133» — это не уникодовые, а ANSI индексы. :)
Уникодовые такие: U+2014 (#8212) — Em Dash (длинное тире; клавиши Alt+0151; entity &mdash;); U+2013 (#8211) — En Dash (короткое тире; клавиши Alt+0151; entity &ndash;); U+2026 (#8212) — Horizontal Hellipsis (троеточие; клавиши Alt+0151; entity &hellip;); ну и заодно апостроф U+2019 (#8217) — Right Single Quotation Mark (название Aposrophe в Уникоде зарезервировано за «апострофом программистов», сиречь за одиночной прямой кавычкой, тогда как сам апостроф прописан под названием правой одиночной кавычки, применямой, однако, сугубо в британской и американской типографике, а не в русской, немецкой и прочих; клавиши Alt+0146; entity &rsquo;).

Цитата:
Кавычки второго уровня - это кавычки внутри кавычек. Кавычки первого уровня - внешние кавычки.
Пушкин писал Дельвигу: «Жду „Цыганов“ и тотчас тисну». (пример из Вики :)

Вот, рекомендую всем внимательно почитать википедию и не наломать дров. Ибо в иностранной литературе могут быть другие стандарты на те же кавычки. Я, когда первый раз редактировал книгу, тоже воспользовался скриптом аля "генеральная уборка", так меня сразу носом тыкнули, что в английском «» быть не должно.

Что касается EM-DASH — думаю да, остановиться нужно на нем. Я даже все EN-DASH на него заменяю. И дефис по тому же алгоритму (" - ", "- ", " -"). Однако, не все так просто, и тире волне может быть (и по правилам) без отбивки пробелами. Тут уж ничего не поделаешь, кроме вычитки.

Аватар пользователя Captain Scarlett

Цитата:
так меня сразу носом тыкнули, что в английском «» быть не должно.

Угу. А как я первую свою немецкую книжку делала... :) И тире у них EN-DASH, и многоточия пробелами отбиваются, и кавычки оборотные...

"генеральная уборка" в FBE: если текст особо грязный, то и после уборки остается много мусора, даже того, который скрипт должен был убрать. Остается (ох, если есть время) просто вычитывать.

sd написал:
"генеральная уборка" в FBE: если текст особо грязный, то и после уборки остается много мусора, даже того, который скрипт должен был убрать. Остается (ох, если есть время) просто вычитывать.

Я больше скажу: даже после первой вычитки остаются огрехи. В-)

Тут вот есть табличка... С HTML-заклинаниями, кодами, наименованиями и возможностью посмотреть в разных шрифтах. Делалось, правда, для другой цели и "настоящего юникода" там нет (т.к. хостинг в виндуз-1251).

P.S. Могу добавить фильтров в скрипт - к деёфикации и прочему.
"Реёфикация", конечно, не получится (разве что, со словарём от vim'овского ёфикатора?), но замена минусов на тире - вполне.
Скрипт, правда, не перловый...

P.P.S. "Ретирефикация" и вывод "реконструированного" FB2 (для перекодирования, например) добавлены.

Ещё один весьма пользительный уникодовый знак для правильного препинания — знак ударения, который печатается после буквы, но размещается непосредственной над ней (такой вот он хитрый). Уникодовый индекс U+0301, название Combining Acute Accent (искать в уникодовом разделе Combining Diacritical Marks). Приме́р его́ употребле́ния. Бо́льшая часть и больша́я гора. :)
То есть всякие извраты по замене ударения курсивом или прописной — именно извраты, а никак не разновидность народного творчества в електронной вёрстке. :D

Не очень удачный пример...

Достаточно удачный пример:2008-08-29_161534.png - 0.01MB
То есть в Опере всё в полном порядке. (А кроме того и в IE тоже. В Файрфоксе не проверял, ибо, во-первых, лень, а во-втрорых, там тоже было бы всё OK.)
ЗЫ. Этим знаком ударения активно — и успешно! — пользуются в Википедии. ;)

Вы тогда уж и шрифт свой выкладывайте. Потому что у всех Вердана даёт разные результаты и чаще весьма кривые, иначе бы не приходилось извращаться.

Mozilla/5.0 (Windows; U; Windows NT 5.1; ru; rv:1.9.0.1) Gecko/2008070208 Firefox/3.0.1 - Build ID: 2008070208

в Linux -- то же самое. И в википедии тоже.
шрифт - Verdana (через FireBug смотрел на этой странице)

Надо обязательно упомянуть, что очень популярная (напимер, эта страница) Verdana - мутант от MS, который предпочитает, чтобы символ ставили перед ударной гласной, что есть ущемление прав всех остальных шрифтов. Гейтса - на нары!

А вот и неправда туточки. По обоим пунктам.
Вердана — вполне грамотно сделанный шрифт и к тому же с великолепным хинтингом. И потому популярность Верданы заслуженная на все сто.
И знак ударения нужно ставить после ударямой гласной — символ не имеет собственной ширины и от этого сдвигается влево.

Пр́оба.
Фигвам по обоям:) Никто не говорит, что не грамотно, он - грамотно-извращеный. Посмотрите свой пример вверху и сравните с Пробой, где символ стаит перед, а не после
И укажите еще хоть один шрифт – грамотный или не очень – где бы именно так относились к Combining Acute Accent

В набранном тобой слове «Пр́оба» ударение стоит над «р», а не над «о́», как должно было бы стоять.
И вот мини тест для сравнения:
Ариал — отли́чно;
Вердана — отли́чно;
Тахома — отли́чно;
Франклин Готик — отли́чно
Везде всё одинаково.
И по информации в ФонтЛабе (это шрифтовый редактор такой) символ с уникодовым индексом 0301 имеет ширину 0 и левый отступ -759 (это отрицательное значение и обеспечивает надёжный сдвиг влево, а не куда-нить ещё).

Если у тебя с Верданой какие-то глюки — советую переустановить этот шрифт. (Впрочем, дело может быть и не в шрифте, а в другом шрифте — и тебе придётся почистить папку с шрифтами и шрифтовый реестр.)

Цитата:
Если у тебя с Верданой какие-то глюки — советую переустановить этот шрифт

В Word-e, и в Вашем браузере (Опера?) именно так, как вы говорите.
В IE 7 ударение над ч.
В читалках fb2, при установке шрифта Verdana, тоже над ч.
И еще во многих программах, которые создавались с учетом особеностей большиства шрифтов, кроме одной - верданы, и даже не самой верданы, а ее особенности с кирилличным ударением.
Шрифт не антивир, чтоб каждые две недели обновлять.
Аватар пользователя Mylnicoff

Опера 9.52 - в Вердане ударение на ч

Хм-м-м… Наконец-то с Веданой разобрался, кажется… Тут не в браузере дело, а в версии шрифта. У меня уже довольно давно установлена версия 5.00 (которая 2006 года выпуска и которая поставляется вместе с Вистой — хотя саму Висту я не устанавливал и устанавливать не собираюсь, нафик не надо, но шрифты я все заменил на новые версии).
Вот архивчик с этой Верданой 5.00: http://www.MegaShare.com/477977
А версия Верданы 2.43, которая поставлялась с XP-SP2, действительно глючная, я её только что проверил. :-/

ЗЫ 1. Если при переустановке Верданы Винды будут сопротивляться «незаконной» версии, то нужно будет перед установкой новой версии шрифта скопировать шрифтовые файлы в каталог c:\WINDOWS\system32\dllcache\
ЗЫ 2. Если кому-нить нужны остальные шрифты из Вистовской поставки (Ариал, Курьер, Джорджия и т. п.), дайте об этом знать — тоже залью на файлообменник.
ЗЫ 3. Ну и ещё один совет насчёт шрифтов — полезно для хорошей работы со шрифтами браузера установить какой-нить из «больших» пан-уникодовых шритфов с многоязыковой поддержкой (Arial Unicode MS, Code2000, Bitstream Cyberbit). Вредно устанавливать Kozuka Gothic Pro, Kozuka Mincho Pro, Ryo Text Std из Адобовских поставок шрифтов.

Приятная новость, спасибо.

Установилась без проблем. XP, SP3. Через Панель управления/ Шрифты удалил старые, а потом установил новые, указав распакованные ttf-ы. Ударение встало на место.

С новым шрифтом:

Mozilla/5.0 (Windows; U; Windows NT 5.1; ru; rv:1.9.0.1) Gecko/2008070208 Firefox/3.0.1 - Build ID: 2008070208

тихо-матерно...
мож того... не надо решения сугубо под виндуз? я совсем не горю желанием ковыряться со шрифтами, задумываться, какой символ должен быть при перекодировке в кои8р...
нет, я понимаю - печатные требования весьма круто, ага. но вот нахрена нужны лишние проблемы? нужно точное соответствие бумаге - кладите пдф. а в тексте ж нахрена сложности городить?

При чём тут виндуз, если глюк в шрифте?
Рассказать куда в X11 ТТФ положить?
/usr/share/fonts/truetype/msttcorefonts тут у нас что?
При чём тут кои-8р, если книжки и сайты в unicode?

Нужно точное соответствие не бумаге, а исходному тексту и языку.

глюк не в шрифте а в локали. ну нет длинного тире в кои8-р. и библиотечка иконв начинает материться. а думать онли в utf8 - никак. отдать надо в той кодировке, которую просит пользователь, независимо от системы. независимо от шрифтов. независимо от наличия гуйни.
пысы. точное соответствие не бумаге - это как раз и есть не внесение в текст трех типов тире. бо оные - как раз для полиграфии.

Неужто ещё у кого-то в иксах локаль КОИ стоит? :)

Пардон, а что за задачу обсуждаем? Как отдать некий текст в произвольную дырку с непонятной локалью? Как ублажить иконв?
Ну, так клиент может и с 7-битным ASCII приползти - тогда как? В транслит? И как это связано с форматами хранения? Сразу в транслите хранить? Ну, чтобы проще было... Впрочем, у меня тут в соседнем окошке - вообще EBCDIC (который, ДКОИ) и чего?

А разные типы дефисов и тире - не для полиграфии, а, как бы, требование письменного языка.

во-первых - иксов может и не быть.
ну и - во фре LANG=ru_RU.KOI8-R никто не отменял. иксы т покажут хоть чёрта лысого. если они есть.

а ваще - да творите шо хотите. хоть повсеместно йо внесите. просто рядом с катдоком ляжет перекодировщик уродских эфбэшек. мне переехать несложно - лишний фильтр позвать между закачивалкой новых и стораджем.

X