fb2: тибетский шрифт

Аватар пользователя Грейт

Друзья и товарищи! Работаю я с кое-какими текстами на тибетском, и появился у меня вопрос: а таки можно ли запихнуть в формат fb2 тибетский или даже санскрит? Ворд же их читает...

Комментарии

Всё, что есть в Unicode - запихнуть можно. Вопрос - сможет ли это потом воспроизвести читалка.

Вряд ли. Ворд их читает, если установлен соответствующий шрифт (Tibetan или как там). Вот если б тибетские буквы были в Юникод...

Цитата:
Вот если б тибетские буквы были в Юникод...

Их там есть

Erih написал:
Цитата:
Вот если б тибетские буквы были в Юникод...
Их там есть
А можно подсказать номер какого-нибудь символа в utf-8?
Просто в прошлом году были какие-то заморочки с тибетскими шрифтами и там это дело не всплыло.
upd. Спасибо Ulenspiegel, вопрос снимается. Щас глянем.
upd2. Ах вот что. В группировке тибетский показывает, но сами символы почему-то нет. Пустые клетки. Хм.

Надо найти какой-нибудь полный юникодовый шрифт, с сайта мелкомягких вроде раньше можно было скачать основные.

Ну таки есть....
От ༀ - U+0F00, Tibetian syllable Om до ࿑ - U+0FD1 TIBETAN MARK MNYAM YIG GI MGO RGYAN, UTF-8: 0xE0 0xBF 0x91, UTF-16: 0x0FD1

Шрифт запихнуть не получится, а вот сверстать в соответствующей кодировке - запросто.
А вообще для таких целей лучше использовать PDF.

EPUB ;)

Дело такое, запихнуть в юникод кодировке можно, однако читалки врядли есть с соответствующими фонтами, к тому же FB2 не поддерживает атрибут направления текстам я не знаю как оно вообще с тебетским но с ивритом, арабским и таиландским - проблема.

Аватар пользователя Грейт

Лить в doc? pdf на фиг, я слишком чайник для такого.

Лить в Ворд, а из него сделать пдф (PDFcreator, например).

Аватар пользователя Грейт

И еще. Где можно бесплатно скачать тибетско-русский словарь для Lingvo, и существует ли таковой?
Плюс, у меня трабл с отображением немецкого языка в словаре, не все символы правильно отображаются. Как исправить?

1) В готовом виде не нашел. Попытки сделать замечены тут
2) А соответствующая codepage для немецкого стоит ? :)

Аватар пользователя Грейт

Ulenspiegel написал:

2) А соответствующая codepage для немецкого стоит ? :)

Я же ламер!))) Что такое codepage?)))

Она же кодировка. Например, Win1251 (она же CP1251). В виндах раньше можно было посмотреть в Control Panel -> Regional Settings

Почему раньше? В Висте уже нет, что ли? В ХР такая фигня есть: Панель управления - Язык и региональные стандарты - Дополнительно. Там огромный список всевозможных кодировок, вплоть до всевозможных экзотических. Вообще-то все европейские языки вроде бы поддерживаются по умолчанию. Но возможно не все проги знают об этом :)

Аватар пользователя Грейт

Спасибо, покопаюсь.))))))

Грейт написал:
Друзья и товарищи! Работаю я с кое-какими текстами на тибетском, и появился у меня вопрос: а таки можно ли запихнуть в формат fb2 тибетский или даже санскрит? Ворд же их читает...

Можно, только девайс должен поддерживать эти шрифты. Все это входит в юникод.

Вот почитаешь тут, и начинаешь погружаться в нирвану в юникоде:)
Пошел я лучше гимны петь:)

Восхищён Вашими интересами и увлечениями! Я вот еле читаю на романских языках... Португальский сносно, румынский совсем плохо...

Аватар пользователя Грейт

arteume написал:
Восхищён Вашими интересами и увлечениями! Я вот еле читаю на романских языках... Португальский сносно, румынский совсем плохо...

Это мне?) Таки жизнь заставляет увлекаться. А романские я тоже плохо воспринимаю, и многие другие тоже. Для меня изучение элементарного английского (учить начал с 8 лет) - настоящая пытка. До сих пор не могу вылечиться, хоть и получаю образование по направлению английский-японский.)))

Pocketbook 301 поддерживает R-t-L. То есть и иврит, и арабский, и любой другой "правосторонний" язык поддерживается.
Для правильного отображения юникодных документов поставьте себе
или платный Arial Unicode MS

Цитата:
Supported Unicode Blocks

0x0000 - 0x00FF ANSI
0x0080 - 0x00FF Latin Supplement and C1 Controls
0x0100 - 0x017F Latin Extended-A
0x0180 - 0x024F Latin Extended-B
0x0250 - 0x02AF IPA Extensions
0x02B0 - 0x02FF Spacing Modifier Letters
0x0300 - 0x036F Combining Diacritical Marks
0x0370 - 0x03FF Greek and Coptic
0x0400 - 0x04FF Cyrillic
0x0530 - 0x058F Armenian
0x0590 - 0x05FF Hebrew
0x0600 - 0x06FF Arabic
0x0900 - 0x097F Devanagari
0x0980 - 0x09FF Bengali
0x0A00 - 0x0A7F Gurmukhi
0x0A80 - 0x0AFF Gujarati
0x0B00 - 0x0B7F Oriya
0x0B80 - 0x0BFF Tamil
0x0C00 - 0x0C7F Telugu
0x0C80 - 0x0CFF Kannada
0x0D00 - 0x0D7F Malayalam
0x0E00 - 0x0E7F Thai
0x0E80 - 0x0EFF Lao
0x10A0 - 0x10FF Georgian
0x1100 - 0x11FF Hangul Jamo
0x1E00 - 0x1EFF Latin Extended Additional
0x1F00 - 0x1FFF Greek Extended
0x2000 - 0x206F General Punctuation
0x2070 - 0x209F Superscripts and Subscripts
0x20A0 - 0x20CF Currency Symbols
0x20D0 - 0x20FF Combining Diacritical Marks for Symbols
0x2100 - 0x214F Letterlike Symbols
0x2150 - 0x218F Number Forms
0x2190 - 0x21FF Arrows
0x2200 - 0x22FF Mathematical Operators
0x2300 - 0x23FF Miscellaneous Technical
0x2400 - 0x243F Control Pictures
0x2440 - 0x245F Optical Character Recognition
0x2460 - 0x24FF Enclosed Alphanumerics
0x2500 - 0x257F Box Drawing
0x2580 - 0x259F Block Elements
0x25A0 - 0x25FF Geometric Shapes
0x2600 - 0x26FF Miscellaneous Symbols
0x2700 - 0x27BF Dingbats
0x2E80 - 0x2EFF Chinese, Japanese, and Korean Radicals Supplement
0x2F00 - 0x2FDF Kangxi Radicals
0x2FF0 - 0x2FFF Ideographic Description Characters
0x3000 - 0x303F Chinese, Japanese, and Korean Symbols and Punctuation
0x3040 - 0x309F Hiragana
0x30A0 - 0x30FF Katakana
0x3100 - 0x312F Bopomofo
0x3130 - 0x318F Hangul Compatibility Jamo
0x3190 - 0x319F Kanbun
0x31A0 - 0x31BF Bopomofo Extended
0x3200 - 0x32FF Chinese, Japanese, and Korean Enclosed Letters and Months
0x3300 - 0x33FF Chinese, Japanese, and Korean Compatibility
0x3400 - 0x4DBF Chinese, Japanese, and Korean Unified Ideographs Extension A
0x4E00 - 0x9FAF Chinese, Japanese, and Korean Unified Ideographs
0xAC00 - 0xD7AF Hangul Syllabels
0xF900 - 0xFAFF Chinese, Japanese, and Korean Compatibility Ideographs
0xFB00 - 0xFB4F Alphabetic Presentation Forms
0xFB50 - 0xFDFF Arabic Presentation Forms-A
0xFE20 - 0xFE2F Combining Half Marks
0xFE30 - 0xFE4F Chinese, Japanese, and Korean Compatibility Forms
0xFE50 - 0xFE6F Small Form Variants
0xFE70 - 0xFEFF Arabic Presentation Forms-B
0xFF00 - 0xFFEF Halfwidth and Fullwidth Forms
0xFFF0 - 0xFFFF Specials

Supported Code Pages

1250 ANSI Latin 2 (Central Europe)
1251 ANSI Cyrillic
1252 ANSI Latin 1
1253 ANSI Greek
1254 ANSI Turkish
1255 ANSI Hebrew
1256 ANSI Arabic
1257 ANSI Baltic
1258 ANSI Vietnam
874 ANSI/OEM Thai
932 ANSI/OEM Japanese, Shift-JIS
936 ANSI/OEM Simplified Chinese (PRC and Singapore)
949 ANSI/OEM Korean Unified Hangul Code (Hangeul TongHabHyung Code)
950 ANSI/OEM Traditional Chinese (Hong Kong SAR, PRC and Taiwan)
1361 ANSI/OEMKorean (Johab)
437 OEM United States
852 OEM Latin 2
855 OEM Cyrillic (Primarily Russian)
860 OEM Portuguese
861 OEM Icelandic
862 OEM Hebrew
863 OEM Canadian French
864 OEM Arabic
865 OEM Nordic
866 OEM Russian
869 OEM Modern Greek
708 OEM Arabic (ASMO 708)
737 OEM Greek
775 OEM Baltic
850 OEM Latin 1 (Multilingual)

или бесплатный Bitstream Cyberbit.

Цитата:
Supported Unicode Blocks

0x0000 - 0x00FF ANSI
0x0080 - 0x00FF Latin Supplement and C1 Controls
0x0100 - 0x017F Latin Extended-A
0x0180 - 0x024F Latin Extended-B
0x0250 - 0x02AF IPA Extensions
0x02B0 - 0x02FF Spacing Modifier Letters
0x0300 - 0x036F Combining Diacritical Marks
0x0370 - 0x03FF Greek and Coptic
0x0400 - 0x04FF Cyrillic
0x0590 - 0x05FF Hebrew
0x0600 - 0x06FF Arabic
0x0E00 - 0x0E7F Thai
0x1E00 - 0x1EFF Latin Extended Additional
0x2000 - 0x206F General Punctuation
0x2070 - 0x209F Superscripts and Subscripts
0x20A0 - 0x20CF Currency Symbols
0x20D0 - 0x20FF Combining Diacritical Marks for Symbols
0x2100 - 0x214F Letterlike Symbols
0x2150 - 0x218F Number Forms
0x2190 - 0x21FF Arrows
0x2200 - 0x22FF Mathematical Operators
0x2300 - 0x23FF Miscellaneous Technical
0x2400 - 0x243F Control Pictures
0x2440 - 0x245F Optical Character Recognition
0x2460 - 0x24FF Enclosed Alphanumerics
0x2500 - 0x257F Box Drawing
0x2580 - 0x259F Block Elements
0x25A0 - 0x25FF Geometric Shapes
0x2600 - 0x26FF Miscellaneous Symbols
0x2E80 - 0x2EFF Chinese, Japanese, and Korean Radicals Supplement
0x2F00 - 0x2FDF Kangxi Radicals
0x2FF0 - 0x2FFF Ideographic Description Characters
0x3000 - 0x303F Chinese, Japanese, and Korean Symbols and Punctuation
0x3040 - 0x309F Hiragana
0x30A0 - 0x30FF Katakana
0x3100 - 0x312F Bopomofo
0x3130 - 0x318F Hangul Compatibility Jamo
0x3190 - 0x319F Kanbun
0x31A0 - 0x31BF Bopomofo Extended
0x3200 - 0x32FF Chinese, Japanese, and Korean Enclosed Letters and Months
0x3300 - 0x33FF Chinese, Japanese, and Korean Compatibility
0x3400 - 0x4DBF Chinese, Japanese, and Korean Unified Ideographs Extension A
0x4E00 - 0x9FAF Chinese, Japanese, and Korean Unified Ideographs
0xAC00 - 0xD7AF Hangul Syllabels
0xE000 - 0xF8FF Private Use Area
0xF900 - 0xFAFF Chinese, Japanese, and Korean Compatibility Ideographs
0xFB00 - 0xFB4F Alphabetic Presentation Forms
0xFB50 - 0xFDFF Arabic Presentation Forms-A
0xFE20 - 0xFE2F Combining Half Marks
0xFE30 - 0xFE4F Chinese, Japanese, and Korean Compatibility Forms
0xFE50 - 0xFE6F Small Form Variants
0xFE70 - 0xFEFF Arabic Presentation Forms-B
0xFF00 - 0xFFEF Halfwidth and Fullwidth Forms

Supported Code Pages

1250 ANSI Latin 2 (Central Europe)
1251 ANSI Cyrillic
1252 ANSI Latin 1
1253 ANSI Greek
1254 ANSI Turkish
1255 ANSI Hebrew
1256 ANSI Arabic
1257 ANSI Baltic
1258 ANSI Vietnam
874 ANSI/OEM Thai
932 ANSI/OEM Japanese, Shift-JIS
936 ANSI/OEM Simplified Chinese (PRC and Singapore)
949 ANSI/OEM Korean Unified Hangul Code (Hangeul TongHabHyung Code)
950 ANSI/OEM Traditional Chinese (Hong Kong SAR, PRC and Taiwan)
437 OEM United States
852 OEM Latin 2
855 OEM Cyrillic (Primarily Russian)
860 OEM Portuguese
861 OEM Icelandic
862 OEM Hebrew
863 OEM Canadian French
864 OEM Arabic
865 OEM Nordic
866 OEM Russian
869 OEM Modern Greek
708 OEM Arabic (ASMO 708)
737 OEM Greek
775 OEM Baltic
850 OEM Latin 1 (Multilingual)

Но FB2 RtL не поддерживает в стандарте, так что да, на покете можно посмотреть например EPUB но никак не FB2.

TITUS Cyberbit Unicode вроде побольше символов содержит, да и закрыли Bitstream Cyberbit уже коммерческой лицензией... Взял отсюда:
http://en.wikipedia.org/wiki/Bitstream_Cyberbit

Цитата:
Bitstream Cyberbit is a commercial Unicode font designed by Bitstream Inc. It is freeware for non-commercial uses.

Тибетский шрифт - лучшее средство от разочарований.

X