V77029 Рубин во мгле

При преобразовании в TXT обрывается на -_Так-то лучше,_- сказала она._- Вечно я забываю свои зубы! А достались ... причём это не первая книга с такой проблемой, скрипт похоже(. В HTML преобразуется нормально.

Аватар пользователя Captain Scarlett

Похоже, дело в неразрывном дефисе &#8209. Текст обрывается как раз перед ним. А в каких еще книгах такая проблема?

UPD Точно, в нем. Заменила в одном месте неразрывный дефис на нормальный и текст обрывается уже перед следующим неразрывным.

Наверное так и есть. Другие книги с таким разрывом после преобразрвания в TXT я встречал, но прямо сейчас не помню ... если надо будет, то напишу, когда увижу) ... но проще, наверное, поправить скрипт конверсии - чтобы такого не было).

предположительно - iconv плюется. он из себя выходит при ненахождении символа в кодировке назначения. надо ловить эксепшн и смотреть что за символ

X