Как смешивание языков LTR и RTL управляется в Unicode?

Иногда нам приходится отображать сообщения на дисплее, что представляет собой смесь языков RTL и LTR. Сообщение в юникоде. Итак, как юникод обрабатывает микширование? Есть ли зависимость от платформы?


person Gulshan    schedule 14.02.2011    source источник


Ответы (1)


Процесс описывается двунаправленным алгоритмом Unicode, описанным здесь: http://www.unicode.org/reports/tr9/.

По умолчанию текст располагается слева направо (уровень 0). Unicode имеет специальные коды символов для разграничения текста RTL в пределах уровня 0 (уровень 1). Вы используете специальные символы для разграничения LTR внутри RTL и так далее. Я думаю, вы можете иметь до 61 уровня встраивания.

Теги HTML имеют атрибут «dir», чтобы указать направление по умолчанию.

Этот процесс не зависит от платформы, но вы будете полагаться на алгоритм Unicode, чтобы сделать все правильно.

person Jimmy    schedule 14.02.2011