Максимальный размер строки Unicode

Я делаю экспорт в ADAM и хотел бы знать, какой максимальный символ я могу отправить в строку Unicode?


person MoShe    schedule 14.12.2011    source источник


Ответы (1)


Текущий стандарт Unicode устанавливает количество кодовых точек на уровне 1 114 112 (т.е. 10FFFF); гораздо меньшее число (109 384 в версии 6 стандарта) в настоящее время используется для символов, за исключением определяемой пользователем области. Если вам действительно нужно максимальное количество байтов в символе, это будет зависеть от используемого вами представления. Например. UTF-8 будет иметь размер от 1 до 4 байтов для действительного кода.

person borrible    schedule 14.12.2011
comment
И UTF-8, и UTF-16 могут использовать до четырех байтов для символа. Не путайте кодовые единицы с кодовыми точками. - person Joey; 14.12.2011