Вопросы по теме 'astral-plane'

Сервер Mysql не поддерживает 4-байтовые закодированные символы utf8
Я получил сообщение об ошибке сервера при запуске компонента передачи данных с сервера Sql на базу данных MySql. Сообщение об ошибке выглядит следующим образом: [MySql][ODBC 5.1 Driver][mysqld-5.0.67-community-nt-log]Server does not support...
14275 просмотров
schedule 06.03.2023

Строки JavaScript вне BMP
BMP представляет собой базовый многоязычный уровень Согласно JavaScript: преимущества : JavaScript был создан в то время, когда Unicode был 16-битным набором символов, поэтому все символы в JavaScript имеют ширину 16 бит. Это наводит...
11766 просмотров

Поддержка Java для символов Unicode, отличных от BMP (т.е. кодовых точек › 0xFFFF) в их библиотеке регулярных выражений?
В настоящее время я использую Java 6 (у меня нет возможности перейти на Java 7) и пытаюсь использовать пакет java.util.regex для сопоставления с образцом строк, содержащих символы Unicode. Я знаю, что java.lang.String поддерживает дополнительные...
2482 просмотров
schedule 18.02.2023

Какие символы Unicode, отличные от BMP, наиболее часто используются на практике?
По вашему опыту, какие символы Unicode, кодовые точки, диапазоны за пределами BMP (Basic Multilingual Plane) являются наиболее распространенными на данный момент? Это те, которые требуют 4 байта в UTF-8 или суррогаты в UTF-16. Я ожидал, что...
25695 просмотров

Как ввести юникод, отличный от BMP (шестнадцатеричный с более чем 4 символами), в качестве входных данных для Mathematica
Описание проблемы: Mathematica использует "\:nnnn" в качестве синтаксиса для ввода в формате Unicode. Например, если мы введем "\:6c34" , мы получим "水" («вода» на китайском языке). Но что, если кто-то хочет войти "\:1f618" (целуя лицо)....
670 просмотров

Генерируемый Antlr лексер зависает на юникодном символе дополнительной плоскости (antlr 3.4)
Я разбираю PHP-код, используя antlr Grammar и antlr Ruby Target . Один из исходных файлов, который мне нужно разобрать, на самом деле содержит перевод, некоторые из них активно используют символы Unicode. Грамматика, кажется, зависит от одного...
200 просмотров
schedule 07.10.2022