Вопросы по теме 'astral-plane'
Сервер Mysql не поддерживает 4-байтовые закодированные символы utf8
Я получил сообщение об ошибке сервера при запуске компонента передачи данных с сервера Sql на базу данных MySql. Сообщение об ошибке выглядит следующим образом:
[MySql][ODBC 5.1 Driver][mysqld-5.0.67-community-nt-log]Server does not support...
14275 просмотров
schedule
06.03.2023
Строки JavaScript вне BMP
BMP представляет собой базовый многоязычный уровень
Согласно JavaScript: преимущества :
JavaScript был создан в то время, когда Unicode был 16-битным набором символов, поэтому все символы в JavaScript имеют ширину 16 бит.
Это наводит...
11766 просмотров
schedule
28.07.2023
Поддержка Java для символов Unicode, отличных от BMP (т.е. кодовых точек › 0xFFFF) в их библиотеке регулярных выражений?
В настоящее время я использую Java 6 (у меня нет возможности перейти на Java 7) и пытаюсь использовать пакет java.util.regex для сопоставления с образцом строк, содержащих символы Unicode.
Я знаю, что java.lang.String поддерживает дополнительные...
2482 просмотров
schedule
18.02.2023
Какие символы Unicode, отличные от BMP, наиболее часто используются на практике?
По вашему опыту, какие символы Unicode, кодовые точки, диапазоны за пределами BMP (Basic Multilingual Plane) являются наиболее распространенными на данный момент? Это те, которые требуют 4 байта в UTF-8 или суррогаты в UTF-16.
Я ожидал, что...
25695 просмотров
schedule
28.09.2022
Как ввести юникод, отличный от BMP (шестнадцатеричный с более чем 4 символами), в качестве входных данных для Mathematica
Описание проблемы: Mathematica использует "\:nnnn" в качестве синтаксиса для ввода в формате Unicode. Например, если мы введем "\:6c34" , мы получим "水" («вода» на китайском языке). Но что, если кто-то хочет войти "\:1f618" (целуя лицо)....
670 просмотров
schedule
10.03.2023
Генерируемый Antlr лексер зависает на юникодном символе дополнительной плоскости (antlr 3.4)
Я разбираю PHP-код, используя antlr Grammar и antlr Ruby Target . Один из исходных файлов, который мне нужно разобрать, на самом деле содержит перевод, некоторые из них активно используют символы Unicode. Грамматика, кажется, зависит от одного...
200 просмотров
schedule
07.10.2022