$dom = new DOMDocument('1.0', 'UTF-8');
$str = '<p>Hello®</p>';
var_dump(mb_detect_encoding($str));
$dom->loadHTML($str);
var_dump($dom->saveHTML());
Выходы
string(5) "UTF-8"
string(158) "<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html><body><p>Hello®</p></body></html>
"
Почему мой Unicode ®
был преобразован в ®
и как мне остановить это?
Я сегодня схожу с ума?