Я очищаю файл HTML с помощью HTML Tidy, ну, версия .NET под названием TidyManaged, и мои символы «£» преобразуются в «?»
ie:
Income (£)
становится:
Income (�)
Я считаю, что это связано с типами кодирования. В TidyManaged можно указать тип входной кодировки и тип выходной кодировки, включая такие вещи, как Latin1, utf8, utf16, win1252.
Документ XHTML в конечном итоге будет преобразован в DOC, который использует win1252.
Итак, какой должна быть моя входная и выходная кодировка, чтобы сохранить символы £?
Большое спасибо.