Как вы, возможно, знаете, для того, чтобы электронное письмо было действительным во многих клиентах, все символы Юникода должны быть закодированы. Я хотел бы автоматизировать эту кодировку в скрипте Python.
Очевидно, что теги должны быть исключены из преобразования, иначе html не будет работать - сделать это действительно сложно - чтобы быть уверенным в успехе, необходимо использовать пакет для синтаксического анализа, такой как lxml или BeautifulSoup.
Насколько мне известно, ни один из этих двух пакетов не поддерживает преобразование в нумерованные сущности Unicode, такие как & #x6F22 ; (漢)
Любая помощь будет действительно неоценимой, я весь день бился головой об эту стену!