Я пытаюсь проанализировать файл XML и записать содержимое в обычный текстовый файл. У меня программа работает до тех пор, пока не наткнется на символ смайлика, затем Python выдает следующую ошибку:
UnicodeEncodeError: 'charmap' codec can't encode characters in position 177-181: character maps to <undefined>
Я пошел к месту ошибки и нашел следующие смайлики в файле XML:
Мой вопрос заключается в том, как либо закодировать их в Unicode, либо полностью удалить/игнорировать их при записи в файл.
Он отлично выводится, когда я печатаю () на консоль, но выдает ошибку при записи в файл.
Я искал в Google и здесь, но единственные ответы, которые я получаю, это то, что они уже закодированы в Unicode. Мои, как видите, литералы? Я не уверен, правильно ли я говорю.
Также файл XML, с которым я работаю, имеет следующий формат:
<?xml version='1.0' encoding='UTF-8' standalone='yes' ?>
<?xml-stylesheet type="text/xsl" href="sms.xsl"?>
<smses count="1">
<sms protocol="0" address="+00000000000" date="1346772606199" type="1" subject="null" body="Lorem ipsum dolor sit amet, consectetur adipisicing elit," toa="null" sc_toa="null" service_center="+00000000000" read="1" status="-1" locked="0" date_sent="1346772343000" readable_date="Sep 4, 2012 10:30:06 AM" contact_name="John Doe" />
</smses>
try:
иexcept:
, чтобы поймать ошибку? - person Harvey   schedule 19.05.2014