Я читаю файл слова, используя приведенный ниже код:
import win32com.client as win32
word = win32.dynamic.Dispatch("Word.Application")
word.Visible = 0
doc = word.Documents.Open(SigLexiconFilePath)
Я получаю строки из файла, в котором много непечатаемых символов:
str = "\xa0keine\xa0freigäbü\xa0\x0b\r\x07"
Я пробовал ниже коды для удаления непечатаемых символов:
import string
str = "\xa0keine\xa0freigäbü\xa0\x0b\r\x07"
filtered_string = "".join(filter(lambda x:x in string.printable, str))
Это дает мне вывод ниже:
keinefreigb\x0b\r
Другой фрагмент кода, который я пробовал:
str = str.split('\r')[0]
str = str.strip()
Это дает мне вывод ниже:
keine\xa0freigäbü
Как я могу удалить все эти непечатаемые символы, чтобы получить результат ниже желаемого, используя минимальный код:
keine freigäbü