Как я могу сохранить åäö, но удалить из строки все остальные небуквенно-цифровые символы? (Я нашел похожие вопросы, но ни один из них, похоже, не имеет правильного ответа.)
Я пробовал такие вещи, как расширение регулярного выражения, чтобы попытаться пропустить åäö в подпрограмме, но, похоже, это просто заставляет регулярное выражение перестать работать вместе, оставляя пробелы и тому подобное. Обычно я не программирую на python, просто пытаюсь помочь другу, поэтому может быть какой-то лучший способ очистить строку, чем использовать re.
Из поиска в Google я думаю, что это связано с Unicode, но нет хороших решений.
def ordnaText(text):
text = text.lower()
text = re.sub('\W', '', text)
if text.isalnum() == True:
return text
type(text)
? - person Eric   schedule 19.12.2013print type(text)
в код, что получается на выходе? - person Eric   schedule 19.12.2013