Я пытаюсь очистить это Веб-сайт NREGA, который содержит данные на хинди, т. е. на языке деванагари. Структура довольно легко царапается. Но когда я использую request/urllib для получения html-кода, текст на хинди преобразуется в какую-то тарабарщину. Однако текст отображается нормально в исходном коде сайта.
content = requests.get(URL).text
' 1 पी एस ' на сайте анализируется как ' 1 \xe0\xa4\xaa\xe0\xa5\x80 \xe0\xa4\x8f\xe0\xa4\xb8 ' в контент и отображается как тарабарщина, когда я пытаюсь экспортировать в csv.