Я создаю поисковый робот, используя urllib3
. Пример кода:
from urllib3 import PoolManager
pool = PoolManager()
response = pool.request("GET", url)
mime_type = response.getheader("content-type")
Я наткнулся на несколько ссылок на файлы документов, такие как docx и epub, и тип mime, который я получаю с сервера, — text/plain
. Мне важно получить правильный тип mime.
Пример проблемного URL:
Сейчас логика получения MIME-типа файла заключается в том, чтобы получить его с сервера и, если он недоступен, попытаться получить расширение файла.
Почему Firefox
не запутался в таких URL-адресах и не позволил пользователю сразу загрузить файл? Откуда он знает, что этот файл не является обычным текстом? Как я могу получить правильный тип пантомимы?
response
? - person lucasnadalutti   schedule 14.11.2016content-type
для сохраненного имени файла. ссылка - person kiran.koduru   schedule 14.11.2016