Я пытаюсь определить прокси с высокой анонимностью. Также называются приватными/элитными прокси. На одном из форумов я прочитал это:
Серверы с высокой анонимностью не отправляют переменные HTTP_X_FORWARDED_FOR, HTTP_VIA и HTTP_PROXY_CONNECTION. Хост даже не знает, что вы используете прокси-сервер, и, конечно же, не знает вашего IP-адреса.
Высокоанонимный прокси будет отображать следующую информацию:
REMOTE_ADDR = IP-адрес прокси
HTTP_VIA = пусто
HTTP_X_FORWARDED_FOR = пусто
Итак, как я могу проверить эти заголовки в Python, чтобы отбросить их как прокси-сервер HA? Я пытался получить заголовки для 20-30 прокси, используя пакет requests
, также с urllib, со встроенным http.client, с urllib2. Но я не видел этих заголовков, никогда. Значит, я должен делать что-то не так...
Это код, который я использовал для тестирования с requests
:
proxies = {'http': 'http://176.100.108.214:3128'}
header = {'user-agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.360',}
s = requests.session()
s.proxies = proxies
r = s.get('http://www.python.org', headers=header)
print(r.status_code)
print(r.request.headers)
print(r.headers)