Когда я открываю http://en.wikipedia.org/wiki/Category:Births_by_year в В любом браузере я вижу страницу категорий с множеством подкатегорий и одной подстраницей, которая называется http://en.wikipedia.org/wiki/Park_Sung-Baek
Но когда я читаю ту же страницу с Java, я получаю страницу категории с другим содержимым. Вместо упомянутой выше подстраницы она содержит http://en.wikipedia.org/wiki/User:Mijotoba/Ruth_Stella_Correa_Palacio
Как это может быть? Почему Википедия представляет другую страницу?
Установка User-Agent
не помогает.
Заголовки, запрашивающие "нормальный" контент
GET http://en.wikipedia.org/wiki/Category:Births_by_year HTTP/1.1
Accept: text/html, application/xhtml+xml, */*
Accept-Language: ru-RU,zh-CN;q=0.5
User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)
Accept-Encoding: gzip, deflate
Connection: Keep-Alive
Host: en.wikipedia.org
Заголовки, запрашивающие "измененный" контент
GET http://en.wikipedia.org/wiki/Category:Births_by_year HTTP/1.1
User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)
Host: en.wikipedia.org
Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2
Connection: keep-alive
Accept-Encoding: gzip, deflate
. Возможно, на сервере есть кешированная gzip-версия? - person Jon Lin   schedule 18.09.2012gzip, deflate
для кодирования, сервер отправляет закодированную страницу, которую Java не может понять, и она содержит Park_Sung-Baek - person Suzan Cioc   schedule 18.09.2012