Кодировка Java utf-8 из URL-адреса

У меня проблема с некоторыми символами в кодировке UTF-8. Я читаю index.html с http://wordki.pl, чтобы получить список наборов слов с их именами.

это выглядит так

<a href="THE LINK.html">THE NAME</a><span>(20)</span><img src="krecha.png">

и когда в ИМЯ есть "Ł", оно не работает и ставит там "??" но "??" не является признаком того, что я могу изменить с помощью replaceAll ("str", "str"), потому что моя консоль просто не показывает скрытый за ней символ.

Но когда я просматриваю источник в chrome/firefox и т. д., он показывает «Ł». А все остальные забавные знаки типа "ó, ł, ą, ś" прекрасно работают в моей программе.

Поэтому я спрашиваю, есть ли способ изменить "??" в "Л"? Я попытался закодировать его побайтно, но тогда я потерял все остальные знаки, такие как «ó, ł, ą» и т. Д.

РЕДАКТИРОВАТЬ: Хорошо, я решил проблему, мне нужно было сохранить файл *.java как UTF-8: O


person shym    schedule 29.10.2011    source источник


Ответы (1)


Вы должны установить страницу content-type как "UTF-8".

Сделайте что-то вроде этого:

request.getCharacterEncoding() = ISO-8859-1 
response.getCharacterEncoding() = UTF-8 
request.getParameter("query") = déjeuner

OR

  if(null == request.getCharacterEncoding())       
     request.setCharacterEncoding(encoding); 

  response.setContentType("text/html; charset=UTF-8");  
  response.setCharacterEncoding("UTF-8");

Обратитесь к этому URL-адресу для получения дополнительной информации:

Как заставить работать UTF-8 в веб-приложениях Java?

<meta http-equiv="Content-Type" content="text/html;charset=utf-8"> 
person Siva Charan    schedule 29.10.2011
comment
1. сайт не мой 2. на нем есть эта строчка - person shym; 29.10.2011
comment
добавил дополнительную информацию в мой ответ. - person Siva Charan; 29.10.2011
comment
Проблема заключалась в том, что мой java-файл не был в UTF-8, поэтому он не мог отображать символ, который есть только в utf-8. Спасибо всем - person shym; 29.10.2011