У меня проблема с некоторыми символами в кодировке UTF-8. Я читаю index.html с http://wordki.pl, чтобы получить список наборов слов с их именами.
это выглядит так
<a href="THE LINK.html">THE NAME</a><span>(20)</span><img src="krecha.png">
и когда в ИМЯ есть "Ł", оно не работает и ставит там "??" но "??" не является признаком того, что я могу изменить с помощью replaceAll ("str", "str"), потому что моя консоль просто не показывает скрытый за ней символ.
Но когда я просматриваю источник в chrome/firefox и т. д., он показывает «Ł». А все остальные забавные знаки типа "ó, ł, ą, ś" прекрасно работают в моей программе.
Поэтому я спрашиваю, есть ли способ изменить "??" в "Л"? Я попытался закодировать его побайтно, но тогда я потерял все остальные знаки, такие как «ó, ł, ą» и т. Д.
РЕДАКТИРОВАТЬ: Хорошо, я решил проблему, мне нужно было сохранить файл *.java как UTF-8: O