У меня есть ряд файлов xml, которые выглядят примерно так:
<ROOT>
<F P=100> Some text here </F>
<F P=101> More text </F>
...
</ROOT>
Я пытаюсь проанализировать xml, используя стандартный способ DOM, но поскольку значения атрибута для P
не заключены в кавычки, Java жалуется.
Я попытался использовать JTidy, чтобы очистить его, но поскольку мой xml не является HTML, Tidy выдает ошибки, жалуясь на то, что не распознает теги <ROOT>
и <F>
и т. д.
Итак, есть ли другой способ сделать это? В качестве альтернативы, я думаю, я мог бы использовать регулярное выражение, поскольку единственные атрибуты без кавычек встречаются в тегах <F>
. Любые мысли о том или ином?
заранее спасибо
tidy.setXmlTags(true)
, чтобы tidy обрабатывал ввод как XML, а не HTML. - person neptune   schedule 13.05.2011