Используйте jsoup или gquery для простого XML

Недавно я интересовался хорошей библиотекой для работы с XML в Java: Хорошая утилита Java XML DOM

Прежде чем изобретать велосипед и портировать jQuery на Java в jOOX, я проверил эти библиотеки. :

Но при ближайшем рассмотрении я вижу:

  • jsoup не работает со стандартной org.w3c.dom структурой документа. Они накатали собственную реализацию. Я проверил код и сомневаюсь, что он столь же эффективен и настроен, как, например, Xerces. Для моих случаев использования важна производительность
  • jsoup тесно связан с HTML. Я хочу работать только с XML, без структуры HTML, без CSS.
  • gwtquery связан с GWT. Я не уверен, насколько плотно

Кто-нибудь имел опыт работы с этими библиотеками при использовании их только для серверного XML, а не для HTML?

меня интересует

  • Тесты производительности (возможно, сравнение со стандартным DOM / XPath)
  • Опыт совместимости (легко импортировать/экспортировать в стандартный DOM?)

person Lukas Eder    schedule 12.08.2011    source источник


Ответы (1)


Без ответа через месяц я думаю, что моя собственная библиотека лучше всего решит мои проблемы:

http://www.jooq.org/products/jOOX

person Lukas Eder    schedule 11.09.2011
comment
Что заставило вас пойти по этому пути? До сих пор jSoup был для меня довольно удобным. - person Kyle Clegg; 02.06.2012
comment
@Kyle: jsoup (как в jsoup: Java HTML Parser) не поддерживает стандартный DOM (как в org.w3c.dom). Он полностью ориентирован на HTML... Что касается моего вопроса, то jOOX больше подходит для моих нужд. - person Lukas Eder; 02.06.2012
comment
Попался. Вы можете быть правы. После некоторой работы с jSoup сегодня он определенно ориентирован на синтаксический анализ HTML (не то, что мне нужно для этого проекта). Тем не менее, я смог сделать все, что мне нужно, и эта страница документации оказалась наиболее полезной: jsoup. org/cookbook/extracting-data/dom-navigation. - person Kyle Clegg; 03.06.2012
comment
@Kyle: Да, да, конечно, вы можете выполнять некоторые манипуляции с DOM. Но как только вы захотите объединить что-то с SAX, JAXB, XPath, преобразованием, XSLT и всеми другими стандартными технологиями, вы довольно быстро доберетесь до пределов jsoup... - person Lukas Eder; 03.06.2012
comment
@Lukas, какой рабочий процесс вы бы предложили для преобразования реального HTML в XML, чтобы можно было использовать jOOX? - person Dr. Max Völkel; 12.08.2016
comment
@xamde: вы, вероятно, можете экспортировать содержимое jsoup, используя Element.html(), и разобрать его в jOOX, или вы можете написать реализацию org.w3c.dom, которая привязывается к jsoup... Вы можете создать свою собственную или принять участие в этом запросе функции, который я только что создал: github.com/jhy/jsoup/issues/745 - person Lukas Eder; 12.08.2016
comment
@xamde: На самом деле этот API существует: jsoup.org/apidocs/org/jsoup/helper/ - person Lukas Eder; 12.08.2016