Документ синтаксического анализа проблемы Stax, в котором конечный элемент и начальный элемент находятся в одной строке

У меня есть следующий код для преобразования элементов файла XML в строку с использованием Stax:

private static XMLStreamReader getReader(InputStream inputStream) throws XMLStreamException {
    XMLInputFactory xmlInputFactory = XMLInputFactory.newInstance();
    xmlInputFactory.setProperty("javax.xml.stream.isValidating", false);
    xmlInputFactory.setProperty("javax.xml.stream.supportDTD", false);
    XMLStreamReader xmlStreamReader = xmlInputFactory.createXMLStreamReader(inputStream);
    return xmlStreamReader;
}

private static String readElement(XMLStreamReader reader) throws XMLStreamException, TransformerException {
    TransformerFactory tf = TransformerFactory.newInstance();
    Transformer t = tf.newTransformer();
    ByteArrayOutputStream outputStream = new ByteArrayOutputStream();
    StAXSource source = new StAXSource(reader);
    t.transform(source, new StreamResult(outputStream));
    return outputStream.toString();
}

public static void main(String[] args) throws Exception {
    InputStream inputStream = new FileInputStream("c:\\temp\\test.xml");

    XMLStreamReader xmlStreamReader = getReader(inputStream);
    int count = 0;
    while (xmlStreamReader.hasNext()) {
        int eventType = xmlStreamReader.next();
        if (eventType == XMLEvent.START_ELEMENT) {
            String elementName = xmlStreamReader.getName().getLocalPart();
            if (!elementName.toLowerCase().equals("element")) {
                continue;
            }
            String productStr = readElement(xmlStreamReader);
            System.out.println(productStr);
        }
    }
}

}

Это отлично работает со следующим фрагментом XML:

<testDoc>
  <element>
    <a>hello world</a>
    <b>hello world again</b>
  </element>
  <element>
    <a>foo</a>
    <b>foo bar</b>
  </element>
</testDoc>

Однако есть проблемы с этим фрагментом, где </element> и <element> находятся в одной строке:

<testDoc>
  <element>
    <a>hello world</a>
    <b>hello world again</b>
  </element><element>
    <a>foo</a>
    <b>foo bar</b>
  </element>
</testDoc>

Во втором примере кажется, что обрабатывается только первый элемент, а не второй. Любые идеи?

Обновление:

Я заставил его работать со следующим кодом:

public static void main(String[] args) throws Exception {
    InputStream inputStream = new FileInputStream("c:\\temp\\test.xml");

    XMLStreamReader xmlStreamReader = getReader(inputStream);
    int count = 0;
    while (xmlStreamReader.hasNext()) {
        int eventType = xmlStreamReader.getEventType();
        if (eventType == XMLEvent.START_ELEMENT) {
            String elementName = xmlStreamReader.getName().getLocalPart();
            if (!elementName.toLowerCase().equals("element")) {
                xmlStreamReader.next();
                continue;
            }

            System.out.println(readElement(xmlStreamReader));
        } else {
            xmlStreamReader.next();
        }

    }
}

person Bob    schedule 19.12.2011    source источник


Ответы (1)


Похоже на ошибку для меня. Вы не говорите, какой парсер Stax вы используете: некоторые из них довольно крутые. Вудстокс самый надежный.

person Michael Kay    schedule 19.12.2011