Получение тега, а также значений? XML

У меня следующий XML передается как String.

<?xml version="1.0"?>
 <tagMain>
    <tag1>
      <a>
        <a>1</a>
        <b>2</b>
        <c>3</c>
        <d>4</d>
      </a>
      <b>5</b>
      <c>6</c>
      <d>7</d>
      <e>8</e>
      <f>9</f>
    </tag1>

    <tag2>
        <r>
            <r1>10</r1>
            <r2>11</r2>
            <r3>12</r3>
            <r4>13</r4>
        </r>
        <b>14</b>
        <c>15</c>
        <d>16</d>
        <e>17</e>
        <f>18</f>
    </tag2>

    <tag3>
        <a>
            <a>1m</a>
            <b>2m</b>
            <c>3m</c>
            <d>4m</d>
        </a>
        <b>5m</b>
        <c>6m</c>
        <d>7m</d>
        <e>8m</e>
        <f>9m</f>
    </tag3>
</tagMain>

Я вызываю следующий метод, который получает значения между каждым тегом.

public static void  SplitXml(String xml) throws ParserConfigurationException, SAXException, IOException {

        DocumentBuilder builder = DocumentBuilderFactory
                .newInstance().newDocumentBuilder();
        InputSource src = new InputSource();
        src.setCharacterStream(new StringReader(xml));

        Document docu = builder.parse(src);
        String tag1 = docu.getElementsByTagName("tag1").item(0).getTextContent();
        String tag2 = docu.getElementsByTagName("tag2").item(0).getTextContent();
        String tag3 = docu.getElementsByTagName("tag3").item(0).getTextContent();

}

когда я запускаю приведенный выше код:

tag1 = "123456789";
tag2 = "101112131415161718";
tag3 = "1m2m3m4m5m6m7m8m9m";

Теперь я возвращаюсь к своему вопросу: есть ли способ получить теги, а также значения внутри них, например, для каждого тега:

tag1 = "<tag1><a>
            <a>1</a>
            <b>2</b>
            <c>3</c>
            <d>4</d>
          </a>
          <b>5</b>
          <c>6</c>
          <d>7</d>
          <e>8</e>
          <f>9</f>
        </tag1>";

person Zin Yackvaa    schedule 25.08.2016    source источник


Ответы (4)


Либо используйте LSSerializer (http://docs.oracle.com/javase/8/docs/api/index.html?org/w3c/dom/ls/LSSerializer.html) или создайте Transformer по умолчанию из TransformerFactory, а затем вы можете использовать чтобы сериализовать узел DOM, передав DOMSource методу transform (https://docs.oracle.com/javase/7/docs/api/javax/xml/transform/Transformer.html#transform(javax.xml.transform.Source,%20javax.xml.transform.Result) и StringWriter для сбора результата.

person Martin Honnen    schedule 25.08.2016

Я не уверен, существует ли эта функция уже, но вы могли бы написать простой вспомогательный метод:

private static String getWrappedTag(String tag, Document doc) {
  StringBuilder sb = new StringBuilder();
  sb.append("<" + tag + ">");
  sb.append(doc.getElementsByTagName(tag).item(0).getTextContent());
  sb.append("</" + tag + ">");
  return sb.toString();
}

И назовите это так:

String tag1 = getWrappedTag("tag1", doc);
person Adam    schedule 25.08.2016
comment
Спасибо за ввод, но я пытаюсь получить каждый тег со значением для tag1, tag2, tag3. Это будет делать следующее: ‹tag1› 123456789 ‹/tag1› - person Zin Yackvaa; 25.08.2016
comment
Вам понадобится немного зацикливаться или рекурсивно внутри обернутого тега, чтобы этот метод работал тогда. - person Adam; 25.08.2016

Это очень простой фрагмент кода с XPath и VTD-XML.

import com.ximpleware.*;
import java.io.*;
public class splitXML {
    public static void main(String[] args) throws VTDException, IOException {
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("d:\\xml\\input.xml", false)){
            System.out.println("error");
            return;
        }
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/tagmain/*");
        int i=0,n=0;
        FileOutputStream fos =null;
        while((i=ap.evalXPath())!=-1){
            fos = new FileOutputStream("d:\\xml\\output"+(++n)+".xml");
            long l = vn.getElementFragment();
            fos.write(vn.getXML().getBytes(), (int)l, (int)(l>>32));
            fos.close();
        }
    }
}
person vtd-xml-author    schedule 25.08.2016

Спасибо, ребята, за ваш вклад.

Поскольку каждый раз, когда вызывается метод, XML должен иметь одинаковые имена тегов, означающие теги 1–4. Итак, я выбрал такой подход ....

    public String split(String xml, String tagName1, String tagName2)
   {
       String splitedXML = xml.substring((xml.indexOf(tagName1)), xml.indexOf(tagName2));

       return splitedXML;
   }

Вот как я бы назвал метод разделения значений tag1, tag2, tag3:

    String tag1 = split(XMLString, "<tag1>", "<tag2>"));
    String tag2 = split(XMLString, "<tag2>", "<tag3>"));
    String tag3 = split(XMLString, "<tag3>", "<tag4>"));
person Zin Yackvaa    schedule 28.08.2016