объединить два или более файла xml, используя xslt-3

У меня много XML-файлов, которые мне нужно объединить в один: hotel1.xml

<?xml version="1.0" encoding="UTF-8"?>
<menu>
<breakfast_menu>

<food>
<name>Belgian Waffles</name>
<price>$5.95</price>
<description>Two of our famous Belgian Waffles with plenty of real maple syrup</description>
<calories>650</calories>
</food>

<food>
<name>Strawberry Belgian Waffles</name>
<price>$7.95</price>
<description>Light Belgian waffles covered with strawberries and whipped cream</description>
<calories>900</calories>
</food>

</breakfast_menu>
</menu>

hotel2:

<?xml version="1.0" encoding="UTF-8"?>
<menu>
<breakfast_menu>

<food>
<name>Berry-Berry Belgian Waffles</name>
<price>$8.95</price>
<description>Light Belgian waffles covered with an assortment of fresh berries and whipped cream</description>
<calories>900</calories>
</food>

</breakfast_menu>
</menu>

hotel3.xml:

<?xml version="1.0" encoding="UTF-8"?>
<menu>
<breakfast_menu>

<food>
<name>French Toast</name>
<price>$4.50</price>
<description>Thick slices made from our homemade sourdough bread</description>
<calories>600</calories>
</food>

<food>
<name>Homestyle Breakfast</name>
<price>$6.95</price>
<description>Two eggs, bacon or sausage, toast, and our ever-popular hash browns</description>
<calories>950</calories>
</food>

</breakfast_menu>
</menu>

Мне нужно сначала добавить значение к элементу name, чтобы узнать, из какого файла оно взято, и объединить все файлы xml.

Желаемый результат:

<?xml version="1.0" encoding="UTF-8"?>
<menu>
<breakfast_menu>

<food>
<name>Belgian Waffles-hotel1</name>
<price>$5.95</price>
<description>Two of our famous Belgian Waffles with plenty of real maple syrup</description>
<calories>650</calories>
</food>

<food>
<name>Strawberry Belgian Waffles-hotel1</name>
<price>$7.95</price>
<description>Light Belgian waffles covered with strawberries and whipped cream</description>
<calories>900</calories>
</food>

<food>
<name>Berry-Berry Belgian Waffles-hotel2</name>
<price>$8.95</price>
<description>Light Belgian waffles covered with an assortment of fresh berries and whipped cream</description>
<calories>900</calories>
</food>

<food>
<name>French Toast-hotel3</name>
<price>$4.50</price>
<description>Thick slices made from our homemade sourdough bread</description>
<calories>600</calories>
</food>

<food>
<name>Homestyle Breakfast-hotel3</name>
<price>$6.95</price>
<description>Two eggs, bacon or sausage, toast, and our ever-popular hash browns</description>
<calories>950</calories>
</food>

</breakfast_menu>
</menu>

в данной папке мне нужно объединить все файлы xml в один. Просто слейте их содержимое. Ни проверок, ни обновлений. Кроме того, мне нужно сохранить в элементе name каждый файл, из которого он был, для использования в будущем.

Вот мое испытание. Мне нужна более опытная помощь, чтобы использовать последнюю версию xslt-3, а также для файлов xml, которые существуют в данной папке.

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output indent="yes"/>

  <xsl:template match="@*|node()">
    <xsl:copy>
      <xsl:apply-templates select="@*|node()" />
    </xsl:copy>
  </xsl:template>

  <xsl:template match="breakfast_menu">
    <xsl:copy>
      <xsl:apply-templates select="*"/>
      <xsl:apply-templates select="document('hotel1.xml')/menu/breakfast_menu/*" />
    </xsl:copy>
  </xsl:template>

</xsl:stylesheet>

person Community    schedule 23.08.2018    source источник
comment
Подумайте о том, чтобы показать нам образец кода, который вам нужен для слияния файлов, чтобы мы могли показать вам, как адаптировать его для вставки имени файла. Как правило, у вас есть, будь то XSLT 2 или 3, функции, которые предоставляют вам базовый URI w3.org/TR/xpath-functions/#func-base-uri или URI документа w3.org/TR/xpath-functions/#func-document-uri, поэтому довольно легко получить URI и затем извлечь имена файлов как последняя часть тоже проста.   -  person Martin Honnen    schedule 23.08.2018
comment
Я бы предпочел полностью переписать, чтобы получить наилучший подход   -  person    schedule 23.08.2018
comment
Но с чем именно вы боретесь, обрабатывая различные или все файлы из папки (это обычно делается в XSLT 2/3 с функцией collection, но точное использование и возможности зависят от процессора) или просто написать шаблон, соответствующий food/name и вставив имя файла (я вам намекал)?   -  person Martin Honnen    schedule 23.08.2018
comment
в данной папке мне нужно объединить все файлы xml в один. Просто слейте их содержимое. Ни проверок, ни обновлений. Кроме того, мне нужно сохранить в элементе name каждый файл, из которого он был, для использования в будущем.   -  person    schedule 23.08.2018
comment
Поэтому проверьте документацию по функции collection процессора XSLT, который вы используете, чтобы узнать, позволяет ли / как он обрабатывать все файлы XML в папке как последовательность. Документация по Saxon 9.8 находится в saxonica.com/html/documentation/sourcedocs/collections.html, не уверен, что вы используете. Что касается названия, то используйте функцию, на которую я вам указывал.   -  person Martin Honnen    schedule 23.08.2018
comment
Я использую Saxon 9.8, и я был бы признателен за ясное решение от любого, кто имеет опыт.   -  person    schedule 23.08.2018


Ответы (1)


В XSLT есть разные способы сделать это, можно попробовать новую инструкцию xsl:merge, но поскольку я столкнулся с проблемой при использовании этого с Saxon 9.8 (см. https://saxonica.plan.io/issues/3883 и https://saxonica.plan.io/issues/3884) вот другой способ, кажется, вы просто хотите скопировать все элементы с определенного уровня, в вашем случае food элементы из третий уровень; общая таблица стилей для выполнения того, что принимает выражение выбора в качестве статического параметра (я оставил его общим как */*/*, но вы, конечно, можете записать его для своих документов как menu/breakfast_menu/food), URI и шаблон имени файла для входных файлов и затем запускается с xsl:initial-template (параметр командной строки -it для командной строки Saxon) выглядит следующим образом:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    xmlns:xs="http://www.w3.org/2001/XMLSchema"
    xmlns:mf="http://example.com/mf"
    exclude-result-prefixes="#all"
    expand-text="yes"
    version="3.0">

    <xsl:param name="input-uri" as="xs:string" select="'.'"/>

    <xsl:param name="file-pattern" as="xs:string" select="'hotel*.xml'"/>

    <xsl:param name="merge-select-expression" as="xs:string" static="yes" select="'*/*/*'"/>

    <xsl:param name="xslt-pattern-to-add-file-name" as="xs:string" static="yes" select="$merge-select-expression || '/name'"/>

    <xsl:output indent="yes"/>
    <xsl:strip-space elements="*"/>

    <xsl:mode on-no-match="shallow-copy" streamable="yes"/>

    <xsl:template _match="{$xslt-pattern-to-add-file-name}">
        <xsl:comment>Copied this {node-name()} element from {tokenize(document-uri(/), '/')[last()]}</xsl:comment>
        <xsl:next-match/>
    </xsl:template>

    <xsl:template name="xsl:initial-template">
        <xsl:sequence select="mf:append-docs(uri-collection($input-uri || '?select=' || $file-pattern))"/>
    </xsl:template>

    <xsl:function name="mf:append-docs" as="document-node()">
        <xsl:param name="doc-uris" as="xs:anyURI+"/>
        <xsl:source-document href="{head($doc-uris)}" streamable="yes">
            <xsl:apply-templates select="." mode="construct">
                <xsl:with-param name="remaining-doc-uris" as="xs:anyURI*" select="tail($doc-uris)" tunnel="yes"/>
            </xsl:apply-templates>
        </xsl:source-document>
    </xsl:function>

    <xsl:mode name="construct" on-no-match="shallow-copy" streamable="yes"/>

    <xsl:template _match="{string-join(tokenize($merge-select-expression, '/')[position() lt last()], '/')}" mode="construct">
        <xsl:param name="remaining-doc-uris" as="xs:anyURI*" tunnel="yes"/>
        <xsl:copy>
            <xsl:apply-templates select="@*"/>
            <xsl:apply-templates/>
            <xsl:for-each select="$remaining-doc-uris">
                <xsl:source-document href="{.}" streamable="yes">
                    <xsl:apply-templates _select="{$merge-select-expression}"/>
                </xsl:source-document>
            </xsl:for-each>
        </xsl:copy>
    </xsl:template>

</xsl:stylesheet>

Он должен работать довольно типично, просто настраивая параметры и, возможно, настраивая тело шаблона <xsl:template _match="{$xslt-pattern-to-add-file-name}">, поскольку я выбрал вывод имени файла в комментарии вместо того, чтобы вставлять его в содержимое элемента.

Для ваших трех образцов в подкаталоге hotel-stackoverflow-test, где находится таблица стилей append.xsl и командная строка Saxon -it -xsl:.\append.xsl input-uri=hotel-stackoverflow-test file-pattern=hotel*.xml, я получаю результат

<menu>
   <breakfast_menu>
      <food><!--Copied this name element from hotel1.xml-->
         <name>Belgian Waffles</name>
         <price>$5.95</price>
         <description>Two of our famous Belgian Waffles with plenty of real maple syrup</description>
         <calories>650</calories>
      </food>
      <food><!--Copied this name element from hotel1.xml-->
         <name>Strawberry Belgian Waffles</name>
         <price>$7.95</price>
         <description>Light Belgian waffles covered with strawberries and whipped cream</description>
         <calories>900</calories>
      </food>
      <food><!--Copied this name element from hotel2.xml-->
         <name>Berry-Berry Belgian Waffles</name>
         <price>$8.95</price>
         <description>Light Belgian waffles covered with an assortment of fresh berries and whipped cream</description>
         <calories>900</calories>
      </food>
      <food><!--Copied this name element from hotel3.xml-->
         <name>French Toast</name>
         <price>$4.50</price>
         <description>Thick slices made from our homemade sourdough bread</description>
         <calories>600</calories>
      </food>
      <food><!--Copied this name element from hotel3.xml-->
         <name>Homestyle Breakfast</name>
         <price>$6.95</price>
         <description>Two eggs, bacon or sausage, toast, and our ever-popular hash browns</description>
         <calories>950</calories>
      </food>
   </breakfast_menu>
</menu>

Код должен использовать потоковую передачу с Saxon 9.8 EE и обычную обработку XSLT с Saxon 9.8 HE или PE.

person Martin Honnen    schedule 24.08.2018
comment
действительно отличное решение, меня беспокоит только то, что у меня нет Saxon 9.8 EE, поэтому я думаю, мне придется дождаться версии 9.9 - person ; 29.08.2018
comment
Приведенный выше код работает с 9.8 EE, а также с 9.8 HE, только с EE он использует потоковую передачу, в то время как HE игнорирует это и использует обычную обработку (т.е. строит дерево каждого входного документа, а затем обрабатывает узлы в этом дереве) . Вам нужно будет дождаться версии 9.9, если вы хотите использовать подходы, использующие xsl:merge в связанных задачах Saxon. - person Martin Honnen; 29.08.2018
comment
отлично, большое спасибо за это разъяснение. Я увидел, что ошибка, о которой вы сообщили, была решена. - person ; 29.08.2018