Применение XML contentType при загрузке MarkLogic

При загрузке файлов с четким расширением .xml через http-сервер сделал. MarkLogic сохраняет его в моей локальной базе данных в виде файла .txt.

Это означает, что я не могу запустить свой запрос против него.

Загрузчик:

declare function local:uploadFile()
{
let $filename := xdmp:get-request-field-filename("upload")
let $file := xdmp:get-request-field("upload")
let $collection := "semansysdocs"

return
  xdmp:document-insert(
    $filename,
    $file,
    xdmp:default-permissions(),
    (xdmp:default-collections(), $collection)
  )
};

Пример документа (имя файла: Prod223_1982_03975172_20170430.xml):

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="http://www.companieshouse.gov.uk/ef/xbrl/uk/fr/gaap/ae/2009-06-21/stylesheet/CH-AE-dormant-stylesheet.xsl"?>
<xbrl
    xmlns="http://www.xbrl.org/2003/instance"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns:ae="http://www.companieshouse.gov.uk/ef/xbrl/uk/fr/gaap/ae/2009-06-21"
    xmlns:gc="http://www.xbrl.org/uk/fr/gcd/2004-12-01"
    xmlns:html="http://www.w3.org/1999/xhtml"
    xmlns:iso4217="http://www.xbrl.org/2003/iso4217"
    xmlns:link="http://www.xbrl.org/2003/linkbase"
    xmlns:pt="http://www.xbrl.org/uk/fr/gaap/pt/2004-12-01"
    xmlns:xbrli="http://www.xbrl.org/2003/instance"
    xmlns:xlink="http://www.w3.org/1999/xlink">
    <link:schemaRef xlink:arcrole="http://www.w3.org/1999/xlink/properties/linkbase" 
xlink:href="http://www.companieshouse.gov.uk/ef/xbrl/uk/fr/gaap/ae/2009-06-21/uk-gaap-ae-2009-06-21.xsd" 
xlink:type="simple"/>
    <ae:CompanyDormant contextRef="y2017">true</ae:CompanyDormant>
    <gc:EntityNames>
        <gc:EntityCurrentLegalName contextRef="y2017">HUNTS GROUP PLC</gc:EntityCurrentLegalName>
    </gc:EntityNames>
    <ae:CompanyIdentifyingNumbers>
        <ae:CompaniesHouseRegisteredNumber contextRef="y2017">03975172</ae:CompaniesHouseRegisteredNumber>
    </ae:CompanyIdentifyingNumbers>
    <gc:StatementDatesPeriodsCovered>
        <gc:BalanceSheetDate contextRef="e2017">2017-04-30</gc:BalanceSheetDate>
    </gc:StatementDatesPeriodsCovered>
    <pt:ShareholderFunds precision="6" contextRef="e2017" unitRef="GBP">12500</pt:ShareholderFunds>
    <pt:ShareholderFunds precision="6" contextRef="e2016" unitRef="GBP">12500</pt:ShareholderFunds>
    <pt:NetAssetsLiabilitiesIncludingPensionAssetLiability precision="5" contextRef="e2017" unitRef="GBP">12500</pt:NetAssetsLiabilitiesIncludingPensionAssetLiability>
    <pt:NetAssetsLiabilitiesIncludingPensionAssetLiability precision="5" contextRef="e2016" unitRef="GBP">12500</pt:NetAssetsLiabilitiesIncludingPensionAssetLiability>
    <pt:CashBankInHand precision="5" contextRef="e2017" unitRef="GBP">12500</pt:CashBankInHand>
    <pt:CashBankInHand precision="5" contextRef="e2016" unitRef="GBP">12500</pt:CashBankInHand>
    <pt:EquityAuthorisedDetails>
        <pt:TypeOrdinaryShare contextRef="y2017">Ordinary</pt:TypeOrdinaryShare>
        <pt:NumberOrdinarySharesAuthorised precision="INF" contextRef="e2017" unitRef="shares">50000</pt:NumberOrdinarySharesAuthorised>
        <pt:ParValueOrdinaryShare precision="INF" contextRef="y2017" unitRef="GBP">1</pt:ParValueOrdinaryShare>
    </pt:EquityAuthorisedDetails>
    <pt:DetailsOrdinarySharesAllotted>
        <pt:TypeOrdinaryShare contextRef="y2017">Ordinary</pt:TypeOrdinaryShare>
        <pt:ParValueOrdinaryShare precision="INF" contextRef="y2017" unitRef="GBP">1</pt:ParValueOrdinaryShare>
        <pt:ValueOrdinarySharesAllotted precision="5" contextRef="e2017" unitRef="GBP">12500</pt:ValueOrdinarySharesAllotted>
        <pt:ValueOrdinarySharesAllotted precision="5" contextRef="e2016" unitRef="GBP">12500</pt:ValueOrdinarySharesAllotted>
        <pt:NumberOrdinarySharesAllotted precision="INF" contextRef="e2017" unitRef="shares">12500</pt:NumberOrdinarySharesAllotted>
    </pt:DetailsOrdinarySharesAllotted>
    <pt:DateApproval contextRef="e2017">2017-10-13</pt:DateApproval>
    <pt:ApprovalDetails>
        <pt:NameApprovingDirector contextRef="y2017">Mr. David Charles Hunt</pt:NameApprovingDirector>
    </pt:ApprovalDetails>
    <ae:CompanyEntitledToExemptionUnderSection480CompaniesAct2006 contextRef="y2017">true</ae:CompanyEntitledToExemptionUnderSection480CompaniesAct2006>
    <ae:MembersHaveNotRequiredCompanyToObtainAnAudit contextRef="y2017">true</ae:MembersHaveNotRequiredCompanyToObtainAnAudit>
    <ae:DirectorsAcknowledgeTheirResponsibilitiesUnderCompaniesAct contextRef="y2017">true</ae:DirectorsAcknowledgeTheirResponsibilitiesUnderCompaniesAct>
    <ae:AccountsAreInAccordanceWithSpecialProvisionsCompaniesActRelatingToSmallCompanies contextRef="y2017">true</ae:AccountsAreInAccordanceWithSpecialProvisionsCompaniesActRelatingToSmallCompanies>
    <unit id="shares">
        <measure>xbrli:shares</measure>
    </unit>
    <unit id="GBP">
        <measure>iso4217:GBP</measure>
    </unit>
    <unit id="pure">
        <measure>xbrli:pure</measure>
    </unit>
    <context id="y2017">
        <entity>
            <identifier scheme="/results">HUNTS GROUP PLC</identifier>
        </entity>
        <period>
            <startDate>2016-05-01</startDate>
            <endDate>2017-04-30</endDate>
        </period>
    </context>
    <context id="y2016">
        <entity>
            <identifier scheme="/results">HUNTS GROUP PLC</identifier>
        </entity>
        <period>
            <startDate>2015-05-01</startDate>
            <endDate>2016-04-30</endDate>
        </period>
    </context>
    <context id="s2016">
        <entity>
            <identifier scheme="/results">HUNTS GROUP PLC</identifier>
        </entity>
        <period>
            <instant>2015-04-30</instant>
        </period>
    </context>
    <context id="e2016">
        <entity>
            <identifier scheme="/results">HUNTS GROUP PLC</identifier>
        </entity>
        <period>
            <instant>2016-04-30</instant>
        </period>
    </context>
    <context id="s2017">
        <entity>
            <identifier scheme="/results">HUNTS GROUP PLC</identifier>
        </entity>
        <period>
            <instant>2016-04-30</instant>
        </period>
    </context>
    <context id="e2017">
        <entity>
            <identifier scheme="/results">HUNTS GROUP PLC</identifier>
        </entity>
        <period>
            <instant>2017-04-30</instant>
        </period>
    </context>
    <ae:CompaniesHouseDocumentAuthentication contextRef="y2017"></ae:CompaniesHouseDocumentAuthentication>
    <ae:DateAccountsReceived contextRef="e2017">2017-10-16</ae:DateAccountsReceived>
</xbrl>

Как видите, это документ XBRL, который примерно соответствует XML+. Я не могу указать тип содержимого в xdmp:document-insert(), у вас есть идеи, как обеспечить соблюдение XML-типа содержимого?


person Mick Remmerswaal    schedule 26.01.2018    source источник
comment
Есть ли причина, по которой вы бы не использовали /v1/documents PUT? docs.marklogic.com/8.0/REST/PUT/v1/documents   -  person Mads Hansen    schedule 28.01.2018


Ответы (2)


При использовании приведенного ниже кода некоторые известные типы контента/расширения файлов будут загружены, как и следовало ожидать:

let $file := xdmp:get-request-field("upload")
let $filename := xdmp:get-request-field-filename("upload")
let $contenttype := xdmp:get-request-field-content-type("upload")
let $extension := fn:replace($filename, '.*\.', '')
let $insert := switch ($contenttype)
    case "text/xml"
    case "text/xhtml"
    case "text/csv"
    case "text/plain"
    case "application/json"
        return xdmp:document-insert($filename,xdmp:unquote($file))
    case "application/octet-stream"
        return switch ($extension)
        case "gpx"
            return xdmp:document-insert($filename,xdmp:unquote(xdmp:quote(binary{xs:hexBinary($file)})))
        default
            return xdmp:document-insert($filename,$file)
    default
        return xdmp:document-insert($filename,$file)
return fn:concat("file '",$filename,"' uploaded, contenttype: ",$contenttype," extension: ",$extension)

Результат загрузки файлов различных форматов

person Emil Zegers    schedule 26.01.2018

Прежде чем вставлять его, вам нужно проанализировать его обратно в XML (я думаю, это был текст, пришедший по сети). Это делается с помощью xdmp:unquote().

....
let $file := xdmp:unquote(xdmp:get-request-field("upload"))
....

Обратите внимание, что приведенное выше упрощено. Возможно, вам придется установить другие параметры в зависимости от ваших потребностей — подробности см. в документации.

Отдельно от этого - вы указываете, что документ имеет формат .txt. Я предполагаю, что вы имеете в виду, что это текстовый узел. MarkLogic не будет добавлять .txt к имени файла в URI. Если вы это видите, то это то, что отправляется в поле запроса.

person David Ennis    schedule 26.01.2018