Я пытаюсь добавить динамически сгенерированный XML-контент в коллекцию eXist-db (см. код ниже addFile.pl
) с помощью Perl, проблема в том, что всякий раз, когда контент содержит символы UTF-8, я получаю сообщение об ошибке Failed to parse XML-RPC request: Byte "195" is not a member of the (7-bit) ASCII character set.
.
#!/usr/bin/perl
use RPC::XML;
use RPC::XML::Client;
my ($sec, $min, $hour, $mday, $mon, $year) = localtime();
my $timestamp = sprintf("%04d%02d%02d%02d%02d%02d",$year+1900,$mon+1,$mday,$hour,$min,$sec);
print("Timestamp: $timestamp\n");
my $FILENAME = "$timestamp.xml";
my $COLLECTION = 'output';
my $record = <<END;
<document id="doc_20150419014112">
<text>ñáéíóú</text>
</document>
END
$query = <<END;
xquery version "3.0";
import module namespace xmldb="http://exist-db.org/xquery/xmldb";
declare variable \$filename := '$FILENAME';
declare variable \$record := '';
let \$log-in := xmldb:login("/db", "admin", "admin")
(: let \$create-collection := xmldb:create-collection("/db", "$COLLECTION") :)
let \$record :=
$record
for \$target in ('/db/$COLLECTION')
return xmldb:store(\$target, \$filename, \$record)
END
print $query;
$URL = "http://admin:admin\@localhost:8080/exist/xmlrpc";
# connecting to $URL...
$client = new RPC::XML::Client $URL;
# Output options
$options = RPC::XML::struct->new(
'indent' => 'yes',
'encoding' => 'UTF-8',
'highlight-matches' => 'none');
$req = RPC::XML::request->new("query", $query, 20, 1, $options);
$response = $client->send_request($req);
if($response->is_fault) {
die "An error occurred: " . $response->string . "\n";
}
my $result = $response->value;
print $result;
Когда я запускаю скрипт xquery (см. ниже) непосредственно с помощью eXide, он работает нормально, но когда я запускаю его через скрипт perl, я получаю следующее:
$ perl addFile.pl
Timestamp: 20150428162016
xquery version "3.0";
import module namespace xmldb="http://exist-db.org/xquery/xmldb";
declare variable $filename := '20150428162016.xml';
declare variable $record := '';
let $log-in := xmldb:login("/db", "admin", "admin")
(: let $create-collection := xmldb:create-collection("/db", "output") :)
let $record :=
<document id="doc_20150419014112">
<text>ñáéíóú</text>
</document>
for $target in ('/db/output')
return xmldb:store($target, $filename, $record)
An error occurred: Failed to parse XML-RPC request: Byte "195" is not a member of the (7-bit) ASCII character set.
use utf8
в вашем скрипте, потому что вы вводите расширенные символы непосредственно в скрипт. Это гарантирует, что встроенная строкаñáéíóú
на самом деле закодирована в UTF-8. - person Sinan Ünür   schedule 29.04.2015new RPC::XML::Client
напишитеRPC::XML::Client->new
и т. д. Perl — это не Java. - person Sinan Ünür   schedule 29.04.2015utf8
в исходном коде, который включает строковые литералы UTF-8, является необходимым условием, а не достаточным. Также убедитесь, что вы действительно сохранили файл в кодировке UTF-8. Опять же, это необходимое условие, прежде чем кому-либо следует тратить время на дальнейшее изучение этого вопроса. Очевидно, база данных по какой-то причине ожидает от вас 7-битный ASCII. - person Sinan Ünür   schedule 29.04.2015