Как преобразовать XML-файл, который выглядит так:
<bible>
<b n="Psalm">
<c n="1">
<v n="1"> text text text text </v>
<v n="2"> text text text text </v>
<v n="3"> text text text text </v>
</c>
<c n="2">
<v n="1"> text text text text </v>
<v n="2"> text text text text </v>
<v n="3"> text text text text </v>
</c>
</b>
<b n="Revelation">
<c n="1">
<v n="1"> text text text text </v>
<v n="2"> text text text text </v>
<v n="3"> text text text text </v>
</c>
<c n="2">
<v n="1"> text text text text </v>
<v n="2"> text text text text </v>
<v n="3"> text text text text </v>
</c>
<c n="3">
<v n="1"> text text text text </v>
<v n="2"> text text text text </v>
<v n="3"> text text text text </v>
</c>
</b>
</bible>
В формат фрейма данных / таблицы, который выглядит следующим образом:
# A tibble: 15 x 4
book chapter verse text
<chr> <dbl> <int> <chr>
1 Psalm 1 1 text text text text
2 Psalm 1 2 text text text text
3 Psalm 1 3 text text text text
4 Psalm 2 1 text text text text
5 Psalm 2 2 text text text text
6 Psalm 2 3 text text text text
7 Revelation 1 1 text text text text
8 Revelation 1 2 text text text text
9 Revelation 1 3 text text text text
10 Revelation 2 1 text text text text
11 Revelation 2 2 text text text text
12 Revelation 2 3 text text text text
13 Revelation 3 1 text text text text
14 Revelation 3 2 text text text text
15 Revelation 3 3 text text text text
Я пробовал использовать xmlToDataFrame(nodes = getNodeSet(doc, "/bible"))
из пакета XML, но получил только одно наблюдение с несколькими столбцами. Когда я попытался изменить уровни узлов для функции getNodeSet, я получил duplicate subscripts for columns
ошибку. Спасибо.