Наконец-то я получил свой скрипт для отправки PDF-документа в хранилище Google, а затем извлечения текста с помощью Google Vision для PDF, как описано в документация.
Данные возвращаются в огромном файле JSON. Есть один узел, содержащий test, но он больше не отформатирован. Только разрывы строк обозначаются \n
. Меня не так волнуют разрывы строк, как абзацы.
Как я могу вернуть его отформатированным? Существуют ли какие-либо библиотеки, которые будут работать с GCP для улучшения вывода JSON?
cat foo.json | jq .
(обратите внимание на точку). - person Roadowl   schedule 27.05.2019