У меня есть большая строка символов, и я хотел бы извлечь из нее определенную информацию, соответствующую шаблону:
str(input)
chr [1:109094] "{'asin': '0981850006', 'description': 'Steven Raichlen\'s Best of Barbecue Primal Grill DVD. The first three volumes of the si"| truncated ...
Я получаю следующее содержимое input[1]
- описание метаданных продукта
[1] ("{'asin': '144072007X', 'related': {'also_viewed': ['B008WC0X0A', 'B000CPMOVG', 'B0046641AE', 'B00J150GAO', 'B00005AMCG', 'B005WGX97I'],
'bought_together': ['B000H85WSA']},
'title': 'Sand Shark Margare Maron Audio CD',
'price': 577.15,
'salesRank': {'Patio, Lawn & Garden': 188289},
'imUrl': 'http://ecx.images-amazon.com/images/I/31B9X0S6dqL._SX300_.jpg',
'brand': 'Tesoro',
'categories': [['Patio, Lawn & Garden', 'Lawn Mowers & Outdoor Power Tools', 'Metal Detectors']],
'description': \"The Tesoro Sand Shark metal combines time-proven PI circuits with the latest digital technology creating the first.\"}")
Теперь я хотел бы перебрать каждый элемент большой строки и извлечь asin
, title
, price
, salesRank
, brand
и categories
, которые должны быть сохранены в data.frame для лучшей обработки.
Данные изначально взяты из файла JSON, как вы могли заметить. Я пытался импортировать его с помощью команды stream_in
, но это не помогло. Поэтому просто импортировал его, используя readLines
. Пожалуйста, помогите! Быть немного в отчаянии... Любой намек приветствуется!
Пакет jsonlite
показывает следующую проблему:
lexical error: invalid char in json text.
{'asin': '0981850006', 'descript
(right here) ------^
closing fileconnectionoldClass input connection.
Есть какие-нибудь новые идеи по этому поводу? Учитывая множество оставшихся без ответа вопросов по этому вопросу, должно быть очень актуальным для новичков ;)
jsonlite
? - person akrun   schedule 20.03.2016"
,'
не допускается. Вот почему вы получаете ошибку недопустимого символа, вместо этого используйте"
. - person Kaspar Lee   schedule 20.03.2016"
двойные кавычки вместо одинарных. Как только вы исправите содержимое JSON, jsonlite с радостью его проанализирует. - person Saleem   schedule 20.03.2016