Извлечение текстов из большой строки символов на основе шаблона

У меня есть большая строка символов, и я хотел бы извлечь из нее определенную информацию, соответствующую шаблону:

str(input) chr [1:109094] "{'asin': '0981850006', 'description': 'Steven Raichlen\'s Best of Barbecue Primal Grill DVD. The first three volumes of the si"| truncated ...

Я получаю следующее содержимое input[1] - описание метаданных продукта

[1] ("{'asin': '144072007X', 'related': {'also_viewed': ['B008WC0X0A', 'B000CPMOVG', 'B0046641AE', 'B00J150GAO', 'B00005AMCG', 'B005WGX97I'], 
         'bought_together': ['B000H85WSA']}, 
         'title': 'Sand Shark Margare Maron Audio CD', 
         'price': 577.15, 
         'salesRank': {'Patio, Lawn & Garden': 188289}, 
         'imUrl': 'http://ecx.images-amazon.com/images/I/31B9X0S6dqL._SX300_.jpg', 
         'brand': 'Tesoro', 
         'categories': [['Patio, Lawn & Garden', 'Lawn Mowers & Outdoor Power Tools', 'Metal Detectors']], 
'description': \"The Tesoro Sand Shark metal combines time-proven PI circuits with the latest digital technology creating the first.\"}") 

Теперь я хотел бы перебрать каждый элемент большой строки и извлечь asin, title, price, salesRank, brand и categories, которые должны быть сохранены в data.frame для лучшей обработки.

Данные изначально взяты из файла JSON, как вы могли заметить. Я пытался импортировать его с помощью команды stream_in, но это не помогло. Поэтому просто импортировал его, используя readLines. Пожалуйста, помогите! Быть немного в отчаянии... Любой намек приветствуется!

Пакет jsonlite показывает следующую проблему:

lexical error: invalid char in json text.
                                      {'asin': '0981850006', 'descript
                     (right here) ------^
closing fileconnectionoldClass input connection.

Есть какие-нибудь новые идеи по этому поводу? Учитывая множество оставшихся без ответа вопросов по этому вопросу, должно быть очень актуальным для новичков ;)


person vanja_65    schedule 20.03.2016    source источник
comment
Рассматривали ли вы возможность использования пакета jsonlite?   -  person akrun    schedule 20.03.2016
comment
да :) и столкнуться с проблемой, подобной этой stackoverflow.com/questions/32158366/   -  person vanja_65    schedule 20.03.2016
comment
Но ни одно из предложений там действительно не помогает... :(   -  person vanja_65    schedule 20.03.2016
comment
У меня такая же проблема с разбором JSON в JavaScript. JSON требует ", ' не допускается. Вот почему вы получаете ошибку недопустимого символа, вместо этого используйте ".   -  person Kaspar Lee    schedule 20.03.2016
comment
Привет, Друзион. Спасибо за ваш комментарий. Не могли бы вы быть более конкретным - как я должен указать команду?   -  person vanja_65    schedule 20.03.2016
comment
Ваш тест JSON недействителен. все ключи должны быть заключены в " двойные кавычки вместо одинарных. Как только вы исправите содержимое JSON, jsonlite с радостью его проанализирует.   -  person Saleem    schedule 20.03.2016
comment
Привет Салим, спасибо! как я могу добиться этого в r при импорте файла?   -  person vanja_65    schedule 20.03.2016
comment
Привет, rawr, кажется, работает для извлечения содержимого из char. Спасибо!   -  person vanja_65    schedule 20.03.2016