Я пытаюсь прочитать некоторые данные из API-интерфейса API графики Google в R, чтобы сделать некоторый анализ текста. Тем не менее, похоже, что в канале JSON есть необработанные обратные слэши, что приводит к тому, что rjson имеет значение barf. Ниже приведен минимальный пример того типа ввода, который вызывает проблемы.Чтение безвозвратных обратных косых черт в JSON в R
library(rjson)
txt <- '{"data":[{"id":2, "value":"I want to \\"post\\" a picture\\video"}]}'
fromJSON(txt)
(Обратите внимание, что двойные обратные косые в \\"
и \\video
преобразует одиночкам обратную косую черту после разбора, который является то, что в моих фактических данных.)
Я также попробовал пакет RJSONIO, который также дал ошибки, и даже рухнул R в разы.
С кем-нибудь сталкивалась эта проблема раньше? Есть ли способ исправить это, чтобы вручную не рубить все ошибки, которые возникают? Есть потенциально мегабайты JSON, которые анализируются, и сообщения об ошибках не очень информативны о том, где именно находится проблематичный ввод.
Спасибо. Это не работает, потому что есть символы, такие как '\ '', чтобы обозначить экранированные кавычки. IOW, иногда обратные косые черты корректны, а иногда их нужно модифицировать. –
Я изменил свой пример, чтобы уточнить. –
@HongOoi OK, я обновил свой ответ. Лучшее решение зависит от того, насколько последовательно ошибается JSON. Если они случайные одиночные или двойные blakslashes, вам, вероятно, потребуется сделать некоторые исправления вручную. –