Я использую R RJSONIO для чтения json из файла. Json содержит символы Unicode, которые читаются некорректно.Как правильно иметь дело с экранированными символами Unicode в библиотеке R RJSONIO при чтении json из файла
Код работает, когда json передается как строка, как показано автором пакета R в вопросе о stackoverflow How to correctly deal with escaped Unicode Characters in R e.g. the em dash (—).
Однако, когда json считывается из файла, он не создает правильное представление в Юникоде. Как показано ниже:
fromJSON(content="~/MTS/temp")
$query
$query$categorymembers
$query$categorymembers[[1]]
$query$categorymembers[[1]]$ns
[1] 0
$query$categorymembers[[1]]$title
[1] "Banach\023Tarski paradox"
Где ~/MTS/температура содержит:
{"query":{"categorymembers":[{"ns":0,"title":"Banach\u2013Tarski paradox"}]}}`
Какая версия ОС и R вы работаете? Я пробовал в Windows с R 3.1.1 с 'fromJSON (content = '{" query ": {" categorymembers ": [{" ns ": 0," title ":" Banach \ u2013Tarski paradox "}]}}') 'и он вернул« [1] «Парадокс Банаха-Тарского» «просто отлично. Вы говорите, что файл буквально имеет '\ u' в нем? Как вы создали такой JSON-файл? – MrFlick
Когда вы копируете эту json ({"query": {"categorymembers": [{"ns": 0, "title": "Banach \ u2013Tarski paradox"}]}}) с \ u2013 в файл и прочитайте из файла, используя fromJSON (content =), вы получаете \ 023 или получаете em-dash? Я использую Mac OSx 10.9 и R версии 3.2. –
Ну, наличие '\ u' в файле JSON недопустимо (если вы хотите, чтобы последующий номер считался символом Юникода). Как вы создаете недопустимый JOSN-файл в первую очередь? – MrFlick