readLines преобразует дефисы "-" в .txt-файле в "\ x". Зачем? Я пробовал играть с кодировкой, но без успеха. Я также попытался использовать gsub и str_replace_all (пакет stringr), чтобы заменить «\ x» на задней панели фактическим дефисом «-».readLines преобразует дефис (-) в x
record <- readLines(con="~/Dropbox/WisconsinLeg/input/WI_1895.txt", encoding="UTF-8")
Я не могу прикрепить файл .txt попробовать чтение в, но вот некоторые выборочные данные, когда он считывается в R, используя продолжающуюся строку кода:
c("IN ASSEMBLY.", "JOURNAL OF PROCEEDINGS", "\xd1 OF THE-", "FORTY-SECOND SESSION","\xd1 OF THE \xd1", "WISCONSIN LEGISLATURE.")
Один из вариантов код, который я пытался заменить «\ х» с:
record <- str_replace_all(record, pattern="\x", replace="-", fixed=FALSE)
Кроме того, для моего назидания, что делает «\ х» означает? Это просто дефис или это какой-то особый характер?
Заранее спасибо.
EDIT:
Вот как текст выглядит в текстовом файле:
В СОБРАНИИ.
ЖУРНАЛ ПРОТОКОЛ
- теоретиче-
сорок второй сессии
- ИЗ -
ВИСКОНСИН ЗАКОНОДАТЕЛЬНАЯ.
18QS.
Следовательно, почему я предположил, что это дефис. Благодаря ответчикам.
Это не' \ x', это '\ xHH' где' HH' есть два шестнадцатеричные символы. '\ xd1' означает« символ с ASCII значением 0xD1 (hex) ». –