2017-02-18 6 views
0

Я работаю с грязной базой данных, в которой мне нужно предоставить формат для некоторых столбцов данных. Для этого я использую много GSub и другие формы регулярных выражений. Моя проблема - некоторые из символов, которые мне нужно очистить, - это «странные» персонажи, особенно A с фигурной фигурой, за которой следует другой странный персонаж (Ã ').RStudio - Странные символы становятся регулярными символами

Когда я копирую из базы данных, а затем наклеить на моей функции GSUB:

gsub("CALLÑE", "CALLE", data)

enter image description here

Он отлично работает, пока я не закрою и RStudio и открыть его. Затем символы различаются в файле RScript. Это как если бы RStudio не поддерживает сам странные символы, и удаляет их из сценариев, когда они вновь:

gsub("CALLÃ'E", "CALLE", data)

enter image description here

Как я могу избежать этого? И сохраняйте мои странные символы даже после закрытия файла.

+0

Пожалуйста, посмотрите, помогает ли [это] (http://stackoverflow.com/a/34317869/3079302). PS: когда вы редактируете свой вопрос для внесения исправлений, вы можете также удалить то, что было не так, если оно не дает никакого контекста и не меняет сам вопрос. – iled

+0

Для простоты я делаю это: (1) вектор <-c ('CALLÃ'E') (2) Кодирование (вектор) <- 'latin1', но Вектор остается тем же. –

+0

Почему вы говорите latin1, если хотите сохранить не латинские символы? – Elin

ответ

2

В RStudio, перейдите File ->Save with Encoding...

Выберите UTF-8 вариант.

Смежные вопросы