Мне нужно удалить знаки препинания из текста. Я использую пакет тм, но улов:Удаление пунктуации из текста с помощью R
, например: текст что-то вроде этого:
data <- "I am a, new comer","to r,"please help","me:out","here"
теперь, когда я бегу
library(tm)
data<-removePunctuation(data)
в моем коде, результат:
I am a new comerto rplease helpmeouthere
но то, что я ожидаю:
I am a new comer to r please help me out here
'данные <-» Я «новый», «r», «пожалуйста, помогите», «me: out», «here» 'является недопустимым синтаксисом в R, можете ли вы сделать это воспроизводимым? Используете ли вы' c', и это несколько строк ? Или это всего лишь одна длинная строка (судя по вашему желаемому результату). В любом случае, лет u может попробовать что-то вроде 'gsub (" [[: punct:]] "," ", data)' для стартеров. –