я не могу найти способ сделать это ...извлечь разницу («относительное дополнение») между двумя строками в г
raw_string <- "\"+001\", la bonne surprise de M. Jenn M. Ayache http://goo.gl/3EXxy6 via @MYTF1News"
clean_string <- "+001, la bonne surprise de Jenn Ayache"
desired_string <- "\"\"M. M. http://goo.gl/3EXxy6 via @MYTF1News"
Я не уверен, о том, как назвать эту трансформацию. Я бы сказал «разницу» (как в теории множеств, против «союза» и «пересечения»). Лучшее имя может быть «относительным дополнением» (http://en.wikipedia.org/wiki/Complement_(set_theory)#Relative_complement).
Моя искомая строка имеет только и все символы, отсутствующие в clean_string, в порядке, один раз для каждого появляющегося момента, включая пробелы, знаки препинания и все такое.
Лучшим, что я смог сделать, это не достаточно хорошо:
> a <- paste(Reduce(setdiff, strsplit(c(raw_string, clean_string), split = " ")), collapse = " ")
> a
[1] "\"+001\", M. http://goo.gl/3EXxy6 via @MYTF1News"
Спасибо, но я не понимаю, почему он не работает с этими двумя строками: 'raw_string <-«\»Tranquille, 196 досье де détenus trouvés данс ла Рю (по ле а) \» HTTP: //rue89.nouvelobs.com/2014/09/02/tranquille-196-dossiers-detenus-trouves-rue-les-a-254557 через @ Rue89 "и' clean_string <- "Tranquille, 196 досье de détenus trouvés dans la rue (on les a) "' –
Кажется, что это дает '' \ "\" http://rue89.nouvelobs.com/2014/09/02/tranquille-196-dossiers-detenus-trouves-ru e -les-a-254557 via @ Rue89 "' – konvas
Вы правы: я получил ошибку при применении функции к столбцу строк, проблема должна быть в моем внешнем цикле! Я снова проверяю –