2016-08-31 4 views
0

Я использую пакеты R RefManageR и bibtex пакеты для чтения в файле bibtex, который я экспортировал из Mendeley (мой диспетчер ссылок). Иногда авторы перечислены с акцентами от их имени (Лопес), но в BibTeX они сбегают до "L{\\'{o}}pez". Однако в другой ссылке это имя написано без акцента (Лопес).Unescape LaTeX to UTF-8 или ASCII

Как разобрать "L{\\'{o}}pez" на López или Lopez, чтобы я мог их сравнить?
я гугле, но это только показывает, как я могу избежать -когда я хочу unescape- или сделать из PDF в R.

ответ

0

Я попробовал это, и это работает для меня, но я все еще думаю, что должно быть лучшим решением:

deTeX <- function(x) { 
    gsub("\\{\\\\.+?\\{([a-z]*)\\}\\}", "\\1", x, fixed = FALSE, perl = TRUE, ignore.case = TRUE) 
}