У меня есть грязные данные, которые нужно тщательно прочистить. В принципе, мне нужно сущность-код некоторых строк, которые содержат одиночный &
в &
. К сожалению, некоторые строки также имеют в них другие объекты символов, поэтому это означает, что я не могу выполнить прямую глобальную замену.Преобразование & & при сохранении существующих ссылок на объекты
Я обнаружил некоторые из 4 миллионов строк плюс то, что я видел до сих пор, говорит о том, что большая часть одиноких & s окружена пробелами, но я не уверен на 100%.
Это немного выше моего регулярного выражения.
Какой язык вы используете? –
Python для этого. – katesporks