Я использую Python 2.x и я загрузке текста из файла, а вот одна строка из текстапростое регулярное выражение питона
Odio ¿Mañana pensar porque RT luego pasa lo que pasa Marzo ♡♡♡
Я нашел это регулярное выражение [^ \ x30- \ XFF], чтобы соответствовать именно символы, которые я хотел (с помощью онлайн-инструментов, регулярные выражения), но когда я использую его в своем коде, как это:
filtered_comments = re.sub("[^\x30-\xFF]", " ", all_comments)
он не совпадает с тем же символы; вы можете попробовать это на http://pythex.org поэтому в этом тексте я хочу совместить ♡♡♡ и оставить ñ и ¿ .... любая идея?
Почему не '[♡]'? –
, потому что на самом деле меня не интересует только эта строка, у меня есть класс символов, отличных от ASCII, в тексте файла, в котором я работаю, с которым мне нужно выполнить захват, но не всех не-ASCII, таких как: – 7kemZmani