Я тяну твиты в python, используя tweepy. Он отображает все данные в формате Юникод. Например: тип печати (данные) дает мне <type 'unicode'>
Удалить символы юникода python
В нем содержатся символы Юникода. Например: hello\u2026 im am fine\u2019s
Я хочу удалить все эти символы Юникода. Есть ли регулярное выражение, которое я могу использовать? str.replace
не является жизнеспособным вариантом, так как символы юникода могут быть любыми значениями: от смайликов до юникодовых апострофов.
Весь текст Unicode. Возможно, вы имеете в виду * не-ASCII-символы? –
Да нет символов ascii. Это обычный текст на английском языке, перемежающийся с помощью \ u2026 и т. Д. – ashish1512