Я пытаюсь сопоставить все латинские символы в кодированном тексте UTF 16. Я использую [A-Za-z], который отлично работает. Поскольку я анализировал китайский и японский текст, я встречал странные версии A-Z, которые регулярное выражение не собирает.Символы, которые не соответствуют [A-Za-z]
https://gist.github.com/kyleect/1c66fd388d362653969d
Left являются символами я не могу определить, правильно от моей клавиатуры. Я копирую и вставляю их в chrome page find input, google search и find find в текстовом редакторе. Все согласны: Left == Right
, но Right != Left
Что это за персонажи и вау, я нацелен на них в регулярном выражении?
Время, чтобы узнать о символьных классах Юникода. – bmargulies
Какой двигатель регулярного выражения вы используете? – Ryan