Я пытаюсь соответствовать последовательности сепараторов, но отрицать всякий раз, когда дефис в качестве символа до и после, как например:Регулярное выражение для соответствия набора символов, но инвертировать последовательность
Например [\u002D\u0020]
будет соответствовать все пробелы и дефис.
У меня есть Wi-Fi
Однако, я хочу Wi-Fi, чтобы не быть матча, так как он имеет письмо характер до и после. (например, \w+\u002D\w+
)
Как отменить последовательность при сопоставлении набора символов? Кроме того, \ w ограничен латинскими буквами? Является ли двигатель осведомленным о культурах, арабском и турецком, например?
EDIT: Просто для объяснения того, чего я пытаюсь достичь. Я хочу собрать все знаки препинания и конкретные символы из предложения и игнорировать все слова (например, - + # $% и т. Д.).
Всякий раз, когда есть дефисное слово (например, состояние дел), я хочу игнорировать все слово. «это #% -ный современный дизайн», я намереваюсь получить следующую коллекцию: «#,%».
«Является ли двигатель осведомленным о культурах», к сожалению, это не очень хорошо, если вы хотите, чтобы международные вещи. Существуют библиотеки регулярных выражений, такие как XRegExp, которые работают с ними. – vlaz
Можете ли вы поместить образцы данных о том, каковы ваши ожидаемые действительные совпадения и недействительные соответствия? –
В JS '\ w' не знает Unicode. –