Я пишу регулярное выражение, которое должно извлекать следующие шаблоны;Регулярное выражение не работает должным образом с турецкими символами
- "çççoookkk gggüüüzzzeeelll" (это означает vvveeerrryyy gggoooddd с турецкими символами "ç" и "ü")
- "ccccoookkk ggguuuzzzeeelll" (это означает то же самое, но с английскими символами "C" и "у")
вот регулярные выражения, которые я пытаюсь;
"\b[çc]+o+k+\sg+[üu]+z+e+l+\b"
: это работает на английском, но не в турецких символов"çok"
: находит "çok", но когда я пытаюсь"ç+o+k+"
не работает "çççoookkk", он находит "çoookkk""güzel"
: находит «Гузель», но когда я пытаюсь"g+ü+z+e+l+"
не работает «gggüüüzzzeeelll»"\b(c+o+k+)|(ç+o+k+)\s(g+u+z+e+l)|(g+ü+z+e+l+)\b"
: не работает должным образом"[çc]ok\sg[uü]zel"
: Я также попытался это, чтобы получить «çok ГУЗ el ", но не работает.
Возможно, проблема связана с использованием операторов регулярных выражений с турецкими символами. Я не знаю, как я могу это решить.
Я использую http://www.myregextester.com, чтобы проверить правильность моих регулярных выражений.
Я использую язык программирования Php, чтобы получить конкретный шаблон из найденных твитов через Twitter Rest Api.
Спасибо,
его не проблема в вашем Regex, двигатель на этом сайте, используя разные. сделайте одно, выберите вариант .net на этом сайте, тогда вы получите правильный результат, что хотите. – Civa
Какой язык программирования вы используете в этом контексте? –
@ JukkaK.Korpela Я использую язык программирования Php, чтобы получить определенный шаблон из найденных твитов через Twitter Rest Api. – bulutcagatay