Я ищу регулярное выражение, которое может правильно соответствовать действительному пиньину (например, «sheng», «sou» (при игнорировании недействительного пиньинь, например «shong», «sei»). Большинство регулярных выражений при условии, что в большинстве случаев результаты поиска в Google не совпадают с недействительным пиньином в некоторых случаях.Regex for Matching Pinyin
Очевидно, что независимо от того, какой подход требуется, это будет регулярное выражение монстра, и меня особенно интересуют различные подходы, которые можно было бы решить для решения этой проблемы .. К примеру, «Optimizing a regular expression to parse chinese pinyin» использует lookbacks
таблица действительного пиньинь можно найти здесь: http://pinyin.info/rules/initials_finals.html
Вы говорите, что «су» является действительным и недействительным. – mareoraft
Хороший улов. «Sou» действительно, поэтому я изменил второй на «sei», что является недействительным пиньинь. – stevendaniels
Большой вопрос. Для практических приложений таблица поиска имеет несколько преимуществ перед регулярным выражением. –