2
Мне нужно найти составляющие символов Хангула. Например. Я бы хотел найти ㅏ в 한. Есть ли способ сделать это с помощью Perl-совместимых регулярных выражений?Могу ли я искать разложенные формы Хангула?
Мне нужно найти составляющие символов Хангула. Например. Я бы хотел найти ㅏ в 한. Есть ли способ сделать это с помощью Perl-совместимых регулярных выражений?Могу ли я искать разложенные формы Хангула?
Unicode block\p{InHangul_Compatibility_Jamo}
(U + 3130 - U + 318F).
Python 3.x пример (с использованием сторонних regex
модуля):
>>> import regex
>>> regex.findall(r'\p{InHangul_Compatibility_Jamo}', '한ㅎㅏㄴ글')
['ㅎ', 'ㅏ', 'ㄴ']
>>> regex.findall(r'[\u3130-\u318f]', '한ㅎㅏㄴ글')
['ㅎ', 'ㅏ', 'ㄴ']