2013-09-03 5 views

ответ

3

Вы можете сделать это, используя Regular Expressions, и, благодаря the work of this guy, у вас есть все RegEx, который вам уже подготовлен.

Вот Зенкаку связаны:

Regex for matching full-width Katakana (zenkaku 全角) 
([ァ-ン]) 

Regex for matching full-width Numbers (zenkaku 全角) 
([0-9]) 

Regex for matching full-width Letters (zenkaku 全角) 
([A-z]) 

Regex for matching full-width (zenkaku) Katakana codespace characters (includes 
non phonetic characters) 
([ァ-ヶ]) 

EDIT: Добавление @ChrisB comment на вопрос:

На самом деле регулярные выражения для хирагана и катакана являются слишком ограничительными.

например. регулярное выражение katakana не соответствует словам, содержащим 長音符,
таких , что и ユーザー и コンピューター.

Вот некоторые более полные регулярные выражения для хирагана и катакана:

  • хирагана = [ぁ-ゔゞ゛゜ー] // 0x3041-0x3094, 0x309E, 0x309B, 0x309C, 0x30FC

  • катакана = [ァ-・ヽヾ゛゜ー] // 0x30A1- 0x30FB, 0x30FD, & # x30FE, 0x309B, 0x309C, 0x30FC

  • хирагана или катакана = [ぁ-ゔゞァ-・ヽヾ゛゜ー] // 0x3041-0x3094, 0x309E, 0x30A1-0x30F B, 0x30FD, & # x30FE, 0x309B, 0x309C, 0x30FC

+0

На самом деле некоторые из регулярных выражений в связанном сущности, не совсем правильно. См. Мой комментарий для лучших: https://gist.github.com/terrancesnyder/1345094#comment-1265689 –

+0

Отлично, не стесняйтесь редактировать мой ответ со своим комментарием и ссылкой @ChrisB –

+0

@ChrisB Я добавил ваш комментарий к ответ. * На доверие *: D –