2014-12-03 2 views
-2

Я играл с некоторыми пакетами идентификации языка в Python и хотя они очень успешно дифференцировали общие языки, они не могут отличить английский английский и американский английский. Кто-нибудь сталкивается с техникой (в Python), которая может быть использована для идентификации этой разницы?Идентификация языка (английский и английский)

+0

'd = { 'цвет': 'американского', 'цвета': ' Redcoat '} ':) – CoryKramer

+2

попробуйте http://pythonhosted.org/pyenchant/ –

ответ

0

Вы можете использовать регулярные выражения для проверки экземпляров согласных + "или"/"наш", что-то вроде:

import re 

txt="honor" 

re_american = re.compile(".*?[bcdfghjklmnptv](o)(r)",re.IGNORECASE|re.DOTALL) 
re_british = re.compile(".*?[bcdfghjklmnptv](o)(u)(r)",re.IGNORECASE|re.DOTALL) 

b = re_british.search(txt) 
a = re_american.search(txt) 

if b: print "British" 
elif a: print "American"