Я разрабатываю небольшое программное обеспечение для автоматизации библиотеки, и мне нужно определить слово в English или Turkish. Примерный сценарий выглядит так:Как определить слово на английском или любом другом языке
- Пользователь вводит название книги.
- Определить, что это турецкий или английский.
- Установите поле со списком языка на соответствующий язык, чтобы помочь пользователю заполнить форму.
Мой друг предложил мне «подключиться к Google Translate и использовать его», что кажется разумным, но алгоритм без подключения внешней службы или базы данных будет более подходящим для меня. (Я также искал турецкие/английские специфические персонажи, такие как ç, ş, İ/w, x). Поэтому я ищу алгоритм для выполнения этой работы, возможно, на основе частот букв или чего-то подобного. Все, что доступно в литературе? Заранее спасибо. (Я использую php, mysql, если это важно)
HTTP: //stackoverflow.com/questions/1441562/detect-language-from-string-in-php вы также можете проверить http://wiki.apache.org/solr/LanguageDetection Solr может дать вам язык с вероятностью (для этого предложения составляет 90% Engl ish или 10% турецкий) – fsw
как насчет слов, которые оба? – 2013-04-07 21:09:42
спасибо за ответы. Дагон, я не ожидаю 100% точного алгоритма, frenchie это хобби проект, и я думаю, что предоставление такой функции может быть приятным. fsw, ваши ссылки подходят для меня. Я бы принял ваш ответ, если бы вы написали его как ответ, а не комментарий. –