Я делаю что-то вроде обнаружения языков сайта. Это около 1k веб-сайтов, поэтому я не могу сделать это 1 к 1. Думаю, для этого мне нужно получить код html на сайте python и получить все тексты, проанализировать. Правильно ли, кто-нибудь сделал что-то подобное, было бы очень полезно :)Как узнать, не является ли сайт неанглийским?
-4
A
ответ
0
Спасибо всем за ответ, я нашел способ к нему. Перечислив рейтинг alexa сайта и большую часть страны посетителя. Если это США или другая англоговорящая страна, то это английский сайт.
сделал это by python.
Смежные вопросы
- 1. Алгоритм, чтобы узнать, является ли веб-сайт блогом?
- 2. Как узнать, принимает ли веб-сайт iframes?
- 3. Как узнать, предлагает ли сайт услуги AJAX
- 4. Связь с неанглийским WMI
- 5. Как узнать, работает ли сайт в ATG?
- 6. Как узнать, обновлен ли сайт google
- 7. Как узнать, работает ли веб-сайт?
- 8. phantomjs с неанглийским url
- 9. "Сайт" не является пакет
- 10. Является ли мой сайт медленным?
- 11. Как узнать, является ли каталог ZipArchiveEntry?
- 12. Как узнать, является ли класс неизменным
- 13. Как узнать, является ли запрос Коханы внутренним?
- 14. Как узнать, является ли мой keywindow.rootViewController оповещением?
- 15. Как узнать, является ли назначение приватным
- 16. Как узнать, является ли приложение незанятым
- 17. Как узнать, является ли объект анонимного типа?
- 18. Как узнать, является ли List.remove() «неподдерживаемым»?
- 19. Как узнать, является ли NSDate рабочим днем?
- 20. Как узнать, является ли символ возвратом каретки?
- 21. Как узнать, является ли MIDIEndpointRef виртуальным?
- 22. Как узнать, является ли репозиторий субмодулем
- 23. Как узнать, является ли свойство CMIS модифицируемым?
- 24. Как узнать, является ли число WhatsApp?
- 25. Git: Как узнать, является ли фиксация вишней?
- 26. Как узнать, является ли апплет или приложение
- 27. Как узнать, является ли хеш Perl многомерным?
- 28. Как узнать, является ли метод устаревшим?
- 29. Как узнать, является ли объект макетом?
- 30. Как узнать, является ли элемент класса методом?
SO не является кодовым письмом. Просьба показать ваши попытки и любые ошибки, с которыми вы можете столкнуться. – sgp
http://stackoverflow.com/questions/4605062/detecting-whether-or-not-text-is-english-in-bulk это может помочь – Ajay
Вы имеете в виду код или содержание? Как насчет сайтов, поддерживающих несколько языков/i18n? – jonrsharpe