2011-01-20 2 views
1

Для любого примера имени домена для microsoft.com или mainsoft.com как его разделить на два слова?Как извлечь слова из строки имени домена

говорят mico и soft, main и soft

я говорю о каких-либо областях ... как stackoverflow.com она должна быть stack, over и flow

Как это можно сделать?

+3

Вы хотите, чтобы вы использовали словарь для извлечения слов? – Jonah

+2

какие критерии вы используете? Должно ли быть около 4 или 5 букв? Должны ли они быть действительными словами на английском языке? Что вы хотите делать с www.google.com? – Nanne

ответ

1

Я предлагаю выполнить поиск в строке домена по списку известных слов, а затем использовать тонкую библиотеку строк php, чтобы разбить ее.

http://wordlist.sourceforge.net/ является одним из источников списков слов.

0

Вы можете попробовать один из библиотек переносов, упомянутых в этом ответе:
Wrapping a text using php, based on language

Он разбивает слова на слоги, которые, вероятно, что вы хотите. Я думаю, что словарьный подход будет более надежным, но имеет больше зависимостей.

Смежные вопросы