Я начинаю с текстовой обработки. У меня есть две таблицы базы данных с тысячами данных ..Datamining в базе данных mysql
таблицы для «навыков» и стола для «навыков категории»
- каждое «мастерство» относится к категории навыков.
- «умение» - это физическое поле varchar (200) в базе данных, где есть текст, описывающий навык.
Вот некоторые навыки, извлеченные из навыков таблицы:
"PHP (хороший уровень), Java (intermediaite), C++" "управление проектами и управление качеством" "PHP5" «начинающуюся Javascript " „Гидротехника“ „dfsdf zerze rzer“ „cibling клиенты“
то, что я хочу сделать, это извлечь знания из этих полей, я имею в виду извлечь только реальные навыки и игнорировать остальную часть бесполезного текста. для приведенного выше примера я хочу получить только массив:
"PHP" "Java" "C++" "управление проектами" "PHP5" "управление качеством" "Javascript" «вода инженерные " " cibling customers "
Что мне делать, чтобы извлечь навыки из тонны данных, пожалуйста? Вы знаете конкретные алгоритмы для этого? ex: k-означает ...?
Заранее спасибо.
Можете ли вы показать примеры реальных данных в реальном мире? –
Любое из ответов - жизнеспособное решение? –