-2

Я использую библиотеку libsvm для классификации документов резюме. У меня много резюме, и мне нужно их классифицировать. Нужен ли мне многоклассовый классификатор или многоклассовая классификация в этом случае. Какой вариант выше следует рассмотреть, а также, пожалуйста, предложите способ сделать это?Классификация документов с использованием libsvm в java

+0

@severian .. не могли бы вы предложить? – user3274576

ответ

0

Ваше требование не прямо вперед, для того чтобы разработать такую ​​систему, вам нужно придумать несколько шагов, как пример:

  1. Вам нужен набор данных различных типов документов (различного типа резюме)

  2. Затем вам нужно определить, какие функции могут быть использованы для их разделения (как вы собираетесь их различать, исходя из того, что (например, длина резюме, количество слов, содержание заголовка резюме , и т. д.)

  3. Затем вам нужно подготовить наборы векторов признаков для обучения SVM. (если вам нужно классифицировать только релевантные и нерелевантные резюме, это будет два класса. Если будет более двух классов, это будет многоклассы, а LibSVM поддерживает многоуровневый)

  4. При обучении вам необходимо (read here)

  5. Необходимо выполнить вышеуказанные шаги, чтобы сделать успешное предсказание.

Смежные вопросы