2013-04-04 2 views
1

Может ли кто-нибудь поделиться фрагментом кода, который показывает, как использовать SVM для интеллектуального анализа текста с использованием scikit. Я видел пример SVM по числовым данным, но не совсем уверен, как работать с текстом. Я посмотрел http://scikit-learn.org/stable/auto_examples/document_classification_20newsgroups.html , но не смог найти SVM.SVM для текстового поиска с использованием scikit

ответ

1

В проблемах с поиском текста текст представлен числовыми значениями. Каждая функция представляет собой слово, а значения - двоичные. Это дает матрицу с большим количеством нулей и несколько единиц, что означает, что соответствующие слова существуют в тексте. Словам могут быть даны некоторые веса в соответствии с их частотой или некоторыми другими критериями. После этого вы получите некоторые действительные числа, а не 0 и 1.

После преобразования набора данных численных значений, которые вы можете использовать этот пример: http://scikit-learn.org/dev/modules/generated/sklearn.svm.SVC.html#sklearn.svm.SVC

Смежные вопросы