У меня есть файл arff, содержащий некоторые предложения (персидский язык) и слово перед каждым предложением, которое показывает его класс в части @data. Мне нужно использовать smo для классификации. Вопросы:Как использовать строковые данные для svm (smo) в weka
1) Необходимо ли изменить предложения к векторам?
2) Я выбрал строку «string to word vector», но smo неактивен и по-прежнему не работает. (и, конечно, другие алгоритмы, такие как наивные заливы).
Как я могу использовать эти текстовые данные с помощью smo?
выше картина очень маленький образец файла.
образец файла: https://www.dropbox.com/s/ohpyortve8jbwhe/shoor.arff?dl=0
Я решил проблему. Теперь он возвращает ответ. Но когда я использую «string to word vector», потому что предложения являются персидскими, алфавиты меняются на фигуры выше. Означает ли мы эти формы как настоящие слова на персидском языке? Я имею в виду, оказывает ли это какое-либо влияние на ответ? – sara
Как я могу изменить эти фигуры на реальные слова на персидском языке? – sara
Привет, я думаю, да. Но weka - это «черный ящик», поэтому его трудно проверить. Как насчет реализации простого Python и scipy для этого? Я могу иметь код в своих материалах. Если вы хотите, я могу поделиться с вами кодом;) –