0

Учитывая, что у меня может быть файл ARFF, что написано в следующем виде:Тестовые в Weka

@relation spamOrNot 
@attribute body String 
@attribute result {spam, notspam} 
"free money now!", spam 
"hi meet me at 10", notspam 

И я должен был работать, чтобы это обучить наивный байесовский классификатор на Weka. Как создать тестовый набор, чтобы этот обученный классификатор мог делать прогнозы? Благодарю.

+0

Загрузите копию своего собственного почтового ящика и спамбокса, напишите сценарий для преобразования сообщений в спам и проверьте, получаете ли вы те же прогнозы, что и ваш поставщик электронной почты. –

ответ

1

Существует много хранилищ данных, где вы можете найти примеры спама и нежелательной почты (из реальной жизни). Затем возьмите тело сообщений спама и спама и создайте аналогичный файл arff, подобный этому (но на этот раз он будет тестировать файл arff) с соответствующими ярлыками (спам для тел почты спама и notspam для тел почты, не входящих в спам). С вашим учебным файлом arff вы получите модель классификатора. Сохраните эту модель. Затем на вкладке Weiki explorer классифицируйте вкладку, выберите радиокнопку «тестовый набор» и выберите свой тестовый набор (на нем будут метки). Затем загрузите свою учебную модель, щелкните ее правой кнопкой мыши и затем выберите повторную оценку с помощью тестового набора. Вы сделали.

Смежные вопросы