2015-07-09 3 views
5

Я новичок в wowpal wabbit, поэтому у вас есть некоторые вопросы об этом.Как сделать vowpal wabbit использовать больше наблюдений

Я передал набор данных в vw и поместил модель и получил предсказания в виде выборок, сохранил модель с -f. Все идет нормально. Я знаю, как использовать модель и делать прогнозы на разных наборах данных. Но я хочу знать, как добавить больше наблюдений в модель и обновить ее.

Основная цель: использовать некоторый фрагмент данных, чтобы сначала сделать vw, чтобы изучить его в Интернете, а затем использовать эту модель для прогнозирования некоторых данных. затем используйте новые данные для обновления модели. затем используйте обновленные данные, чтобы предсказать еще одно новое наблюдение, и этот процесс должен продолжаться.

Как я сказал, что я новичок, так любезно пытаются оправдаться тривиальности вопроса

ответ

6
vw -i existing.model -f new.model more_observations.dat 

сспециальной:

  • -i начальной
  • -f окончательный

Вы можете использовать одно и то же имя файла модели в -i и -f для уточнения «на месте« так как это действительно не на месте. Замена модели происходит в конце пробега в атомной моде (переименование временного файла в конечный файл), как можно видеть в следующем strace выходе (с комментариями,):

$ strace -e open,close,rename vw --quiet -i zz.model -f zz.model f20-315.tt.gz 
# loading the initial (-i zz.model) model into memory 
open("zz.model", O_RDONLY)    = 3 
# done loading, so we can close it 
close(3)        = 0 
# Now reading the data-set and learning in memory 
open("f20-315.tt.gz", O_RDONLY)   = 3 
# data read complete. write the updated model into a temporary file 
open("zz.model.writing", O_WRONLY|O_CREAT|O_TRUNC, 0666) = 4 
close(4)        = 0 
# and rename atomically to the final (-f zz.model) model file 
rename("zz.model.writing", "zz.model") = 0 
... 
close(4)        = 0 
close(3)        = 0 
+++ exited with 0 +++ 
+0

давая это «more_observation. dat "и давая" -d more_observation.dat "разные или одинаковые? – DarkHorse

+0

Должен вести себя так же или без '-d' – arielf

+1

Я бы добавил, что для такого варианта использования лучше сохранить/загрузить файлы модели с помощью ключа' --save_resume'. Без него vw не ожидает, что эта модель будет использоваться для чего-то, кроме предсказания, и не включает в себя некоторые дополнительные параметры алгоритма обучения в модели, которые могут быть использованы для продолжения обучения модели позже. Поэтому без '--save_resume' последовательная тренировка будет немного менее эффективной. – truf

Смежные вопросы