В R, я пытаюсь обучить нейронную сеть на нескольких файлах. Я выполнил мультиномическую функцию на одном наборе данных, но я не могу найти, как обучать мою модель другим набором данных.В R, поезд/модель обновления с несколькими наборами данных
Поэтому я хочу применить модель от предыдущего вызова к новым данным без переоценки модели.
Итак, сначала вы строите модель, как в ответе Сэма Томаса.
#load libraries
library(nnet)
library(MASS)
#Define data
example(birthwt)
# Define training and test data
set.seed(321)
index <- sample(seq_len(nrow(bwt)), 130)
bwt_train <- bwt[index, ]
bwt_test <- bwt[-index, ]
# Build model
bwt.mu <- multinom(low ~ ., data=bwt_train)
Тогда у меня есть другой подобный набор данных. Я хочу обучить/обновить ранее созданную модель. Поэтому я хочу обновить модель новыми данными, чтобы улучшить мою модель.
# New data set (for example resampled bwt)
bwt2=sapply(bwt, sample)
head(bwt2,3)
low age lwt race smoke ptd ht ui ftv
[1,] 1 31 115 3 1 1 0 0 2
[2,] 1 20 95 1 0 1 0 0 3
[3,] 2 25 95 2 0 1 0 1 1
# Define training and test data with new dataset
set.seed(321)
index <- sample(seq_len(nrow(bwt2)), 130)
bwt2_train <- bwt2[index, ]
bwt2_test <- bwt2[-index, ]
Теперь с этим новым набором данных я хочу оптимизировать модель. Я не могу объединить два набора данных, потому что модель должна обновляться со временем, когда новые данные доступны. Это также потому, что не рекомендуется пересчитывать каждый раз, когда у нас появляются новые данные.
Спасибо заранее, Адам
Привет Сэм спасибо за ваш ответ. Вы объяснили, как мультином работает над обычным набором данных с одним учебным набором данных. Мой вопрос - еще один шаг. Итак, теперь у меня есть другой набор учебных материалов для оптимизации моего классификатора. Итак, как мне улучшить мою более раннюю модель сборки. – AdamA3
@ AdamA3. Спасибо за комментарий. Это может помочь уточнить, что вы подразумеваете под улучшением модели; также полезно воспроизводимый пример. Если у вас есть определенное представление о том, что вы хотите сделать, это подходит для stackoverflow. Если у вас есть вопросы более статистического характера, то перекрестный контроль будет более уместным. – Whitebeard