2017-02-11 3 views
1

Я экспериментировал несколько тестов с Encog и пример AutoMPGRegression:Регрессия Encog с надежностью веса линейного выхода. (Для весомости ошибок)

https://github.com/encog/encog-java-examples/blob/master/src/main/java/org/encog/examples/guide/regression/AutoMPGRegression.java

Моим вопрос довольно прост, есть способ, чтобы установить надежность веса на выход CSV данных линия ?

В некоторых случаях некоторые образцы данных могут быть более надежными, чем другие, поэтому для ненадежных данных линий мы должны сообщить Encog, что это не так важно, если нейронная сеть не подходит для этого вывода.

Экстракт AutoMPGRegression образца CSV данных:

18.0 8 307.0  130.0  3504.  12.0 70 1 "chevrolet chevelle malibu" 

15.0 8 350.0  165.0  3693.  11.5 70 1 "buick skylark 320" 

18.0 8 318.0  150.0  3436.  11.0 70 1 "plymouth satellite" 

Я хотел бы сказать Encog, что для линии 2, выходное значение «15» имеет fiability 50%, так что ошибка должна быть ponderated для этой линии.

Спасибо за помощь, Трикс

+0

@ Gama11 или трикс, что такое сообразительность? –

+0

@YuraZaletskyy по надежности/надежности я имею в виду, что это менее или более уверенно, что для данных входов у нас есть этот выход. – trix

ответ

0

Хороший вопрос! То, о чем вы просите, на самом деле является правильной классификацией выбросов: когда небольшая часть данных обучения не является хорошим представлением данных о цели обучения. Как правило, нейронные сети хорошо понимают, что две исключительные строки - это как-то выбросы, и «понимают» это без вашей помощи. Если у вас есть 1 - 5% выбросов, нейронная сеть более или менее будет игнорировать их без вашей помощи. В некоторых моих тестах нейронная сеть смогла «игнорировать» даже 10% выбросов. Другими словами, нейронная сеть будет рассматривать выбросы как шум. То, что вам действительно нужно, - это убедиться, что ваш набор для обучения и набор валидации имеют примерно одинаковый процент отбросов.