2017-02-11 1 views
0

Я считаю, что алгоритм обучения персептрона имеет верхнюю границу числа итераций, необходимых для сходимости для линейных разделимых данных. Я искал, чтобы найти точную формулу, которая поможет мне узнать количество итераций, которые это займет, но этого не было в Википедии.Как вычислить максимальное количество итераций, взятых алгоритмом обучения персептрона?

Я читал онлайн, что этот объект зависит от количества выборок данных, поэтому, если у меня есть n (скажем 5000) выборок, сколько итераций потребуется для персептрона, чтобы сходиться (предположим, что данные линейно отделимы). Или это не так просто и зависит от самих данных?

P.S. Очень новое для машинного обучения, следовательно, простой вопрос.

ответ

0

Wikipedia относится к доказательству Novikoff, A. B. (1962), один из ранних результатов в области статистического обучения.

Вот некоторые немного другая форма дали результат для интернет-среды обучения:

Когда ||x_i|| ≤ D for all i (интуиция: радиус подготовки экземпляров) и margin >= γ:

  • итераций, необходимых ограничены сверху : (D/γ)^2.

Интересные последствия:

  • конвергенции результат не зависит от количества образцов!
  • результат конвергенции, независимый от входного измерения!
+0

x_i, вероятно, это набор данных, но что такое D? а также что такое y (это класс или вывод, к которым наши наборы данных должны быть отнесены, например, +/- 1)? А также, если это не зависит от количества выборок и размерности ввода, то от чего это зависит? – posixKing

+0

Все объяснено. D - некоторая априорная известная константа, определяемая нормой на выборках (это метрика, описывающая образцы). y также является константой, но она неизвестна априори, поскольку нам нужно ее изучить. y не является целью, это конечная граница решения. Таким образом, он зависит от статистики ввода (ограничение по значению D) и поля окончательного классификатора. – sascha

+0

Огонь мое невежество, но что означает априори? У меня мало математического фона. Возможно ли, чтобы вы связали меня с примером сайта, который показывает набор данных, и вычисляет количество итераций, необходимых для PLA. Благодарю. – posixKing

Смежные вопросы