2010-11-17 4 views
9

в Turing lecture 2010Christopher Bishop говорят о машинном обучении, совершающом революцию, потому что статистика применяются к алгоритмам машинного обучения ...В чем разница между машинным обучением и статистикой?

но его, как все алгоритмы машинного обучения все статистические алгоритмы .. Что реальная разница между этими двумя ? почему они являются отдельными курсами в большинстве университетов?

ответ

9

Между ними нет большой разницы, и то, что есть, в основном является культурным. Обучение машинам происходило из корней компьютерных наук, тогда как статистика была более математической. Есть замечательная запись в блоге под названием "Statistics vs. Machine Learning, fight!" от Brendan O'Connor, которая рассказывает об этом.

Что касается нестатистических подходов к компьютерному обучению, то существует несколько подходов, основанных на правилах (деревья решений, индукция правил, ILP), а также существуют подходы, такие как усиление обучения для проблем управления. Те, у кого нет , чувствуют, что очень статистичны мне, но вы могли утверждать, что они ... вы, вероятно, могли бы потребовать, чтобы вся жизнь попала под статистическую теорию принятия решений, если вы этого хотели (на самом деле, Marcus Hutter).

+0

Деревья принятия решений имеют долгую историю статистики, восходящую по крайней мере к началу 1980-х годов. Они имеют готовую интерпретацию как вероятностные модели: если вы поместили дерево в данные сверху вниз, разделив узлы (эквивалентно, разделив входное пространство), и вы прекратите расщепление, когда у вас есть точки <= * k *, затем запишите частоты классов эти точки вместо класса большинства. Дерево - это кусочно-вероятное распределение по классам. –

+1

Диаграмма Венна на этой веб-странице http://blogs.sas.com/content/subconsciousmusings/2014/08/22/looking-backwards-looking-forwards-sas-data-mining-and-machine-learning/ утверждает, что статистика и ML являются отдельными. Каково ваше мнение в соответствии с этим? – Aliweb

10

Статистика основывает все на вероятностных моделях. Типичный анализ начинается с предположения, что ваши данные являются выборками из случайной переменной с некоторым распределением, а затем делают выводы о параметрах распределения.

Моделирование может использовать вероятностные модели, и когда это произойдет, оно накладывается на статистику. Но машинное обучение не так привязано к вероятности. Он также желает использовать другие подходы к решению проблем, которые не основаны на вероятности.

+0

Думаю, я впервые увидел «Статистика против машинного обучения, бой!». сообщение, которое я связал в своем ответе на вашем блоге :) Это, кстати, отлично. – Stompchicken

+0

Диаграмма Венна на этой веб-странице http://blogs.sas.com/content/subconsciousmusings/2014/08/22/looking-backwards-looking-forwards-sas-data-mining-and-machine-learning/ утверждает, что статистика и ML являются отдельными. Каково ваше мнение в соответствии с этим? – Aliweb

0

Может быть, стоит отметить, что подобный вопрос решается и обсуждается на CrossValidated

+1

Это потрясающий ресурс! Пожалуйста, либо обобщите содержание этого вопроса, либо разместите его как комментарий к вопросу. –

1

я могу увидеть некоторые важные различия:

#Scope: Машинное обучение использует статистические модели, но он также использует другие модели, такие как динамическое программирование, обучение усилению, методы, которые исходили от искусственного интеллекта или оптимизации.

#Point of View: Статистика обычно связана со свойствами оценок (беспристрастность, асимптотическое поведение) и машинное обучение в основном касается решения проблем реального мира.

# Поле поиска: Хотя статистика можно рассматривать как подполе прикладной математики, машинное обучение можно рассматривать как подполе информатики.

разработка и применение # кодовой: В то время как люди, которые работают со статистикой, как правило, имеют prefference для R (или SAS, STATA, Eviews), люди, которые работают с машинным обучением, как правило, выбирают Python (или другой структурированный язык программирования)

0

Статистика фокусируется на всех аспектах анализа данных, таких как описательные, исследовательские, умозрительные, прогностические и причинные. Но машинное обучение ориентировано только на интеллектуальное моделирование.

0

машина Обучение

  • алгоритм, который может извлечь из данных, не полагаясь на программирование на основе правил.

  • Подполе информатики и искусственного интеллекта, которое занимается строительными системами, которые могут учиться на данных, а не явно запрограммированными инструкциями.

Статистическое моделирование является

  • Формализация отношений между переменными в виде математических уравнений.

  • подполя математики, которая занимается поисками взаимосвязи между переменными, чтобы предсказать исход

    системы обучения

машину, это действительно система обучения, если он не запрограммирован для выполнения задачи, но запрограммирована, чтобы узнать для выполнения задачи. Это упражнение, управляемое данными. Современное машинное обучение не зависит от богатого набора алгоритмических методов. Почти все приложения этой формы машинного обучения основаны на глубоких нейронных сетях. Это область, которую мы теперь называем Deep Learning, специализацией машинного обучения и часто применяем в слабых приложениях искусственного интеллекта, где машины выполняют человеческую задачу.

Смежные вопросы