я могу увидеть некоторые важные различия:
#Scope: Машинное обучение использует статистические модели, но он также использует другие модели, такие как динамическое программирование, обучение усилению, методы, которые исходили от искусственного интеллекта или оптимизации.
#Point of View: Статистика обычно связана со свойствами оценок (беспристрастность, асимптотическое поведение) и машинное обучение в основном касается решения проблем реального мира.
# Поле поиска: Хотя статистика можно рассматривать как подполе прикладной математики, машинное обучение можно рассматривать как подполе информатики.
разработка и применение # кодовой: В то время как люди, которые работают со статистикой, как правило, имеют prefference для R (или SAS, STATA, Eviews), люди, которые работают с машинным обучением, как правило, выбирают Python (или другой структурированный язык программирования)
Деревья принятия решений имеют долгую историю статистики, восходящую по крайней мере к началу 1980-х годов. Они имеют готовую интерпретацию как вероятностные модели: если вы поместили дерево в данные сверху вниз, разделив узлы (эквивалентно, разделив входное пространство), и вы прекратите расщепление, когда у вас есть точки <= * k *, затем запишите частоты классов эти точки вместо класса большинства. Дерево - это кусочно-вероятное распределение по классам. –
Диаграмма Венна на этой веб-странице http://blogs.sas.com/content/subconsciousmusings/2014/08/22/looking-backwards-looking-forwards-sas-data-mining-and-machine-learning/ утверждает, что статистика и ML являются отдельными. Каково ваше мнение в соответствии с этим? – Aliweb