2016-10-04 5 views
0

Я хочу проанализировать некоторые данные, чтобы запрограммировать алгоритм ценообразования. следующие даты доступны:Математическая функция с тремя переменными (корреляция)

enter image description here

Мне нужна функция/correlationfactor от трех переменных/измерения, которые показывают изменение Median (цены), а трех измерениях (pers_capacity, количество спален, количество ванные комнаты). , например. Y (# pers_capacity, спальня, ванная комната) = ..

примечание: - на скриншоте ниже, не все имеющиеся данные (только часть его) - медиана => цена за ночь - желтый => #bathroom

например Для 2 человек, 2 спальни и 1 ванная комната - средняя цена 187 $ в сутки

Есть ли у вас идеи, как я могу рассчитать корреляцию/уравнение (f (..) = ...), чтобы получить надежный фактор?

Сердечные приветы

+0

Ну большой стол обзора, очевидно ... Но предсказать неизвестные значения будет сложно. Глядя на ваш пример, я не думаю, что стандартное приближение принесет пользу. Возможно, вы захотите переместить свой вопрос здесь: http://stats.stackexchange.com/ – wonce

+0

Я голосую, чтобы закрыть этот вопрос как не по теме, потому что речь идет не о программировании. –

ответ

3

Один типичный подход был бы сформулировать это как линейной модели. Даны три переменные х, у и г которые объясняют свои наблюдаемые значения v, вы предполагающие vтопор + по + CZ + д и попытаться найти в, b, c и d которые соответствуют этому как можно ближе, минимизируя квадрат ошибки. Это называется linear least squares approximation. Вы также можете обратиться к this Math SE post за один пример конкретного приближения линейных наименьших квадратов.

Если ваш набор данных достаточно велик, вы можете рассмотреть более сложные формулы.Такие вещи, как

противх + у + г + ху + XZ + уг + х + 444471842 +1865161557762439488888у + г +

выше является нелинейным по переменным, но все же линейные по коэффициентам вя так что это все еще проблема линейных наименьших квадратов. Или вы можете применить преобразования к своим переменным, например.

vх + у + г + ехр (х) + ехр (у) + ехр (г) +

Глядя на остаточных ошибок (т.е. разница между прогнозируемыми и наблюдаемыми значениями) в любом из них может указывать на условия, которые следует добавить.

Лично я бы попробовал все это в R, так как вычисление линейных моделей - это просто one line на этом языке, и визуализация данных довольно проста.

Смежные вопросы