У меня есть 2 массива данных, которые описывают данные, которые я хочу построить, а второй описывает частоту или вес этих данных.Статистика гистограммы, созданной из взвешенных данных - numpy
создать гистограмму с помощью
import numpy as np
import matplotlib.pyplot as plt
data = [7., 8.2, 9.6, 11.3, 13.2, 15.5, 18.1, 21.2, 24.9, 29.1, 34.1, 40.0]
freq = [2., 4.1, 4.5, 3.2, 2.7, 2.1, 1.3, 1., 0.9, 0., 0., 0.]
h = np.histogram(data, weights = freq, bins = data)
f = plt.hist(data, weights = freq, bins = data)
Теперь я хочу, чтобы найти среднее значение, стандартное отклонение, асимметрию и эксцесс полученной гистограммы, а потому, что данные «взвешенные» или предварительно подсчитано, я не могу похоже, что функция scipy.stats.describe работает. Есть идеи?
Я должен прояснить ситуацию, я попробовал scipy.stats.describe, но, похоже, не нашел аргумент веса, который позволяет мне делать то, что я хочу. Я действительно не знаю, какие инструменты доступны для этого, и поисковые запросы Google не возвращают много полезных результатов (хотя я признаю, что могу найти неправильную вещь).
Чтобы сделать ситуацию более сложной, орел с вами заметил, что данные распределяются равномерно в пространстве журнала, а не в реальном пространстве. Поэтому, если ваш метод включает гауссовский фитинг, вы можете это иметь в виду ...
«Так что, если ваш метод включает гауссовский фитинг, вы можете иметь это в виду ...» ... Мы оцениваем? – Chuck
Я просто указывал, что если кто-то захочет вернуться с помощью метода подгонки к данным, данные будут разнесены в пространстве журналов, что повлияет на подгонку. Не нужно зарываться. –
Обычно ожидается, что Участник предоставит какую-то форму того, что они пробовали, прежде чем просить о взносах ... Я принимаю ваше решение, хотя, будучи snarky, никому не помогал! – Chuck