利用 PyPI fitter包识别数据样本的分布

fitter包提供了一个简单的类来标识从中生成数据样本的分布。 它使用Scipy的80个分布,并允许您绘制结果以检查最可能的分布和最佳参数。安装方法:

pip install fitter

用法,首先,让我们根据伽玛分布(gamma distribution)创建N = 10,000点的数据样本:

from scipy import stats
data = stats.gamma.rvs(2, loc=1.5, scale=2, size=10000)

需要注意,拟合速度缓慢,所以请将 size 值保持在合理范围。

现在,在不了解分布或其参数的情况下,最适合数据的分布是什么? Scipy有80个分布,Fitter类将扫描所有分布,为您调用fit函数,而忽略那些失败或永久运行的分布,最后从平方误差之和的意义上为您提供最佳分布的摘要。 举一个例子:

from fitter import Fitter
f = Fitter(data)
f.fit()
# 可能需要一些时间,因为默认情况下会尝试所有分布
# 但你可以手动调用提供了一个更小的分布集合
f.summary()

官方地址: https://pypi.org/project/fitter/

发表评论

电子邮件地址不会被公开。 必填项已用*标注

2 × 3 =