全心思齐网

如何确定一组数据是否属于正态分布?

方法主要是两种:

第一,概率密度估计。用模式识别里常用的概率密度函数估计方法,估计出该组数据的概率密度函数p(x)。然后用这组数据的均值和方差作为参数,得出一个gauss(正态)概率密度函数f(x)。用绝对值偏差、方均根或其他标准比较f(x)和p(x),如果充分接近,则说明该组数据符合正态分布。(甚至可以利用假设检验的概念指定置信度水平等)。

第二,累积量。三阶和四阶累积量有其明确的意义,即所谓“偏度”和“峰度”。前者表明概率密度函数的对称性,如果值接近0则表示对称性好;后者表明概率密度函数(假定是单峰的)的尖锐程度,如果值接近0则表示接近正态分布(正态分布的所有二阶以上累积量值为0)。

匿名回答于2024-05-22 01:13:35


相关知识问答