本文被阅读次了

2017-02-07  星期二 / 正态分布,数据 /

正态分布

    图文介绍

    概要

    常态分布是自然科学与行为科学中的定量现象的一个方便模型。各种各样的心理学测试分数和物理现象比如光子计数都被发现近似地服从常态分布。尽管这些现象的根本原因经常是未知的,理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从常态分布(在RNBracewell的Fourier transform and its application中可以找到一种简单的证明)。常态分布出现在许多区域统计:例如,采样分布均值是近似地常态的,即使被采样的样本的原始群体分布并不服从常态分布。另外,常态分布信息熵在所有的已知均值及方差的分布中最大,这使得它作为一种均值以及方差已知的分布的自然选择。常态分布是在统计以及许多统计测试中最广泛应用的一类分布。在概率论,常态分布是几种连续以及离散分布的极限分布。

    历史

    常态分布最早是棣莫弗在1718年著作的书籍的(Doctrine of Change),及1734年发表的一篇关于二项分布文章中提出的,当二项随机变数的位置参数n很大及形状参数p为1/2时,则所推导出二项分布的近似分布函数就是常态分布。拉普拉斯在1812年发表的《分析概率论》(Theorie Analytique des Probabilites)中对棣莫佛的结论作了扩展到二项分布的位置参数为n及形状参数为1>p>0时。现在这一结论通常被称为棣莫佛-拉普拉斯定理。

    拉普拉斯在误差分析试验中使用了常态分布。勒让德于1805年引入最小二乘法这一重要方法;而高斯则宣称他早在1794年就使用了该方法,并通过假设误差服从常态分布给出了严格的证明。

    「钟形曲线」这个名字可以追溯到Jouffret他在1872年首次提出这个术语「钟形曲面」,用来指代二元常态分布(bivariate normal)。正态分布这个名字还被Charles S. Peirce、Francis Galton、Wilhelm Lexis在1875分别独立地使用。这个术语是不幸的,因为它反映和鼓励了一种谬误,即很多概率分布都是常态的。(请参考下面的「实例」)

    这个分布被称为「常态」或者「高斯」正好是Stigler名字由来法则的一个例子,这个法则说「没有科学发现是以它最初的发现者命名的」。

    正态分布的定义

    有几种不同的方法用来说明一个随机变量。最直观的方法是概率密度函数,这种方法能够表示随机变量每个取值有多大的可能性。累积分布函数是一种概率上更加清楚的方法,请看下边的例子。还有一些其他的等价方法,例如cumulant、特征函数、动差生成函数以及cumulant-生成函数。这些方法中有一些对于理论工作非常有用,但是不够直观。请参考关于概率分布的讨论。

    租赁视界新闻中心本站整理
    免责声明:本站所提供的内容部分来源于网络,版权归属原作者。 转载文章出于传递更多知识之目的,对这些信息的准确性和完整性不作任何保证, 并不意味着赞同其观点或证实其描述。

    正态分布

    正态分布的概念正态分布的图形意义...