在新选项卡中打开链接
  1. Copilot 答案
    正态分布,物理学中通称高斯分布,是一个非常常见的连续概率分布。正态分布在统计学上十分重要,经常用在自然和社会科学来代表一个不明的随机变量。 若随机变量X服从一个平均数为μ、标准差为σ的正态分布,则记为: X∼N(μ,σ²), 则其概率密度函数为 f(x)=1/σ√(2π) e⁻⁽⁽ˣ⁻μ⁾²⁾/²σ² 正态分布的数学期望值或期望μ,可解释为位置参数,决定了分布的位置;其方差σ²的平方根或标准差σ可解释尺度参数,决定了分布的幅度。 中心极限定理指出,在特定条件下,一个具有有限均值和方差的随机变量的多个样本的平均值本身就是一个随机变量,其分布随着样本数量的增加而收敛于正态分布。因此,许多与独立过程总和有关的物理量,例如测量误差,通常可被近似为正态分布。 正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线(类似于寺庙里的大钟,因此得名)。我们通常所说的标准正态分布是位置参数μ=0,尺度参数σ²=1的正态分布(见右图中红色曲线)。 正态分布是自然科学与行为科学中的定量现象的一个方便模型。各种各样的心理学测试分数和物理现象比如光子计数都被发现近似地服从正态分布。尽管这些现象的根本原因经常是未知的,理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布。正态分布出现在许多区域统计:例如,采样分布均值是近似地正态的,即使被采样的样本的原始群体分布并不服从正态分布。另外,正态分布信息熵在所有的已知均值及方差的分布中最大,这使得它作为一种均值以及方差已知的分布的自然选择。正态分布是在统计以及许多统计测试中最广泛应用的一类分布。在概率论,正态分布是几种连续以及离散分布的极限分布。 正态分布最早是棣莫弗在1718年著作的书籍的,及1734年发表的一篇关于二项分布文章中提出的,当二项随机变量的位置参数n很大及形状参数p为1/2时,则所推导出二项分布的近似分布函数就是正态分布。拉普拉斯在1812年发表的《分析概率论》中对棣莫佛的结论作了扩展到二项分布的位置参数为n及形状参数为1>p>0时。现在这一结论通常被称为棣莫佛-拉普拉斯定理。 拉普拉斯在误差分析试验中使用了正态分布。勒让德于1805年引入最小二乘法这一重要方法;而高斯则宣称他早在1794年就使用了该方法,并通过假设误差服从正态分布给出了严格的证明。 将正态分布称作“钟形曲线”的习惯可以追溯到Jouffret他在1872年首次提出这个术语用来指代二元正态分布。正态分布这个名字还被查尔斯·皮尔士、法兰西斯·高尔顿、威尔赫姆·莱克希斯在1875分别独立地使用。这个术语是不幸的,因为它反映和鼓励了一种谬误,即很多概率分布都是正态的。 这个分布被称为“正态”或者“高斯”正好是史蒂格勒名字由来法则的一个例子,这个法则说“没有科学发现是以它最初的发现者命名的”。 有几种不同的方法用来说明一个随机变量。最直观的方法是概率密度函数,这种方法能够表示随机变量每个取值有多大的可能性。累积分布函数是一种概率上更加清楚的方法,请看下边的例子。还有一些其他的等价方法,例如cumulant、特征函数、矩生成函数以及cumulant-生成函数。这些方法中有一些对于理论工作非常有用,但是不够直观。请参考关于概率分布的讨论。 正态分布的概率密度函数均值为μ 方差为σ² (或标准差σ)是高斯函数的一个实例: f(x;μ,σ)=1/σ√(2π) exp(-((x-μ)²)/2σ²)。 (请看指数函数以及π.) 如果一个随机变量X服从这个分布,我们写作 X ~ N(μ,σ²). 如果μ=0并且σ=1,这个分布被称为标准正态分布,这个分布能够简化为 f(x)=1/√(2π) exp(-x²/2)。 右边是给出了不同参数的正态分布的函数图。 正态分布中一些值得注意的量: 密度函数关于平均值对称 平均值与它的众数(statistical mode)以及中位数(median)同一数值。 函数曲线下68.268949%的面积在平均数左右的一个标准差范围内。 95.449974%的面积在平均数左右两个标准差2σ的范围内。 99.730020%的面积在平均数左右三个标准差3σ的范围内。 99.993666%的面积在平均数左右四个标准差4σ的范围内。 函数曲线的拐点(inflection point)为离平均数一个标准差距离的位置。 累积分布函数是指随机变量X小于或等于x的概率,用概率密度函数表示为 F(x;μ,σ)=1/σ√(2π)∫₋∞ˣexp(-((t-μ)²)/2σ² ) dt.
    偏度0
    峰度0
  1. 某些结果已被删除