正态分布

正态分布(Normal distribution) 又名高斯分布(Gaussian distribution), 是一个在数学, 物理及工程等领域都非常重要的概率分布, 由于这个分布函数具有很多非常漂亮的性质, 使得其在诸多涉及统计科学离散科学等领域的许多方面都有着重大的影响力.

若随机变量 X 服从一个位置参数为 μ, 尺度参数为 σ 的概率分布, 记为: X~N(μ,σ), 则其概率密度函数为:

f(x)=1σ2πe-(x-μ)22σ2

正态分布的数学期望值或期望值 μ 等于位置参数, 决定了分布的位置; 其方差 σ2 的开平方或标准差 σ 等于尺度参数, 决定了分布的幅度. 正态分布的概率密度函数曲线呈钟形, 因此人们又经常称之为钟形曲线. 我们通常所说的标准正态分布是位置参数 μ = 0, 尺度参数 σ2=1 的正态分布.

分布规则

在实际应用上, 常考虑一组数据具有近似于正态分布的概率分布. 若其假设正确, 则约 68% 数值分布在距离平均值有 1 个标准差之内的范围, 约 95% 数值分布在距离平均值有 2 个标准差之内的范围, 以及约 99.7% 数值分布在距离平均值有3个标准差之内的范围. 称为"68-95-99.7法则".

计算数据在某个区间的概率

查表法

相关函数

import math

# 概率密度函数代码表示
def gaussian_distribution_probability_density(x, sigma=1, mu=0):
    return 1 / (sigma * (2 * math.pi) ** 0.5) * math.e ** (- (x - mu) * 2 / (2 * sigma**2))
import numpy.random

# 生成均值为 0, 标准差为 1, 大小 1024 的一维矩阵数列
data = numpy.random.normal(0, 1, size=1024)
print(data)

# 生成均值为 0, 标准差为 1, 大小 32 * 32 的二维矩阵数列
data = numpy.random.normal(0, 1, size=(32, 32))
print(data)