从扔硬币（伯努利）开始，扔多了变二项，无限扔变正态，标准化变Z，样本小了变t，平方了变卡方，相除了变F。

统计分布7个.JPG

我刚初学概率分布时，都会觉得概念零散、难记、难理解，仿佛彼此毫无关联。实际上，伯努利分布、二项分布、正态分布、标准正态分布、t分布、卡方分布、F分布是一条完整的逻辑链。只要顺着这条脉络学习，就能轻松打通统计基础。

一、一切的起点：伯努利分布

所有分布的源头，都来自最简单的随机试验——抛硬币。

一次试验只有两种结果：成功/失败、正面/反面。
这种试验叫作伯努利试验。
对应结果的概率分布，就是伯努利分布。

它是所有离散分布的基础，结构最简单、最直观。

二、多次重复：二项分布

把伯努利试验同时进行多次，就得到了二项分布。

例如：一次抛5枚、10枚、50枚硬币。
观察“成功次数”（如正面次数）的概率规律。
特征：中间概率最高，向两侧逐渐降低。

简单说：
伯努利分布 × 多次重复 = 二项分布

当你抛的次数（n）越来越多，这个分布的图形就会越来越像一座钟。

三、数量变大：收敛为正态分布

当二项分布的试验次数 n 越来越大时，分布会越来越密集、平滑，最终形成左右对称的钟形曲线。
这就是最重要的正态分布。

近似条件：
np ≥ 5 且 n(1−p) ≥ 5

特点：

由均值μ和方差σ²唯一确定。
自然界、社会、金融数据中最常见的分布。

四、统一标准：标准正态分布（Z分布）

不同正态分布的均值、标准差各不相同，难以直接比较。因此我们对它做标准化处理：

Z = (X − μ) / σ

处理后：

均值 μ = 0
标准差 σ = 1

这样得到的分布叫作标准正态分布（Z分布），是所有正态分布的“统一标尺”。

五、现实修正：t分布

标准正态分布有一个强前提：总体方差已知。
但在真实研究中，总体方差几乎永远未知，只能用样本方差代替。

由于样本量小、不确定性更高，曲线会变成：

中间更矮
两侧尾部更厚
整体更“矮胖”

这就是t分布。
特点：

样本量越大，越接近标准正态分布。
n ≥ 30 时，几乎与Z分布一致。

适用场景：总体方差未知、小样本。

样本量（n）越小，曲线越矮胖；当样本量够大（ $n \ge 30$ ）时，t分布就和Z分布长得一模一样了。

总体方差未知 + 小样本 ⇒ 用t分布。

六、平方构造：卡方分布（χ² 分布）

从标准正态分布出发，将随机变量 Z 平方，得到的分布就是卡方分布。

特点：

只在0右侧取值，呈偏态。
由自由度决定形状：自由度越大，越趋近对称。
多用于方差检验、拟合优度检验。

多个独立Z的平方和，也服从卡方分布。

如果你把5个独立的Z平方后加起来，就是自由度为5的卡方分布。

七、分布之比：F分布

取两个相互独立的卡方分布，分别除以各自自由度后再相除，得到的变量服从F分布。

特点：

同样只在0右侧，呈偏态。
由分子自由度、分母自由度共同决定。
多用于方差分析、回归显著性检验。

主要用于比较两个总体的方差是否相等（比如方差分析）。

总结

单次二元试验 → 伯努利分布
多次伯努利试验 → 二项分布
二项分布 n 增大 → 正态分布
正态分布标准化 → 标准正态分布（Z分布）
方差未知、小样本 → t分布
Z 平方 → 卡方分布
两个卡方分布之比 → F分布

一开始是从伯努利分布起步的，把它重复多次试验，就变成了二项分布；当二项分布里的 n 变大时，就会收敛成正态分布；接着我们在正态分布里定个标准，这就引出了标准正态分布。

因为标准正态分布在现实中用起来比较困难（通常不知道总体方差），所以我们用 t分布 来代替它。然后，把标准正态分布的变量平方一下，就造出了卡方分布；如果把两个卡方分布混合/组合在一起，就变成了 F分布。

统计分布7个2.JPG

如果你稍微深入一点学习统计学，或者去学数理统计的话，你会发现 t分布、卡方分布和 F分布之间，在数学上其实有着非常精密的连接，这些你以后也能学到。

但是，这一部分的数学证明过程实在是太让人头秃了。所以，除非你是那种“觉得统计学太有趣了、想彻底沉迷其中”的铁粉，否则只要像现在这样了解个大概逻辑就足够了。

一张图看懂“七大分布”的家谱：

进化阶段	分布名称	核心逻辑	备注
祖宗	伯努利分布	抛一次硬币，非黑即白	一切的起源
繁衍	二项分布	抛N次硬币，统计次数	伯努利重复多次
大成	正态分布	N超级大时，变成钟形曲线	二项分布的极限
标准	Z分布	正态分布减去均值、除以标准差	统一标准，μ = 0, σ = 1
替补	t分布	总体方差未知，用样本代替	小样本时的Z分布（矮胖版）
衍生	卡方分布	标准正态分布变量 Z 的平方	用于检验方差
对决	F分布	两个卡方分布相除	用于比较方差

只要记住这条主线，就不会再混淆任何概率分布。后面将这些分布里面重要的内容再详细解析。