应用统计基础
0 概率论基础
期望和方差,协方差,相关系数
对于连续的情形,设
已知随机变量
相关系数
已知随机变量
1.1 统计量
设总体
样本均值
样本方差
修正样本方差
样本标准差
样本
定理1.2
设
定理1.9
设
推导公式
两个正态总体
设
令
则
1.4 常用分布
二项分布
多次重复独立的伯努利试验,每次试验成功的概率为
几何分布
多次重复独立的伯努利试验,每次试验成功的概率为
超几何分布
从有
泊松分布
单位时间(或单位面积)内随机事件的平均发生率为
若
均匀分布(连续型)
概率密度函数
概率分布函数
次序统计量,
指数分布
用来建模平均发生率恒定、连续、独立的事件发生的间隔, 例如泊松过程。
概率密度函数
概率分布函数
正态分布
概率密度函数
| name | notation | E | Var | |
|---|---|---|---|---|
| 二项分布 | ||||
| 几何分布 | ||||
| 泊松分布 | ||||
| 均匀分布 | ||||
| 指数分布 | ||||
| 正态分布 | ||||
| 卡方分布 | ||||
常用分布的点估计及最大似然估计
| 分布 | 符号 | 参数 | 点估计 | 极大似然估计 |
|---|---|---|---|---|
| 均匀分布 | ||||
| 均匀分布 | ||||
| 0-1分布 | ||||
| 二项分布 | ||||
| 泊松分布 | ||||
| 指数分布 | ||||
| 正态分布 | ||||
| 正态分布 | ||||
| 正态分布 |
有效性
1.5 正态总体下的抽样分布
置信区间
双侧
一个正态总体下未知参数的
| 未知参数 | 随机变量 |
双侧置信区间上下限 | 单侧置信区间下限 | 单侧置信区间上限 | |
|---|---|---|---|---|---|
两个正态总体下未知参数的
记
$$
S_w = \frac{m-1}{m+n-2} \cdot {S_1^}^2+\frac{n-1}{m+n-2} \cdot {S_2^}^2
$$
随机变量
| 未知参数 | 随机变量 |
双侧置信区间上下限 | 单侧置信区间下限 | 单侧置信区间上限 | |
|---|---|---|---|---|---|
大样本方法
设
当
1.6假设检验
常用结论
- 若
,则
单正态总体下的假设检验
| 原假设 |
备择假设 |
已知条件 | 检验统计量 | 拒绝域 |
|---|---|---|---|---|
双正态总体下的假设检验
设
| 原假设 |
备择假设 |
已知条件 | 检验统计量( |
拒绝域 |
|---|---|---|---|---|
1.7 拟合优度检验
令
则当
1.8 列联表独立性检验
令
则当
1.8 秩和检验
设总体
对于两个独立样本
拒绝域可以由
单侧检验时,
1.9 回归分析
最小二乘估计
使得
记
则
对于残差
最小二乘估计的性质
(2)
(3)
回归系数的显著性检验
拒绝域为
拒绝域为
预测和控制