应用统计基础

0 概率论基础

期望和方差,协方差,相关系数

对于连续的情形,设的概率密度函数为,则

已知随机变量的联合概率密度函数为,则

相关系数

已知随机变量, 则

1.1 统计量

设总体的分布律为是来自的一个样本,是相应的样本值,是样本值的函数,不含未知参数,即的已知函数,称为统计量。

样本均值

样本方差

修正样本方差

样本标准差

样本阶矩

定理1.2

是取自总体的一个样本,, , 则



定理1.9

是取自正态总体的一个样本, 则

推导公式

两个正态总体

是来自的样本,是来自的样本,且两个样本相互独立,则

为如下定义

1.4 常用分布

二项分布

多次重复独立的伯努利试验,每次试验成功的概率为,失败的概率为,则这次试验中成功的次数服从二项分布

几何分布

多次重复独立的伯努利试验,每次试验成功的概率为,失败的概率为,则第次试验才成功的概率为

超几何分布

从有个元素的总体中抽取个元素,其中有个元素是成功的,个元素是失败的,抽取后不放回,抽取到的个元素中成功的个数服从超几何分布

泊松分布

单位时间(或单位面积)内随机事件的平均发生率为,则单位时间(或单位面积)内随机事件发生的次数服从泊松分布

,且相互独立,则

均匀分布(连续型)

概率密度函数

概率分布函数

次序统计量, , 则,

指数分布

用来建模平均发生率恒定、连续、独立的事件发生的间隔, 例如泊松过程。

概率密度函数

概率分布函数

正态分布

概率密度函数

name notation PDF E Var
二项分布
几何分布
泊松分布
均匀分布
指数分布
正态分布
卡方分布
分布 ,
分布 , ,

常用分布的点估计及最大似然估计

分布 符号 参数 点估计 极大似然估计
均匀分布
均匀分布
0-1分布
二项分布
泊松分布
指数分布
正态分布
正态分布 已知
正态分布 未知

有效性

已知,未知,待估函数的罗克拉美下界为为有效估计

未知,已知,待估函数的罗克拉美下界为为有效估计, 为渐进有效估计

1.5 正态总体下的抽样分布

是来自正态总体的一个样本,则相互独立。

置信区间

双侧置信区间, ,则取

一个正态总体下未知参数的的置信区间

未知参数 随机变量 的分布 双侧置信区间上下限 单侧置信区间下限 单侧置信区间上限
已知,求
未知,求
已知,求
未知,求

两个正态总体下未知参数的的置信区间

取自正态总体的样本,取自正态总体的样本,且两个样本相互独立

$$
S_w = \frac{m-1}{m+n-2} \cdot {S_1^}^2+\frac{n-1}{m+n-2} \cdot {S_2^}^2
$$

随机变量

未知参数 随机变量 的分布 双侧置信区间上下限 单侧置信区间下限 单侧置信区间上限
已知,求
均未知, 求
已知, 求

大样本方法

是取自总体的一个样本,, 求未知参数置信区间,可令, 可证明当足够大时,,此时可用正态分布的分位数来确定置信区间。

时, , 当足够大时,

1.6假设检验

常用结论

  1. ,则

单正态总体下的假设检验

原假设 备择假设 已知条件 检验统计量 拒绝域
已知
未知
已知 or
未知 or

双正态总体下的假设检验

是来自的样本,是来自的样本,且两个样本相互独立,则

原假设 备择假设 已知条件 检验统计量(为True) 拒绝域
已知
未知
已知

1.7 拟合优度检验

则当为真时,, 当时,拒绝

1.8 列联表独立性检验

则当为真时,, 当时,拒绝

1.8 秩和检验

设总体的分布函数连续,是来自总体的一个样本,则秩统计量服从离散均匀分布

对于两个独立样本,将两个样本合并,得到,秩和统计量为,取检验统计量

拒绝域可以由确定。 并且,

单侧检验时,

1.9 回归分析

,

最小二乘估计

使得最小的的最小二乘估计

, ,

, 的最小值为

对于残差,两种估计

最小二乘估计的性质

(2)

(3)

分别是的最小方差无偏估计,的无偏估计

回归系数的显著性检验

检验

拒绝域为

检验

拒绝域为

预测和控制


应用统计基础
https://wenzhaoabc.github.io/math/statistics/
作者
wenzhaoabc
发布于
2025年1月3日
许可协议