Chapter 11 假设检验

11.1 假设检验的基本步骤

步骤 内容
建立假设检验,确定检验水准 1. 双侧检验:\(H_{0}:\mu_{d}=0;H_{1}:\mu_{d}\neq 0,\alpha=0.05\)
2. 单侧检验:\(H_{0}:\mu_{d}=0;H_{1}:\mu_{d}<0或\mu_{d}>0,\alpha=0.05\)
1. 假设检验是针对总体的,而非样本;
2. 单双侧检验主要根据专业知识预先确定,并且还需要考虑差异的方向;
3. 单侧检验的检验效能更高。
计算并选择检验统计量 1. 根据研究设计方案、资料类型、样本含量大小及分析目的选用适当的检验方法,并根据样本资料计算相应的检验统计量;
2. 不同的检验方法要用不同的公式计算现有样本的检验统计量(\(t\)检验、\(\chi^2\)检验、\(F\)检验);
3. 检验统计量是在\(H_{0}\)成立的前提下计算的。
确定P值,做出推断 假设检验的统计学结论:
1. 若\(P\le \alpha\),按所取\(\alpha\)检验水准,拒绝\(H_{0}\),接受\(H_{1}\),可以认为…有差异;
2. 若\(P>\alpha\)时,现有样本信息还不足以拒绝H0,尚不能认为…有差异
假设检验所做出的的结论是具有概率性质的,不是绝对的肯定或否定。不论拒绝或不拒绝\(H_{0}\)都可能发生错误。下结论时,只能两种:
1. 两总体有无差异;
2. 两样本差异有无统计学意义。

11.2 假设检验的两型错误、检验效能

客观实际 拒绝\(H_{0}\),接受\(H_{1}\) 不拒绝\(H_{0}\)
\(H_{0}\)成立 \(\textrm{I}\)型错误(\(\alpha\))(假阳性)
错误拒绝实际成立的\(H_{0}\)
正确推断(\(1-\alpha\))
\(H_{0}\)不成立 正确推断(\(1-\beta\))
\(H_{1}\)为真,能够拒绝\(H_{0}\)的概率称为发现该\(H_{1}\)的检验效能,用\(1-\beta\)表示
\(\textrm{II}\)型错误(\(\beta\))(假阴性)
不拒绝实际不成立的\(H_{0}\)

11.2.1 \(1-\beta\)的影响因素:

  1. 检验水准\(\alpha\)(正向)——检验水准\(\alpha\)越大,检验效能越大
  2. \(H_{0}\)\(H_{1}\)的差异大小(正向)——差异越大,检验效能越大
  3. 样本量(正向)——样本量越大,检验效能越大
  4. 标准差越大(反向)——个体差异(标准差)越小,检验效能越大
  5. 单双侧检验:单侧检验效能高于双侧检验效能

11.2.2 \(\alpha 、\beta 、1-\beta\)关系:

  1. 当样本量确定时,\(\alpha\)\(\beta\)呈反向变化关系,与\(1-\beta\)呈正向变化关系。如果把\(\alpha\)设置得很小,势必增加犯\(\textrm{II}\)型错误的概率,从而降低检验效能;反之,如果把重点放在减少\(\beta\)上,势必增加犯\(\textrm{I}\)型错误的概率,从而降低了置信度。
  2. 要同时减小\(\alpha\)\(\beta\),只有通过增加样本含量来计算。

11.3 假设检验与置信区间的关系

基本思想 假设检验 置信区间
基本思想 假设检验的假设是指我们对总体特征(如参数、分布)的某种推测,从而用概率来判断样本数据所提供的的信息和我们对总体特征猜想的一致性,进而结合专业知识判断这一猜想的正确性 置信区间是指有样本统计量所构造的总体参数的估计区间,区间估计是按照一定的概率和可信度\((1-\alpha)\)用一个区间估计总体参数所在的范围,这个范围称作可信度为\((1-\alpha)\)的可信区间
区别 1. 假设检验用于推断总体参数之间是否不同 1. 置信区间用于推断总体参数所在范围;
2.置信区间比假设检验提供更多的信息,置信区间能够回答假设检验的问题;
3. 置信区间在回答差别有无统计学意义时,还可以提示差别是否具有实际意义。
联系 1. 假设检验与置信区间都属于统计推断方法;
2. 置信区间估计总体参数所采用的的统计量与假设检验的检验统计量相同;
3.置信区间能够回答假设检验的问题。根据置信度\(1-\alpha\)构造置信区间,如果统计量在置信区间内,那么不拒绝原假设;如果不在置信区间中,那么拒绝原假设;
4. 双侧检验时,置信区间确定的\(z'\)与检验水准\(\alpha\)确定的检验统计量的分布界值相同,因此,在双侧检验时\(C=1-\alpha\)。根据显著水平\(\alpha\),可以构造置信度为\(1-\alpha\)的置信区间