主题:假设检验

+ 关注 ≡ 收起全部文章
336*280_ads

第五节率的假设检验——正态近似法

第五节 率的假设检验——正态近似法

  一、样本率与总体率的比较

  观察样本数较大时,样本率的频数分布近似正态分布,可应用正态分布的规律性检验率的差异显著性。其公式为:

   公式(20.7)

  式中p为样本率,π为总体率,σp为根据总体率计算的标准误。由于u服从正态分布,故可用表20-10作判断。

表20-10 |u|值、P值与统计结论

|u|值 P值 统计结论
<1.96 >0.05 不拒绝H0,差异无统计学意义
≥1.96 ≤0.05 拒绝H0,接受H1,差异有统计学意义
≥2.58 ≤0.01 拒绝H0,接受H1,差异有高度统计学意义

  例20.6根据以往经验,一般溃疡病患者中有20%发生胃出血症状。某医生观察65岁以上溃疡病人152例,其中48例发生胃出血症状,问老年患者出血情况与一般患者有无不同?

  按惯例大量观察所得的率可当作总体率看待,则本例总体率π为0.2(20%),1-π=0.8,n=152

  标准误差

  样本率 p=48/152×100%=31.6%=0.316

  检验步骤:

  1.建立检验假设:

  H0:π=π00.2

  H1:π≠π0

  α=0.05

  2.计算u值(按公式20.7)

  u<2.58,P<0.01,差异有高度统计学意义

  按 α=0.05水准拒绝H0,故可以认为老年溃疡病患者较易于发生胃出血,与一般患者有所不同。

  二、两个样本率差异的意义检验

  公式(20.8)

  公式(20.9)

  公式(20.10)

  以上公式中:P1,P2为两个样本率

  pc为合并样本率

  X1和X2分别为两样本阳性例数

  如果两个样本都相当大,则sp1-p2改用下式计算

  公式(20.11)

  现仍以上述计算率的标准误的例题,进一步检验两个样本率差异有无意义。

  基本资料:n1=3315,p1=1.78%=0.0178,1-p1=0.9822

  n2=3215,p2=5.60%=0.056,1-p2=0.944

  检验步骤:

  1.建立检验假设:

  H0:π12

  H11≠π2

  α=0.05

  2.计算u值:因两个都是大样本,故采用公式(20.11)以求sp1-p2

   3.确定P值和分析:本题u=8.234>2.58,P<0.01,差异有高度统计学意义,按α=0.05水准拒绝H0,可以认为水中碘浓度高的居民甲状腺患病率高于水中碘浓度低的居民。

日期:2006年1月13日 - 来自[预防医学]栏目
循环ads

第五节假设检验中的两类错误及注意事项

第五节 假设检验中的两类错误及注意事项

  一、第一类错误与第二类错误

  假设检验时,根据检验结果作出的判断,即拒绝H0或不拒绝H0,并不是百分之百的正确,可能发生两种错误。下面以样本均数与总体均数比较的t检验为例说明。①拒绝了实际上成立的H0,即样本原本来自μ=μ0的总体,由于抽样的偶然性得到了较大的t值,因t≥t0.05(v)按α=0.05检验水准拒绝了H0,而接受了H1(μ≠μ0),这类错误为第一类错误(或I型错误,type I error),如图19-3B。理论上犯第一类错误的概率为α,若α=0.05,那末,犯第一类错误的概率为0.05.②不拒绝实际上不成立的H0,即样本原本来自μ≠μ0的总体,H0:μ=μ0实际上是不成立的,但由于抽样的偶然性,得到了较小的t值,因t<t0.05(v),按α=0.05检验水准不拒绝H0,这类错误称为第二类错误(或Ⅱ型错误,type Ⅱ error),如图19-3C。犯第二类错误的概率为β,β值的大小很难确切地估计,但知道在样本含量不变的前提下,α越小,β越大;反之,α越大,β越小。同时减少α和β的唯一方法是增加样本含量,因为增加了样本的含量后,均数的抽样误差小,样本均数的代表性强,也就是样本均数较接近总体均数,因而可使犯第一类错误和第二类错误的概率减少。

图19-3 Ⅰ型错误与Ⅱ型错误的关系

  二、假设检验时应注意的事项

  (一)要有严密的抽样研究设计;样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性。

  (二)根据现有的资料的性质、设计类型、样本含量大小正确选用检验方法。

  (三)对差别有无统计学意义的判断不能绝对化,因检验水准只是人为规定的界限,是相对的。差别有统计学意义时,是指无效假设H0被接受的可能性只有5%或不到5%,甚至不到1%,根据小概率事件一次不可能拒H0,但尚不能排除有5%或1%出现的可能,所以可能产生第一类错误;同样,若不拒绝H0,可能产生第二类错误。

  (四)统计学上差别显著与否,与实际意义是有区别的。如应用某药治疗高血压,平均降低舒张压0.5kPa,并得出差别有高度统计学意义的结论。从统计学角度,说明该药有降压作用,但实际上,降低0.5kPa是无临床意义。因此要结合专业作出恰如其分的结论。

日期:2006年1月13日 - 来自[预防医学]栏目

第二节假设检验的基本步骤

  第二节 假设检验的基本步骤

  上述抽样模拟试验表明,从同一总体中以固定n随机抽样,由于抽样误差的影响,样本均数x与总体均数μ往往不相等,且两个样本均数x1和x2也往往不相等。因此在实际工作中遇到样本均数与总体均数间或样本均数与样本均数间不相等时,要考虑两种可能:①由于抽样误差所致;②两者来自不同总体。如何作出判断?统计上是通过假设检验(hypothesis testing),又称显著性检验(significance test),来回答这个问题。

  下面以样本均数x与总体均数μ比较的假设检验为例,介绍假设检验的基本步骤。

  一、建立假设和确定检验水准

  假设有二。一是无效假设(null hypothesis),符号为H0。假设两总体均数相等(μ=μ0),即样本均数x所代表的总体均数μ与假设和总体均数μ0相等。x和μ0差别仅仅由抽样误差所致;二是备择假设(alternative hypothesis),符号为H1。二者都是根据推断的目的提出的对总体特征的假设。这里还有双侧检验和单侧检验之分,需根据研究目的和专业知识而定:若目的是推断两总体是否不等(即是否μ≠μ0),并不关心μ>μ0还是μ<μ0,应用双侧检验,H0:μ=μ0,H1:μ≠μ0;若从专业知识已知μ>μ0,不会μ<μ0(或已知μ<μ0不会μ>μ0),或目的是推断是否μ>μ0(或μ<μ0),则用单侧检验,H0:μ=μ0,H1:u>μ0(或μ<μ0)。一般认为双侧检验较为稳妥,故较常用。

  检验水准(size of a test)亦称显著性水准(significance level),符号为α,是假设检验时发生第一类错误的概率。α常取0.05或0.01。

  二、选定检验方法和计算统计量

  根据研究设计的类型、资料类型及分析目的选用适当的检验方法。如配对设计的两样本均数比较,选用配对t检验;完全随机设计的两样本均数比较,选用u检验(大样本时)或t检验(小样本时)等。

  不同的检验方法有不同的检验假设以及不同的公式。根据公式计算现有样本统计量,如t值、u值等。

  三、确定P值,作出推断结论

  用算得的统计量与相应的界值作比较,确定P值。P值是指在由H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有统计量的概率。根据P值大小作出拒绝或不拒绝H0的统计结论。

日期:2006年1月13日 - 来自[预防医学]栏目
循环ads

两种假设检验思想的比较

  【提 要】 目的 探讨经典统计学派与贝叶斯学派假设检验思想的异同。方法 总结和概括两种思想,并结合一个实例对两种思想进行比较。结果 两种思想统一于贝叶斯定理,并在特定场合下相互等价;贝叶斯方法在先验信息的利用、风险的回答、损失的考虑以及多重假设问题的处理等方面较经典方法具有明显的优势。结论 贝叶斯学派的理论应用受到重视。

Contrast Between Two Schools of Thought on Hypothesis Test

Zhang gaokui,et al.,

  PLA post-graduate medical school(100853).Beijing

  【Abstract】 Objective To discuss differences between classical and Bayesian testing thoughts.Methods First these two thoughts are summarized,and then they are compared through an example.Results It is pointed out that these two thoughts are united on Bayes's Theorem,that they are equal on given occasions,and that Bayesian testing approaches have more advantages than classical approaches in using prior information,indicating the hazard of testing,considering the loss,and dealing with the problem of multi-hypotheses.Conclusion Great attention should be paid to Bayesian theory.

  【Key words】 hypothesis test Classical school Bayesian school

  假设检验问题是统计学的传统问题,对于该问题,经典统计学派与贝叶斯学派有不同的处理思想。目前,经典统计方法占据着统计学的主导地位,但是,贝叶斯方法正在国外迅速发展并得到日益广泛的应用,我们有必要给以足够的重视。本文结合一个例子,对两大学派的假设检验思想进行初步比较,以揭示两种思想的区别与联系,并着重探讨贝叶斯方法的优势。

  两种假设检验思想

  一、经典统计学派的假设检验思想

  经典统计学派运用反证的思想进行推断,即:在认定一次实验中小概率事件不会出现的前提下,若观察到的事件是H0为真时不合理的小概率事件,则拒绝H0。

  上述思想可以用如下决策函数表示:

 

  其中x代表样本信息。Φ(x)取值为0时即为通常的“拒绝H0”。

  二、贝叶斯学派的假设检验思想

  贝叶斯学派直接讨论H0和H1的后验概率,依据后验概率的大小进行推断。

  其基本的解决方案是:在先验分布π下,有决策函数

 

  Φ(x)取值为0时即“拒绝H0”。很明显,它选择了后验概率较大的假设。

  三、两种思想的联系与分歧

  在经典统计学中,参数被看作未知常数,不存在参数空间,因而不存在H0和H1的概率,给出的是P(x|H0真),其中x代表样本信息。在贝叶斯方法中,参数被看成随机变量,在参数空间内直接讨论样本x下H0和H1的后验概率,给出的是P(H0真|x)和P(H0不真|x)。

  事实上,两个学派的方法在一定程度上统一于贝叶斯公式。

  由贝叶斯公式容易得到:

 

  因此,当P(H0)=P(H1),即H0与H1居于平等地位时,经典学派与贝叶斯学派的结果是一致的。

[page]

  然而,H0与H1地位往往不一致,H0常居于将被否定的位置,因而上述一致性并不总能成立。贝叶斯学派对此进行了深入的探讨,他们的结果很有意义。

  对于正态分布前提下的单侧检验:X~N(θ,1),H0:θ≤0 H1:θ>0,经典方法得到的P值与贝叶斯方法在无信息先验分布下的后验概率相等,此结论可以推广到正态分布前提下其他类似的单侧检验。

  对于形如H0:θ=0,H1:θ>0,(或H1:θ<0)的单侧检验,情况则不同,与下述的双侧检验有类似结果。

  对于形如H0∶θ=0, H1:θ≠0的双侧检验,经典方法得到的P值与贝叶斯方法的后验概率大不相同。在Berger和Sellke 1987年对正态分布前提下二者的比较研究中,当经典方法得到的P在0.01~0.1之间时,贝叶斯方法得到H0为真的后验概率大于P,因而此时拒绝H0所承担的实际风险大于P,而这个区间对于经典方法下结论是非常重要的。Hwang和Pematle 1994年提出,对这类双侧检验,类似结果始终存在,因而P值应该由其他判断标准来替代。但他们还没有找到这种标准。

  两种思想的应用

  下面我们通过一个例子对两种假设检验思想进行一些比较。

  例:以随机变量θ代表某人群中个体的智商真值,θi为第i个个体的智商真值,随机变量Xi代表第i个个体的智商测验得分,若该人群的期望智商为μ,则第i个个体在一次智商测验中的得分可以表示为:xij=θi+eij=μ+ei+eij,其中ei为第i个个体的自然变异,eij为第i个个体第j次测量的测量误差。根据以往积累的资料,已知在某年龄儿童的智商真值θ~N(μ,τ2),其中μ=100,τ=15,个体智商测验得分Xi~N(θi,σ2),其中σ=10。现在一名该年龄儿童智商测验得分为115,问:(1)该儿童智商真值是否高于同龄儿童的平均水平(即θi>100)?(2)若取θi在(a,b)为正常,问该儿童智商是否属于正常?

  一、用经典统计方法解答

  对第一问,设H0:θi≤100 H1:θi>100,按照经典统计学方法,若H0成立,则有:

 

  因此,α水平下的拒绝域为{x:x>100+σ·u1-α}

  已知σi=10,若取α=0.05,有u0.95=1.645,100+10×1.645=116.45。

  现有x=115,因此,在0.05水平尚不能认为该儿童智商高于平均水平。

  对第二问,经典方法需要进行两次分别针对a、b的单侧检验。过程与第一问相似,这里不再叙述。

  二、用贝叶斯方法解答

  在贝叶斯学派中,当θi未知时,将其看作随机变量,与θ具有相同的分布,这是贝叶斯学派与经典学派的一个重大区别。

[page]

  根据贝叶斯理论,若X~N(θ,σ2),其中σ2已知,θ未知,但已知θ的先验分布是N(μ,τ2),其中μ和τ2均已知,则给定x后θ的后验分布为N(μ(x),ρ-1,)其中(证明参见文献[1])。

  由此得到,本例中该儿童智商θi的后验分布为N(110.38,69.23)。

  对第一问,同样设H0:θi≤100 H1:θi>100,查正态分布表可以得到:

P(H0:θi≤100|x=115)=0.106,

  P(H1:θi>100|x=115)=0.894

  根据风险最小原则拒绝H0,接受H1。

  对第二问,设H0:a<θi<b H1:θi<a或θi>b,查正态分布表可以分别得到P{H0:a<θi<b|x=115}和P{H1:θi<a或θi>b|x=115},类似第一问,依据风险最小原则作出推断。

  讨 论

  由上述分析和例子,我们可以看出,用贝叶斯方法处理假设检验问题至少在下述几方面具有明显优势。

  一、先验信息利用的充分性和风险的直观性

  从前述问题的处理,我们清楚地看到,经典方法只使用了Xi的已有信息(贝叶斯学派称之为先验信息),而贝叶斯方法则同时利用了Xi和θ的先验信息。因而在第二问的解决上,贝叶斯方法较经典方法少进行一次假设检验。

  在贝叶斯方法中,由于导出了样本x下的后验分布,可以对风险给出正面的回答,因而较经典方法下的间接判断更直观。

  二、可以将后续问题纳入考虑范围

  如果推断错误在后续问题的解决过程中会造成一定损失,贝叶斯方法在进行推断时可将这一损失考虑在内。如:

  在假设H0∶θ∈Θ0,H1∶θ∈Θ1(Θ0、Θ1是参数空间内两个互补子集)下,有:

 

  Φ等于0,1分别代表拒绝、接受H0,a0、a1分别代表了第一、第二类错误造成的损失,这时,贝叶斯方法给出如下决策函数:

 

  由于可以将假设检验结果带来的损失纳入检验考虑的范畴之内,因而对问题的回答更接近实用。

  三、多重假设的处理不存在困难

  对多重假设,如将前例第二问改为:若θi∈(a,b)为智力正常,θi<a为智力低下,θi≥b为智力超常,问该儿童智力属何种类型?

  在现有条件下,经典方法很难处理这一问题。而贝叶斯方法对这一问题的解答并不存在特殊的困难,只需将假设设为:H0∶a≤θi<b H1∶θi<a H2∶θi≥b,多计算一个后验概率便可。

[page]

  贝叶斯方法的上述优势对于解决实际问题很有帮助。

  尽管在理论方面还存在一些困难,但不容否认的是,贝叶斯方法已经成为决策论的一个基本工具,在社会学、经济学等领域发挥着重要作用。在临床医学、预防医学、卫生事业管理等决策领域也一定能发挥重要作用。国内医学统计学界目前对贝叶斯方法的关注较少,加强这方面的研究工作,无疑将是有益的。

(在此特别感谢张尧庭教授、余松林教授对本文的指点。)

  参考文献

  1.James O.Berger著.贾乃光译.统计决策论及贝叶斯分析.中国统计出版社,1998,159~172.

  2.Christian P.Robert.The Bayesian Choice:A Decision-Theoretic Motivation.Spring-Verlag New York,Inc.1994,179~209

  3.张尧庭,陈汉峰编著.贝叶斯统计推断.北京:中国统计出版社,1994,78~88

  4.张尧庭著.统计中的三大学派.统计教育,1995,1:35~39

日期:2004年9月30日 - 来自[医学统计学]栏目
共 1 页,当前第 1 页 9 1 :

ads

关闭

网站地图 | RSS订阅 | 图文 | 版权说明 | 友情链接
Copyright © 2008 39kf.com All rights reserved. 医源世界 版权所有
医源世界所刊载之内容一般仅用于教育目的。您从医源世界获取的信息不得直接用于诊断、治疗疾病或应对您的健康问题。如果您怀疑自己有健康问题,请直接咨询您的保健医生。医源世界、作者、编辑都将不负任何责任和义务。
本站内容来源于网络,转载仅为传播信息促进医药行业发展,如果我们的行为侵犯了您的权益,请及时与我们联系我们将在收到通知后妥善处理该部分内容
联系Email: