从5月开始,我们邀请到卫生统计学方面的老师给大家说一说统计,一起为科研论文的撰写积攒知识吧。第一期来了哦,盘它。
样本量估算是个什么东东?
我在平时工作中,最常见遇到的问题就是:老师,我这个研究需要多少例数???老师,编辑要求我给出例数(样本量)的依据,我怎么办呀?……
其实这些问题都是涉及到样本量估算的内容,下面我们以最常见的随机对照两组比较的研究为例,解读如何进行样本含量估算。
例1:在作两种处理动物冠状静脉窦的血流量实验时,A处理平均血流量增加1.8 mL/min,B处理平均血流量增加2.4 mL/min。设两处理的标准差相等,均为1.0 mL/min,α=0.05,β=0.10,若要得出两处理有差别的结论,需多少实验动物?
案例分析思考
1.研究设计类型:本例比较的是两种处理对动物冠状静脉窦血流量的比较研究,结局指标为平均血流量增加量(为计量资料),属于两样本均数的比较。
2.常用估算方法有两种:公式法和软件法
公式法:
具体参数如下:
n为每组例数(即样本量)。
Zα/2和Zβ可以通过查界值表得到,一般α取0.05双侧,则即Z0.05/2=1.96;β取0.1或0.2单侧,一般常用检验效能来表示,即1-β,当1-β为0.9时,Z0.1=1.28,当1-β为0.8时,Z0.2=0.84,。本例中Zα/2和Zβ分别等于1.96和1.28。
为标准差,本例中=1.0。
μ1和μ2分别为两组的均值,本例中μ1=1.8,μ2=2.4。(有些公式以差值来表示)
软件法:常用PASS软件(本例采用PASS11.0版本)
具体操作
1.公式法:代入公式进行计算
2.软件法:
第一步:打开PASS 11.0软件,在左侧菜单栏中点击Means—Two Independent Means—Test(Inequality),选择Tests for Two Means( Two-Sample T-Test) [Differences]。
第二步:在“Tests for Two Means( Two-Sample T-Test)[Differences]”对话框中,填入相应的参数:Power=0.90;α=0.05;R=1.0(1:1比例);Mean1(Mean ofGroup1)=1.8;Mean2(Mean of Group2)=2.4;s1(StandardDeviation Group1)=1.0;S2(StandardDeviation Group2)=1.0;点击左上角Run。
第三步:读出PASS计算结果:样本量计算的结果、参考文献、报告中的名词定义、总结性描述。
报告中对于样本量估算的表述形式
公式法:本研究为平行设计的随机对照试验,两组分别为A处理和B处理,研究对象的平均血流增加量为主要观测的结局指标,根据既往文献报道(或预试验结果),A处理的平均血流增加量为(1.8±1.0) mL/min,B处理的平均血流增加量为(2.4±1.0)mL/min,设双侧α=0.05,把握度为90%。根据样本量计算公式:
计算得到NA=59例,NB=59例。假定研究对象的失访率为10%,则需样本量NA=59÷0.9=66例,NB=59÷0.9=66例。最终A处理组纳入研究对象66例,B处理组纳入66例,总计至少纳入132例研究对象。
软件法:本研究为平行设计的随机对照试验,两组分别为A处理和B处理,研究对象的平均血流增加量为主要观测的结局指标,根据既往文献报道(或预试验结果),A处理的平均血流增加量为(1.8±1.0 )mL/min,B处理的平均血流增加量为(2.4±1.0)mL/min,设双侧α=0.05,把握度=90%。利用PASS 11软件计算得到NA=60例,NB=60例。假定研究对象的失访率为10%,则需样本量NA=60÷0.9=67例,NB=60÷0.9=67例。最终A处理组纳入研究对象67例,B处理组纳入67例,总计至少纳入134例研究对象。
例2.单位研究甲、乙两药对某病的疗效,预试验的甲药有效率为60%,乙药为85%。现拟进一步作治疗试验,设a=0.05,b=0.10,问每组最少需要观察多少病例?
案例分析思考
1.研究设计类型:本例比较的是甲、乙两药对某病疗效的比较研究,结局指标为有效率(为计数资料),属于两样本率的比较。
2.常用估算方法有两种:公式法和软件法
公式法:
具体参数如下:
n为每组例数(即样本量)。
Zα/2和Zβ可以通过查界值表得到,一般α取0.05双侧,则Z0.05/2=1.96;β取0.1或0.2单侧,一般常用检验效能来表示,即1-β,当1-β为0.9时,Z0.1=1.28,当1-β为0.8时,Z0.2=0.84,。本例中Zα/2和Zβ分别等于1.96和1.28。
p1和p2分别代表甲、乙两药对某病疗效的有效率,
为p1和p2的均值,本例中p1=0.60,p2=0.85,
的=(0.6+0.85)/2=0.725。
软件法:常用PASS软件(本例采用PASS11.0版本)
具体操作
1.公式法:代入公式进行计算
2.软件法:
第一步:打开PASS 11.0软件,在左侧菜单栏中点击Proportions—TwoIndependent Proportions Test(Inequality) ,选择Tests forTwo Proportions[Differences]。
第二步:在“Tests for Two Proportions[Differences]”对话框中,填入相应的参数:Power=0.90;α=0.05;R=1.0(1:1比例);D1(Difference H1=P 1-P2)=0.25(率差);P2(Control Group Proportion)=0.6(较小率);点击左上角Run。
第三步:读出PASS计算结果:样本量计算的结果、参考文献、报告中的名词定义、总结性描述。
报告中对于样本量估算的表述形式
公式法:本研究为平行设计的随机对照试验,两组分别为甲药和乙药,研究对象的有效率为主要观测的结局指标,根据既往文献报道(或预试验结果),甲药的有效率为60%,乙药的有效率为85%,设双侧α=0.05,把握度为90%。根据样本量计算公式:
计算得到N甲=65例,N乙=65例。假定研究对象的失访率为20%,则需样本量N加=65÷0.8=82例,N乙=65÷0.8=82例。最终甲药组纳入研究对象82例,乙药组纳入82例,总计至少纳入164例研究对象。
软件法:本研究为平行设计的随机对照试验,两组分别为甲药和乙药,研究对象的有效率为主要观测的结局指标,根据既往文献报道(或预试验结果),甲药的有效率为60%,乙药的有效率为85%,设双侧α=0.05,把握度为90%。利用PASS 11软件计算得到N甲=64例,N乙=64例。假定研究对象的失访率为20%,则需样本量N加=64÷0.8=80例,N乙=64÷0.8=80例。最终甲药组纳入研究对象80例,乙药组纳入80例,总计至少纳入160例研究对象。
技术总结如下
1.为什么要对样本量进行估算?
所谓样本量(sample size)是指实验研究和调查研究中样本的观察单位数,又称样本大小。在实验研究与现场调查研究设计中必须确定研究对象的样本量。而样本量估算(sample size estimate)是指应用一定的统计方法在保证研究结论具有一定可靠性(精度与检验效能)的前提下所确定的最小样本例数。同时还应考虑研究过程中研究对象的失效。这是在研究开始实施之前就应该完成的。
2.怎么进行样本量的估算?
无论采用公式法还是软件法,都必须提供如下信息:
(1)第一类错误概率α。α越小所需样本量越大;一般取0.05,α的取值有单双侧之分,双侧检验比单侧检验所需样本量更多。
(2)第二类错误概率β或检验效能1-β。β越小,检验效能1-β越大,所需样本量也越大;一般要求检验效能在0.80以上。β一般只取单侧。
以上两项可根据具体情况调整设定!!!!
(3)容许误差δ或两组具体的指标值(均数或率)。容许误差值越小,所需样本越大。
(4)总体标准差σ或总体率π。σ反映了数据的变异度,其值越大,所需样本量也越大。总体率π越接近0.5, 则所需的样本量越多。
以上两项需要根据前人的研究结果、预试验结果或统计理论进行估计!!!!
(5)单双侧检验与设计类型。在其他条件相同时,单侧与双侧检验所需的样本量不同,一般地说双侧检验所需样本较大。不同的设计类型样本量估算的方法不同,样本量也不同。
以上仅介绍了平行设计的随机对照两组比较(均数和率)的最基本的样本量估算方法,实际研究中情况要复杂得多,但多数情况下都有相应的样本量估算方法,可参考有关专著或查阅相关文献。
撰稿:刘岭
约稿编辑:刘芹
end
专家简介
刘岭:陆军军医大学卫生统计学教研室副教授,主要从事卫生统计学教学、科研工作。担任中华卫生信息学会第八届统计理论与方法专业委员会委员,重庆市预防医学卫生统计专业委员会副主任委员,并担任《第三军医大学学报》等多家杂志的编委、统计审稿专家。
排版:毕丽 审核:王东
PS:各位小伙伴若对本次课堂内容有何疑问可给我们留言,我们将在下一期课堂请刘教授为大家解答。
欢迎关注“现代医药卫生”扫描二维码更精彩
未经本刊同意,禁止转载,若需转载请在下方留言,与本刊取得联系。
|