医学研究中的统计技术
人与人之间普遍存在着个体差异,所以医学研究中的变异无处不在,再加上外在因素的影响,医学现象更显得变化无常。
例如,某种疾病的发生或流行是什么因素所致?可能涉及的多种因素中哪些是无关紧要的?哪些才是真正相关的?其中又具体地以哪一个为主?哪一个为次?又比 如,用某种新药品或新疗法治疗某种疾病,为什么有的患者感觉“妙手回春”,而有的患者却依然久病不起?如何客观地评判该药品或该疗法是否真的有效?或者说 它与以前的药品或疗法相比具有明显的优势?为了获取正确的结果,需要做多少次临床试验才够呢?……诸如此类,举不胜举。
针对上述医学问题,我们应该如何进行客观科学的分析,从而得出可靠的判断和结论呢?将医学研究与统计技术相结合所产生的医学统计学就是帮助我们解决这类问 题的一个强有力的工具。医学统计学绝不是干巴巴的学术理论,也不是冷冰冰的数学公式,更不是硬生生的计算推导,而是将统计学渗透到医学研究等各领域的一种 思维方式。我们并不奢望每个医学工作者都能成为专业统计学工作者,而是希望赋予医学工作者更多的一种方法,建立以科学方法开展试验与分析的逻辑观念,从不 确定性或概率的角度去思考问题,在开展医学相关研究设计,进行数据的搜集、整理、分析时具备清晰的思路。
为了排除形成新思路时的障碍,减少学习统计学时的困难,下面将阐述说明一个在医学科研界常用的方法——“配对设计与检验”,以此为例帮助大家理解如何应用医学研究中的统计技术。
“配对设计与检验”是指研究者为了控制可能存在的主要非处理因素,将条件相同或相近的受试对象配成对子,然后每对中的两个个体随机地被分配到实验组和对照 组进行试验。这样做的优点是可以在同一对的试验对象间取得均衡,以提高试验的效率。具体形式可能有:配对的两个受试对象分别接受两种不同的处理;同一受试 对象的两个部分分别接受两种不同的处理;同一受试对象接受某种处理前后结果的比较,即自身前后对比;等等。
解决这类问题,首先是求出各对结果差值的均值。理论上讲,两种处理的效果无差别或某种处理无效时,差值的总体均值应该为0。因此,对于配对设计的均值比 较,可以看成是样本均值与总体均数的比较,也就是建立配对检验统计量t进行统计推断。在此,笔者不想赘述教科书上的统计学基本概念及其思想原理,而是想借 用一个实际案例来强调如何使统计分析切合医学问题的中心。
背景介绍:某生物医药单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的小白鼠按性别相同,年龄、体重相近者配成10对后,将每对中的两只 小白鼠随机分到正常饲料组和维生素E缺乏组,经过一段时间后将小白鼠杀死,测量其肝中维生素A的含量,结果见表一。试问两组小白鼠肝中维生素A的含量有无 明显区别?
表一 不同饲料组小白鼠肝中维生素A的含量(U/g)
显然,该案例非常适合用“配对设计与检验”的方法来分析。获得10对试验对象的数据后,很容易求得对应的差值。在此基础上,我们可以一步步地用配对t检验做统计推断。
首先,确定原假设和备择假设和检验显著性水平如下。
H0:u等于0,即两组小白鼠肝中维生素的含量相同;
H1:u不等于0,即两组小白鼠肝中维生素的含量不同;
a=0.05。
其次,计算检验统计量t值。借助权威的统计分析软件JMP可以快速地得到如表二所示的计算结果。由该表可知,样本均值等于942,样本均值的标准误差为 156.559,自由度DF = 9,因此其对应的95%置信区间为[587.839,1296.16],检验统计量t = 6.016908。
表二 配对t检验的分析报告
最后,将t值转化为P值,得出统计推断结论。由于本案例采用的是双侧检验,故只需参考表二中的“P值 > |t| 0.0002*”。因为P = 0.0002,即P < ? = 0.05,所以我们有较大的把握拒绝原假设H0,接受备择假设H1。用医学的语言来翻译这个统计结论就是:两组小白鼠肝中维生素A的含量不同,即维生素E 缺乏对小白鼠肝中维生素A的含量有影响。
有的医学工作者感觉上述分析过程比较抽象,难于理解。高级统计分析软件JMP考虑到了这一点,别具特色地用图形化的方式诠释了这个结果。为了能够清晰地读 懂图形表达的含义,简要地做一些必要的理论铺垫。在如图一所示的图形中,原先的二维坐标轴分别代表两个响应y1和y2。将其旋转45度后,得到一个新的二 维坐标轴,此时y轴代表的是两个原始响应的差值,x轴代表的是两个原始响应的总和。此图形与原先构造的二元散点图相同,只是视觉角度被旋转了45度而已。
图一 旋转前后的二元散点图
在图一的基础上,再进行尺度的重新调整,就可以显示两个响应的差值和均值了,至于如何判断这两个原始响应(y1和y2)的差值是否显著,可以依据图二的解释说明轻松识别。
图二 配对t检验的图形解释
将这一原理应用在刚才的案例上,可以得到如图三所示的图形。由该图可知,正常饲料组和维生素E缺乏组之间的差值及其95%置信区间都远大于0,说明两组小 白鼠肝中维生素A的含量确实明显不同,维生素E缺乏对小白鼠肝中维生素A的含量确有影响。这个可视化的结论与先前统计计算的结论完全一致,但相比之下,直 观形象了很多,适合于绝大多数非统计专业人士的理解。
图三 实际试验的配对t检验图
综上所述,统计技术为我们在解决医学研究中的问题时提供了一个新思路、新方法,而在应用统计技术时,作为医学工作者,不需要也没有必要死记硬背一些繁杂的 数学公式和推导过程。至关重要的原则有两个:一是深入理解医学研究资料的产生背景,二是掌握统计分析软件JMP的基本操作。谨以此文抛砖引玉,希望能够有 更多的医学专业人士从医学统计学中获得裨益。
0