千文网小编为你整理了多篇相关的《医学统计学统计方法总结》,但愿对你工作学习有帮助,当然你在千文网还可以找到更多《医学统计学统计方法总结》。
一、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料
1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数
3)n£40或存在理论数
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验
4.R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验
2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料 1.单样本资料与总体比较: 1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。
配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验 2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析 1.四格表资料
1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c£40,则用二项分布确切概率法检验 2.C×C表资料:
1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验
变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析 2)大样本或两个变量不服
计量资料:
一、描述性分析
集中趋势:对称——算术均数偏态——中位数等比——几何均数 离散趋势:对称——方差、标准差偏态——四分位数间距
均数悬殊或单位不同的资料比较——变异系数
二、统计推断(根据样本推断总体)1.参数(均数)估计总体方差未知——总体方差已知——
参考值范围:单双侧正态分布——
XuS
(xt/2v
snsn,xt/2v
s
sn))
(xu/2,xu/2
n
XuSXuS
偏态分布——百分位数法
二者的含义、用途 2.假设检验
(1)均数的比较(正态)
单个样本、配对(与两独立样本的区别)两样本(方差齐——t检验
方差不齐——校正t检验或秩和检验或变量转换)多样本:方差齐完全随机设计方差分析随机区组设计方差分析
方差不齐——秩和检验或变量转换
非正态:秩和检验或变量转换
F—+—>t
两两比较:SNK任两个对比
LSD一对或几对比较
Dunnet 实验与对照组比较
t——>FF=t
2(2)方差比较
两个方差:F检验(正态)
多个方差:Bartlett(正态)
Levene检验
假设检验注意事项
计数资料
一、描述性分析
频率或严重程度——率
比重或构成——构成比
一指标为另一指标的若干倍或百分比——相对比
应用注意:不能以比代率、可比性、样本率不能直接对比
率或构成比比较:
1.若某因素内部构成不同并且影响比较,进行标化
二、统计推断
1.参数估计
二项分布率的估计:查表或正态法
泊松分布均数估计:查表或正态法
2.假设检验
单个样本率:直接法或二项分布U检验泊松分布U检验(率很小)两样本率的比较:四格表2检验(校正)
二项分布U检验(n大、np>5,n(1-p)>5)
泊松分布U检验((率很小)
精确概率法
多个率或构成比比较:2检验(理论数不能小于1或小于的理论数
不能多于5分1)
两两比较:
任两个对比、实验与对照组比较
等级资料:-----效应比较
秩和检验
两变量关系:
1.定量(计量资料)正态pearson相关 回归
非正态秩相关
2.无序分类定性
3.有序分类定性2检验和列联相关系数
(1)单向有序分组有序、指标无序卡方检验分组无序、指标有序秩和检验
(2)双向有序
属性相同属性不同Kappa检验 线性趋势秩相关
医学统计学各种资料比较 选择方法小结
一、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料
1)n>40并且所以理论数大于5,则用Pearson c2
2)n>40并且所以理论数大于1并且至少存在一个理论数
3)n£40或存在理论数
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验
3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4.R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验
2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2
3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料 1.单样本资料与总体比较:
1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。
配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验
2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析 1.四格表资料
1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c£40,则用二项分布确切概率法检验 2.C×C表资料:
1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验
变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析
2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析
2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析
3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析
七、回归分析
1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
2)配对的情况:用条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
八、生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)
1.用Kaplan-Meier方法估计生存曲线 2.大样本时,可以寿命表方法估计
3.单因素可以用Log-rank比较两条或多条生存曲线 4.多个因素时,可以作多重的Cox回归
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
《医学统计方法》试题
医学统计方法概述(10题)
1.某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为:
A.所有成年男子B.该市所有成年男子C.该市所有健康成年男子
D.120名该市成年男子E.120名该市健康成年男子
2.医学统计的研究内容是
A.研究样本B.研究个体C.研究变量之间的相关关系D.研究总体E.研究资料或信息的收集.整理和分析
3.总体应该由
A.研究对象组成B.研究变量组成C.研究目的而定
D.同质个体组成E.个体组成4.在统计学中,参数的含义是
A.变量B.参与研究的数目C.研究样本的统计指标
D.总体的统计指标E.与统计研究有关的变量
5.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于
A.计数资料B.计量资料C.总体D.个体E.样本
6.统计学中的小概率事件,下面说法正确的是:
A.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件C.发生概率小于0.1的事件D.发生概率小于0.001的事件E.发生概率小于0.1的事件
7、统计上所说的样本是指:
A、按照研究者要求抽取总体中有意义的部分
B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分
D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体
8、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。
A、计算B、计数C、计量D、等级E、都对
9、红细胞数(1012L-1)是:
A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体
10、疗效是:
A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体
答案:1C2E3D4D5A6B7D8B9B10D
数值变量资料的统计描述(13题)
1.标准正态分布曲线的特征是:
A.=0 =0B.=0 =1C.=1 =0
D.=0 =不确定E.=1 =不确定
2.描述计量资料的主要统计指标是 :
A.平均数B.相对数C.t值D.标准误E.概率
3、一群7岁男孩身高标准差为5cm,体重标准差为3kg,则二者变异程度比较:
A、身高变异大于体重B、身高变异小于体重C、身高变异等于体重D、无法比较E、身高变异不等于体重
4、随机抽取某市12名男孩,测得其体重均值为3.2公斤,标准差为0.5公斤,则总体均数95%可信区间的公式是:
A、3.2±t0.05.11 ×0.5B、3.2 ±t0.05.12 ×0.5/
C、3.2 ±t0.05.11 ×0.5/D、3.2±1.96×0.5/
E、3.2 ±2.58×0.5/
5.某组资料共5例, X2=190, X=30, 则均数和标准差分别是
A.6 和 1.29B.6.33 和 2.5C.38 和 6.78
D.6 和 1.58E 6和2.5
6.以下指标中那一项可用来描述计量资料离散程度。
A.算术均数B.几何均数C.中位数D.极差 E.第50百分位数
7.偏态分布资料宜用下面那一项描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距E.方差
8.下面那一项可用于比较身高和体重的变异度
A.方差B.标准差C.变异系数D.全距E.四分位数间距
9.正态曲线下.横轴上,从均数到+∞的面积为。
A.97.5%B.95%C.50%D.5%E.不能确定
10.下面那一项分布的资料,均数等于中位数。
A.对数正态B.左偏态C.右偏态D.偏态E.正态
11.对于正态分布资料的95%正常值范围,宜选用()A.x±2.58sB.x±1.96sC.x±2.58sxD.x±1.96sE.x±1.645s
12.做频数表时,以组距为5,下列哪项组段划分正确
A.0一,5一,10一,„B.0—5,5一10,10一,„
C.一5,一10,一15,„D.0—4,5—9,10一,„E.5一,7一,9一,„
13.均数与标准差之间的关系是
A.标准差越小,均数代表性越大 B.标准差越小,均数代表性越小
C.均数越大,标准差越小D.均数越大,标准差越大E.标准差越大,均数代表性越大
答案:1.B 2.A 3.D 4.C 5.D 6.D 7.C 8.C 9.C 10.E 11.B 12.A 13.A
数值变量资料的统计推断(13题)
1.抽样研究中,S为定值,若逐渐增大样本含量,则样本:
A.标准误减小B.标准误增大C.标准误不改变
D.标准误的变化与样本含量无关E.以上都对2、12名妇女分别用两种测量肺活量的仪器测最大呼气率(l/min),比较两种方法检测结果有无差别,可进行:
A、成组设计u检验B、成组设计t检验 C、配对设计u检验
D、配对设计t检验E、X2检验
3.比较两种药物疗效时,对于下列哪项可作单侧检验()。
A.已知A药与B药均有效B.不知A药好还是B药好
C.已知A药不会优于B药D.不知A药与B药是否均有效
E.已知A药与B药均无效
4.两个大样本均数比较的u检验, |u|=1.98,则统计结论是
A.P 0.05D.P =0.05E、P
5.配对计量资料比较的t检验公式中,分母是 A.dB.sdC.dD.dE、d2
6.配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,两次t检验
A、t值符号相反,结论相反B、t值符号相同,结论相同
C、t值符号相反,但结论相同
D、t值符号相同,但大小不同,结论相反E、t值符号与结论无关
7.下面那一项小,表示用该样本均数估计总体均数的可靠性大。
A.CVB.SC.SxD.RE.四分位数间距
8.两个小样本数值变量资料比较的假设,首先应考虑。
A.t检验B.u检验C.秩和检验
D.t检验和秩和检验均可E.资料符合t检验还是秩和检验
9.抽样误差是指
A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异
C.总体参数间的差异D.样本统计量与总体统计量间的差异E.以上都不对
10、tt0.05,,统计上可接受()的假设。
A、12B、12C、X1X2D、X1X2E、以上都错
11、统计推断的内容:
A.是用样本指标估计相应的总体指标B.是检验统计上的“假设”
C.a、b均不是D.a、b均是E、以上都错
12、两样本均数比较,经t 检验,差别有显著性时,P 越小,说明:
A.两样本均数差别越大B.两总体均数差别越大
C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同 E.样本均数与总体均数不同
13.表示均数的抽样误差大小的统计指标是
A.标准差B.方差C.均数标准误D.变异系数E.极差
答案:1.A 2.D 3.C 4.D 5.C 6.C 7.C 8.E 9.D 10.B 11.D 12.C 13.C
分类变量资料的统计描述与推断(13题)
1.描述分类变量资料的主要统计指标是:
A.平均数B.相对数C.变异系数D.相关系数E.百分位数
2.男性人口数/女性人口数,这一指标为:
A、率B、构成比C、相对比D、动态数列E、不是相对数
3、构成比有个重要特点是()。
A、百分比总和必等于100%B、百分比总和必小于100%
C、百分比总和必大于100%D、以上均不对E、以上都错
4.标化后的总死亡率()。
A.仅仅作为比较的基础,它反映了一种相对水平
B.它反映了实际水平C.它不随标准选择的变化而变化
D.它反映了事物实际发生的强度E.以上都不对
5.关于相对数,下列哪一个说法是错误的A.相对数是两个有联系的指标之比
B.常用相对数包括相对比,率与构成比
C.计算相对数时要求分母要足够大
D.率与构成比虽然意义不同,但性质相近, 经常可以混用
E.计算相对数时不要求分母要足够大
6.随机选取男200人,女100人为某寄生虫病研究的调查对象,测得其感染阳性率分别为20%和15%,则合并阳性率为__________
A.35%B.16.7%C.18.3%D.无法计算E、30%
7.对两地的结核病死亡率比较时作率的标准化,其目的是:
A.为了能更好地反映人群实际死亡水平
B.消除两地总人数不同的影响
C.消除各年龄组死亡率不同的影响
D.消除两地人口年龄构成不同的影响
E、以上都不对
8.四格表资料的卡方检验时无需校正,应满足的条件是()。
A.总例数大于40B.理论数大于5C.实际数均大于l
D.总例数大于40且理论数均大于或等于5E.总例数小于40
9.计算相对数的目的是
A.为了进行显著性检验B.为了表示绝对水平
C.为了便于比较D.为了表示实际水平E.为了表示相对水平
10.相对数使用时要注意以下几点,其中哪一项是不正确的A.比较时应做假设检验B.离散程度和变异程度C.不要把构成比当率分析D.二者之间的可比性E.分母不宜过小
11、四个样本率作比较,χ2>χ2
0.01(3),可认为:
A、各总体率不同或不全相同B、各总体率均不相同C、各样本率均不相同D、各样本率不同或不全相同E.各总体率和各样本率均不同或不全相同
12、2检验适用于比较:
A、两个率差别的显著性B、多个率差别的显著性C、两个或多个构成比差别的显著性D、以上都可以E、以上都错
13、某研究者对50份痰液标本,每份分别接种在甲乙培养基上,观察结核杆菌的生长情况并想比较两种培养基的培养效果是否一致,资料见下表。问应该选择的统计方法是:
A.确切概率法B.四格表资料的检验C.配对计数资料的检验
D.行乘列表资料的检验E.配对计量资料的t检验
甲培养基
﹢
﹣
乙培养基 ﹢ ﹣ 23 12 7 8 合计35 15 22
2答案:1.B 2.C 3.A 4.A 5.D 6.C 7.D 8.C 9.C 10.B 11.A 12.D 13.C
统计表与统计图(4题)
1.为表示某地近20年来婴儿死亡率的变化情况,宜绘制()。
A.普通线图B.直方图C.直条图D.散点图E.统计地图
2.某医院收集了近期门诊病人的病种构成情况资料,宜绘制:
A.直条图B.圆图C.线图D.直方图E.半对数线图
3.图示某地某年流行性乙型脑炎患者的年龄分布,宜绘制:
A.条图B.百分条图C.圆图D.直方图E.线图
4.比较1995年某地三种传染病白喉、乙脑、痢疾的病死率,选择的统计图是
A.直方图B.半对数图C.条图D.线图E.百分图
答案:1.A 2.B 3.D 4.C
医学统计学各种资料比较 选择方法小结
一、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料
1)n>40并且所以理论数大于5,则用Pearson c2
2)n>40并且所以理论数大于1并且至少存在一个理论数
3)n£40或存在理论数
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验
3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4.R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验
2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2
3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料 1.单样本资料与总体比较:
1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。
配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验
2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析 1.四格表资料
1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c£40,则用二项分布确切概率法检验 2.C×C表资料:
1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验
变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析
2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析
2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析
3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析
七、回归分析
1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
2)配对的情况:用条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
八、生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)
1.用Kaplan-Meier方法估计生存曲线 2.大样本时,可以寿命表方法估计
3.单因素可以用Log-rank比较两条或多条生存曲线 4.多个因素时,可以作多重的Cox回归
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
统计方法小结
首次分享者:yanyan 已被分享22次 评论(0)复制链接 分享 转载 删除
一、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料
1)n>40并且所以理论数大于5,则用Pearson c2
2)n>40并且所以理论数大于1并且至少存在一个理论数
3)n£40或存在理论数
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验
3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4.R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2
3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料
1.单样本资料与总体比较:
1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。
配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验 2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析 1.四格表资料
1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c£40,则用二项分布确切概率法检验 2.C×C表资料:
1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验
变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析 2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析 2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析
3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析
七、回归分析
1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 2)配对的情况:用条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
八、生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)
1.用Kaplan-Meier方法估计生存曲线 2.大样本时,可以寿命表方法估计
3.单因素可以用Log-rank比较两条或多条生存曲线 4.多个因素时,可以作多重的Cox回归
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
推荐专题: 医学统计学统计方法总结