千文网小编为你整理了多篇相关的《医学统计学统计方法总结》,但愿对你工作学习有帮助,当然你在千文网还可以找到更多《医学统计学统计方法总结》。
研究生三班王颖(颖)学号 20130307
计量资料
一.统计描述
频数分布:
1.频数分布表
2.频数分布图 可以用来判断计量资料的分布类型,以便于进一步做统计分析和处理外,还可以进行病因研究和疾病预防控制。
集中趋势的描述:
1.算术平均数 反映一组呈对称分布的变量值在数量上的平均水平。
2.几何平均数 反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,常适
用于免疫学指标
3.中位数 将n个变量值从大到小排列,位置居于中间的那个数。适用于各种分布类型,尤其是偏态分布和一端或两端无确切数值的资料。
4.百分位数PX常用于确定单峰偏态分布资料的医学参考值范围(要求样本含量要足
够大);
离散趋势的描述:
1.极差 常用来说明传染病、食物中毒等的最短和最长潜伏期;一组变量值的最大值与
最小值之差。
2.四分位数间距 是由第3四分位数P75和第1四分位数P25相减而得,记为QR。
3.方差和标准差 方差就是离均差平方和除以N。
标准差就是方差的平方根。
4.变异系数 用于观察指标不同时和均数相差较大时,记为CV。用于两种或多种不同
性质变量变异程度的直观比较;在实验方法学研究中,用来表示方法的精密度。
二.统计推断
单因素
单样本(单组设计)一个样本指标和一个已知的总体指标做比较
1.样本含量较小n
2.样本含量较大时——u检验
3.样本来自的总体不服从正态分布——Wilcoxon符号秩检验
两相关样本(配对设计)两同质受试对象配成对子分别接受两种不同处理;同一受试对
象分别接受两种不同处理;同一受试对象接受处理前后。
1.两样本差值服从正态分布——配对t检验
2两样本差值不服从正态分布——配对样本比较的Wilcoxon符号秩检验
当n≤50时,查T界值表。
当>50时。可用正态近似法作——u检验
两独立样本(成组设计)适用于完全随机设计两样本的比较
1.两样本含量较小n1≤60或(和)n2≤60,两样本的总体均服从正态分布且总体方差
相等,——两独立样本t检验
2.两样本含量较小n1≤60或(和)n2≤60,两样本的总体均服从正态分布但总体方差
不相等,——两独立样本 t’检验或秩转换的非参数检验
3.两样本的总体有一不服从正态分布或总体方差不相等——两独立样本的Wilcoxon秩
和检验当n1≤10和n2-n1≤10时,查T界值表。
当n1>10或n2-n1>10时,可用正态近似法作——u检验
多个独立样本(单因素多水平设计)
1.完全随机设计资料的方差分析
多个样本的总体均服从正态分布且总体方差相等——单向分类的方差分析
多个样本的总体有一服从正态分布或总体方差不相等——Kruskal-Wills H检
验或进行变量变换后采用单向分类的方差分析Kruskal-Wills H检验当样本个数g=3和每个样本例数≤5时,查H界值表。
当g=3且最小样本例数>5或g>3时,则H近似服从
χ2分布,查χ2界值表。
2.随机区组设计资料的方差分析
对于正态分布且方差齐的资料——双向分类的方差分析
对于分正态分布或(和)方差不齐的资料——Friedman M检验或进行变量变换
后采用双向分类的方差分析。
Friedman M 检验 当n≤15和g≤15时,查M界值表。
当n>15或g>15时,可用卡方近似法,查χ2界值表。
实际上,当g>4或者g=4且n>5或者g=3且n>9时,就可用
χ2近似法,查χ2界值表。
多个独立样本间的多重比较
多个样本均服从正态分布且方差齐
1.LSD-t检验 适用于一对或几对在专业上有特殊意义的样本均数间的比较。
2.Dunnett-t检验 适用于g-1个实验组与一个对照组均数差别的多重比较。
3.SNK-q检验 适用于多个样本均数两两之间的全面比较。
多个独立样本有一不服从正态分布或方差不齐的两两比较—— Nemenyi法检验
多个相关样本有一不服从正态分布或方差不齐的两两比较——q检验
多因素
随机区组设计
SS总=SS处理+SS区组+SS误差
1.观察指标呈正态分布——ANOVA
多个样本均数两两之间的全面比较——SNK-q检验
2.观察指标不呈正态分布——Friedman M检验
当n≤15和g≤15时,查M界值表。当n>15或g>15时,可用卡方近似法,查χ2界值表。
实际上,当g>4或者g=4且n>5或者g=3且n>9时,就可用
χ2近似法,查χ2界值表。
多个相关样本两两比较的q检验
析因设计——方差分析
完全随机的析因设计 SS总=SSA+SSB+SSAB+SSE
随机区组的析因设计 SS总=SSA+SSB+SSAB+SSE+SS区组
正交设计 是非全面实验,g个处理组是各因素个水平的部分组合。适用于寻找疗效好的药物配方,医疗仪器多个参数的优化组合,生物体的培养条件等。
当以筛选各因素各水平最佳组合条件为目的时——直接分析,算一算
当需对实验结果进行统计推断时——方差分析
重复测量设计——方差分析
计数资料
一.统计描述
1.绝对数 如某病的出院人数、治愈人数、死亡人数等,通常不具有可比性。
2.强度相对数 说明某现象发生的频率或强度又称为率。
率=某时期内发生某现象的观察单位数/同期可能发生某现象的观察单位数×比例基数
3.结构相对数 表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重和分布,又称为构成比。构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位数×100%
4.相对比 简称比,是两个有关指标之比,说明两指标的比例关系。
相对比=甲指标/乙指标×100%
二.统计推断
样本率与总体率的比较
当n较大、p和1-p均不太小,如np和n(1-p)均大于5时——u检验 两样本率的比较
当n1与n2均较大,且p1、1-p1与p2、1-p2均不太小,如n1p1、n1(1-p1)与n2p2、n2(1-p2)均大于5时——u检验
当n≥40且所有的T≥5时——χ2检验的基本公式或专用公式,当P≈ɑ时,改用四格表资料的Fisher确切概率法。
当n≥40但有1≤T≤5时——χ2检验的校正公式或Fisher确切概率法。
当n
配对四格表资料的χ2检验
当b+c≥40时——一般公式
当b+c
多个样本率的比较 ——R×C表的χ2检验
多个样本率间的多重比较——χ2分割法
两个样本构成比比较—— R×C表的χ2检验
等级资料
等级资料两独立样本比较——两独立样本的Wilcoxon秩和检验
等级资料两相关样本比较——两相关样本的Wilcoxon符号秩检验
等级资料多个独立样本比较——多个独立样本的Kruskal-Wills H检验
统计方法小结
首次分享者:yanyan 已被分享22次 评论(0)复制链接 分享 转载 删除
一、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料
1)n>40并且所以理论数大于5,则用Pearson c2
2)n>40并且所以理论数大于1并且至少存在一个理论数
3)n£40或存在理论数
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验
3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4.R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2
3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料
1.单样本资料与总体比较:
1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。
配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验 2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析 1.四格表资料
1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c£40,则用二项分布确切概率法检验 2.C×C表资料:
1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验
变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析 2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析 2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析
3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析
七、回归分析
1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 2)配对的情况:用条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
八、生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)
1.用Kaplan-Meier方法估计生存曲线 2.大样本时,可以寿命表方法估计
3.单因素可以用Log-rank比较两条或多条生存曲线 4.多个因素时,可以作多重的Cox回归
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
一、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2.四格表资料
1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数
3)n£40或存在理论数
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验
4.R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验
2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、Poisson分布资料 1.单样本资料与总体比较:
1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。
配对设计或随机区组设计
四、两组或多组计量资料的比较 1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验 2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析 1.四格表资料
1)b+c>40,则用McNemar配对c2检验或配对边际c2检验 2)b+c£40,则用二项分布确切概率法检验 2.C×C表资料:
1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验
变量之间的关联性分析
六、两个变量之间的关联性分析 1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析 2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析 2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析
3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析
七、回归分析
1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。
2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 2)配对的情况:用条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
医学统计常见资料统计方法归类
计量资料:
一、统计描述: frequencies(均数、中位数、4分位间距)
二、统计推断:t
1.t检验: 适用于两计量数据间平均水平的比较(compaire means)
1)一个样本和一个总体比较:单个样本t检验One Sample T Test
2)两个样本:
(1)完全随机分组—成组资料比较:两独立样本t检验(Independent Sample T Test)要求:样本来自正态总体、方差齐
(2)配对设计的两样本资料:配对t检验(Paired Sample T Test)往往是:A)治疗前后数据比较
B)同一个样本用两种不同方法处理后的数据间比较
2.方差分析:适用于两个及两个以上计量数据间平均水平的比较(compaire means)
1)单因素的方差分析:往往是随机分组的多个均数间比较One-Way ANOVA
2)双因素方差分析:除了组别因素外还有配伍因素(用SPSS中一般线性模型)
3.非参数检验:适用于资料总体分布类型不清,或者偏态资料,或者方差不齐的情况下
比较计量资料间总体分布的差异。(nonparametric tests)
1)配对计量资料:两相关样本非参数(秩和)检验2 –related sample test
2)成组的两样本资料两独立样本非参数(秩和)检验2-independent sample test
3)多组资料的比较多个独立样本非参数(秩和)检验 K-independent sample test
计数资料:
卡方检验:适用于两个率或构成比间以及多个率或构成比间比较
1. 四格表卡方检验:两个率或构成比间比较差异(descriptive statistics--crosstabs)
1)非校正卡方:条件:n>40 , T>5Pearson Chi-Square
2)校正卡方 :条件:n>40 , 1
3)确切概率计算卡方:条件:n
4)配对资料卡方:条件:配对设计的资料McNemar Test
2.行列表卡方检验:
1)条件:少于1/5的格子的理论数小于5Pearson Chi-Square
2)若不满足以上条件:可以(1)增加样本含量(2)合理合并(3)删除该行或列
3)卡方分割:
等级资料:
非参数检验:
成组的两样本资料两独立样本非参数(秩和)检验
多组资料的比较多个独立样本非参数(秩和)检验
双变量计量资料: 相关回归分析(一元回归、相关X与Y的问题)
生存随访资料:生存分析 1)大样本:寿命表2)小样本:LogRank Test
计量资料:
一、描述性分析
集中趋势:对称——算术均数偏态——中位数等比——几何均数 离散趋势:对称——方差、标准差偏态——四分位数间距
均数悬殊或单位不同的资料比较——变异系数
二、统计推断(根据样本推断总体)1.参数(均数)估计总体方差未知——总体方差已知——
参考值范围:单双侧正态分布——
XuS
(xt/2v
snsn,xt/2v
s
sn))
(xu/2,xu/2
n
XuSXuS
偏态分布——百分位数法
二者的含义、用途 2.假设检验
(1)均数的比较(正态)
单个样本、配对(与两独立样本的区别)两样本(方差齐——t检验
方差不齐——校正t检验或秩和检验或变量转换)多样本:方差齐完全随机设计方差分析随机区组设计方差分析
方差不齐——秩和检验或变量转换
非正态:秩和检验或变量转换
F—+—>t
两两比较:SNK任两个对比
LSD一对或几对比较
Dunnet 实验与对照组比较
t——>FF=t
2(2)方差比较
两个方差:F检验(正态)
多个方差:Bartlett(正态)
Levene检验
假设检验注意事项
计数资料
一、描述性分析
频率或严重程度——率
比重或构成——构成比
一指标为另一指标的若干倍或百分比——相对比
应用注意:不能以比代率、可比性、样本率不能直接对比
率或构成比比较:
1.若某因素内部构成不同并且影响比较,进行标化
二、统计推断
1.参数估计
二项分布率的估计:查表或正态法
泊松分布均数估计:查表或正态法
2.假设检验
单个样本率:直接法或二项分布U检验泊松分布U检验(率很小)两样本率的比较:四格表2检验(校正)
二项分布U检验(n大、np>5,n(1-p)>5)
泊松分布U检验((率很小)
精确概率法
多个率或构成比比较:2检验(理论数不能小于1或小于的理论数
不能多于5分1)
两两比较:
任两个对比、实验与对照组比较
等级资料:-----效应比较
秩和检验
两变量关系:
1.定量(计量资料)正态pearson相关 回归
非正态秩相关
2.无序分类定性
3.有序分类定性2检验和列联相关系数
(1)单向有序分组有序、指标无序卡方检验分组无序、指标有序秩和检验
(2)双向有序
属性相同属性不同Kappa检验 线性趋势秩相关
医学统计学名词解释概念总结
医学统计学: 是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。
统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征:
①参数估计:用样本的指标去推断总体相应的指标
②假设检验:由样本的差异推断总体之间是否可能存在的差异
同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。
总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。
随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。
变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0P(A)1。
频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。
随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。
抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。
几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。
《医学统计学名词解释概念总结》全文内容当前网页未完全显示,剩余内容请访问下一页查看。
推荐专题: 医学统计学统计方法总结