第六章 人群健康的研究方法
【考纲要求】
1.基本概念与基本步骤:①统计学几个基本概念;②统计工作的基本步骤。
2.数值变量数据的统计描述:①集中趋势指标;②离散趋势指标;③正态分布的特点、面积分布规律。
3.数值变量数据的统计推断:①均数的抽样误差;②总体均数可信区间及其估计方法;③假设检验的基本步骤;④u检验和t检验;⑤假设检验的两类错误及注意事项。
4.分类变量资料的统计描述:①相对数常用指标及其意义;②相对数应用注意事项。
5.分类变量资料的统计推断:①率的抽样误差、总体率的可信区间及其估计方法;②u检验和χ2X检验。
6.直线相关和回归:①直线相关分析的用途,相关系数及其意义;②直线回归分析的作用,回归系数及其意义。
7.统计表和统计图:①统计表的基本结构和要求;②统计图的选择,制图通则。
【重点复习内容】
1.总体、样本、抽样误差、计量资料、计数资料、概率。
2.样本必须能代表总体,为此要满足两个条件:抽样的随机化和具有足够的样本含量。
3.抽样误差是个体变异造成的,故在抽样研究中抽样误差是不可避免的。
4.统计工作由4个步骤组成:设计、搜索资料、整理资料、分析资料,其中以设计最为重要。因为它的错误无法用以后的步骤加以改变。
5.数值变量频数表能揭示数值变量的分布特征:集中趋势和离散趋势;揭示其频数分布类型,对称分布和偏态分布。描述计量资料集中趋势指标有:①均数:应用于正态分布资料;②几何均数:等比级数资料;③中位数:偏态分布资料,资料一端或两端无确切界限时尤其适用。
6.描述数值变量资料离散趋势的指标。全距和四分位数间距适用于偏态分布资料,对于一端或两端无确切界限时只能用四分位数间距。方差、标准差和变异系数都适用于正态分布资料。对于所比较两组资料单位不同或均数相差悬殊时,应用变异系数。描述离散趋势最常用的指标是标准差。
7.正态分布的特征及曲线下的面积分布规律。对称均数的两侧面积相等。
8.医学参考值范围的各种计算方法,特别注意各种方法适用场合及单、双侧问题。医学所用参考值是95%。
9.标准误的定义意义及与标准差和样本含量的关系。标准误是描述抽样误差大小的指标,标准误大。说明抽样误差大;利用标准误可进行总体均数可信区间估计和假设检验。
10.标准误是描述变量值变异程度大小的。可用来计算标准误、变异系数和医学参考值范围。二者关系:增加样本例数可减少抽样误差。
11.t分布的特征,与标准正态分布--u分布的关系。t分布和u分布都是以0为中心左右两侧完全对称的分布,只是t分布曲线顶端较u分布曲线略低,两尾端上翘。
12.总体均数估计方法,特别是区间估计的计算方法及两要素的关系。总体均数可信区间就是以一定的概率水准估计总体均数所在范围。小样本采用 t分布原理,大样本采用。分布原理进行估计。增加样本例数可减少抽样误差,使估计的区间更可靠。
13.假设检验的基本步骤及每一步骤的注意事项。H0和H1假设都是对总体特征的检验假设。H0总是假设样本差别来自抽样误差,H1是来自非抽样误差,有单双侧之分。选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题,一般计量资料用t检验和检验;计数资料用χ2检验和u检验。
14.各种假设检验方法的适用条件及假设的特点、计算公式、自由度确定以及确定概率P值并做出推断结论。
15.Ⅰ和Ⅱ类错误及两者的关系。拒绝正确的H0称Ⅰ型错误,用α表示;接受错误的H0称Ⅱ型错误。用β表示。α愈大β愈小;反之α愈小β愈大。
16.描述计数资料的常用相对数的意义及应用时的注意事项。率是说明某现象发生强度的。构成比描述事物中各部分所占比重。相对比指两对比指标的对比水平。应用相对数时注意观察例数不能过少,不能犯以比代率的错误。率的比较要注意可比性问题,特别是混杂因素问题。消除混杂因素的影响可采用标准化方法或分层分析方法。
17.描述率的抽样误差大小的指标及计算。率的分布近似正态分布的条件:nπ和n(1-π)均大于 5,或nP和n(1-P)均大于5。两个率的比较采用u检验,亦可采用χ2检验,两者关系为u2=χ2。
18.四格表资料基本数据的构成,一定是相互对立的两组数据。四格表资料自由度永远为1。四格表资料χ2检验的各种公式用适用条件,n>40且每个格子T>5,可用基本公式或专用公式,不用校正。若n>40,但出现只要有一个格子1
19.多个率比较,若χ2>χ2a(v),P<α结论拒绝H0时,只能说明总体率之间没有差别。但不能认为它们彼此之间都有差别。
20.相关系数及回归系数的统计学意义,确定回归方程的原理。相关系数r,描述两随机变量是否具有直乡鞋关系及关系的方向和密切程度。回归系数b,描述变量X每增加一个单位,Y平均改变b个单位。确定直线回归方程的原理是最小二乘法,即保证各实测点至回归直线的纵向距离平方和最小。
21.编制统计表的要求和如何正确选择统计图。
*模拟题点评:本单元是整个预防医学部分的重点和难点,每年均出3~4题。
【模拟*模拟题】
反映无数抽样误差大小的指标是
A.标准误
B.标准差
C.变异系数
D.均数
E.全距
答案:A
2.经过统计得到χ2>χ2 0.05结果,正确的结论是
A.P=0.05,拒绝H 0,差异有统计学意义
B.P>0.05,接受H 0的可能性较大
C.P=0.05,接受H 0,差异无统计学意义
D.P<0.05,拒绝H 0,差异有统计学意义
E.P>0.05,接受H 0,差异无统计学意义
答案:D
3.据下表资料,如果服用两药的血压下降值服从正常分布,能否认为服用这两种降压药后,两血压下降值总体平均数相等,服两药后血压下降的mmHg值
N X S
甲药 30 12.3 2.0
乙药 30 24.0 2.5
A.不能,因为12.3小于24.0
B.需作两样本比较的单侧,检验才能定
C.需作两样本比较的双侧,检验才能定
D.需作两样本比较的单侧u,检验才能定
需作两样本比较的双侧u,检验才能定
答案:C
4.正态分布的数值变量资料,描述离散趋势的指标最好选用
A.全距
B.百分位数
C.方差
D.标准差
E.变异系数
答案:D
5.若不知总体标准差,反映均数抽样误差大小的指标,用
A.S
B.Sx
C.SP
D.σp
E.σx
答案:B