1集中趋势的测度
集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势就是确定数据一般水平的代表值或中心值。常用三个指标:
(1) 众数。是一组数据出现次数最多的变量值。
(2) 中位数。 是一组排序后处于中间位置的变量值,是一组数据的中点,即高于和低于它的数据各占一半。
(3) 均值。 是集中趋势的主要测度值,用于反映一组数值型数据的一般水平。包括算术平均数、调和平均数和几何平均数。
2离散程度的测度
数据的离散程度是数据分布的另一重要特征,它是指各变量远离其中心值的程度,所以也叫离中趋势。离散趋势是经过综合与抽象后对数据一般水平的概括性描述,它对数据的代表性取决于数据的离散程度,离散程度小代表性就好,反之代表性就差。
(1) 极差,也称全距,是一组数据中最大值与最小值之差。极差是描述数据离散程度的最简单方法,表明数据的分布范围。
(2) 平均差,也叫平均离差,是各变量值(Xi)与其均值离差绝对值的平均数:
(3) 方差和标准差
方差是一组数据中各变量值与均值离差平方的平均数。方差的平方根叫标准差。方差与标准差是描述数据分布特征的重要的统计量,它们是反映数值型数据离散程度最主要、最重要的方法。
(09年原题).某产品在5各地区的销售量分别为1500、2000、1000、3000、5000.则该销售量的极差为()
A.1000
B.1500
C.2000
D.4000
答案:D4000.极差是最大值和最小值的差,则5000-1000=4000.
3相关分析
是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。变量之间的相关关系主要有线性相关和非线性相关、正相关和负相关。
(二) 推论统计分析
是在随机抽样的基础上,根据部分资料推断总体的方法,也即利用样本资料对抽出样本的总体作出推论的方法。
1单个样本的参数估计
参数是指总体的某一特征值,如均值、方差等,往往是未知数;而根据样本数据计算出来的均值、样本标准差、样本比例一般称为样本“统计量”。参数估计是根据样本统计量对总体未知参数进行某种估计推断。
(1) 点估计。当总体分布的形式已知,但其中的一个或多个参数未知时,如果从总体中抽取一个样本,用该样本对未知参数做一个数值点的估计,称为参数的点估计。
(2) 区间估计。区间估计是用一个区间估计总体未知参数。
当总体方差已知时,总体均值的区间估计
当总体方差未知时,总体均值的区间估计
2单个样本的假设检验
参数估计和假设检验是统计推断的重要组成部分,它们都是利用样本信息对总体状况作出某种推断,但是推断的角度不同。参数估计是用样本统计量估计总体参数,估计前总体参数是未知的,而假设检验先对总体参数的值提出一个假设,然后利用样本信息,根据抽样分布的原理去检验原先提出的假设是否成立。步骤如下:
(1) 提出原假设和替换假设
(2) 确定并计算检验统计量。
(3) 规定显著性水平α,并确定接受域或拒绝域的临界值。
(4) 作出统计决策
一般来说,总体方差已知,用Z统计量检验;总体方差未知,用t统计量检验。