抽样误差与标准差的联系与区别急
来源:学生作业帮助网 编辑:六六作业网 时间:2024/11/24 18:46:29
抽样误差与标准差的联系与区别急
抽样误差与标准差的联系与区别
急
抽样误差与标准差的联系与区别急
标准误差(Standard error)
在相同测量条件下进行的测量称为等精度测量,例如在同样的条件下,用同一个游标卡尺测量铜棒的直径若干次,这就是等精度测量.对于等精度测量来说,还有一种更好的表示误差的方法,就是标准误差.
抽样误差
是指由于随机抽样的偶然周素使样本各单位的结构对总体各单位结构的代表性差别,而引起的抽样指标和全及指标之间的绝对离差.如抽样平均数与总体平均数的绝对离差,抽样成数与总体成数的绝对离差等等.
1 标准差
标准差(S 或SD) ,是用来反映变异程度,当两组观察值
在单位相同、均数相近的情况下,标准差越大,说明观察值间
的变异程度越大.即观察值围绕均数的分布较离散,均数的
代表性较差.反之,标准差越小,表明观察值间的变异较小,
观察值围绕均数的分布较密集,均数的代表性较好.在医学
研究中,对于标准差的大小,原则上应该控制在均值的12 %
以内,如果标准差过大,将直接影响研究的准确性.
数理统计表明,在标准正态分布曲线下的面积是有规律
性的,根据这一规律,人们经常用均数加减标准差来计算样
本观察值数量的理论分布,并以此来鉴定样本的代表性.
即: x ±110 s 表示68127 %的观察值在此范围之内; x ±
1196 s 表示95 %的观察值在此范围内; x ±2158 s 表示
99 %的观察值在此范围内.
如果取得的样本资料的实际分布与理论分布非常接近,
证明该样本具有代表性.反之,则需要重新修正抽样方法或
样本含量.x ±1196 s 是确定正常值的方法,经常在工作中被
采用,也称为95 %正常值范围.
2 标准误
标准误( Sx 或S E ) ,是样本均数的抽样误差.在实际工
作中,我们无法直接了解研究对象的总体情况,经常采用随
机抽样的方法,取得所需要的指标,即样本指标.样本指标
与总体指标之间存在的差别,称为抽样误差,其大小通常用
均数的标准误来表示.
数理统计证明,标准误的大小与标准差成正比,而与样
本含量( n ) 的平分根成反比,即: Sx = S/ n 这就是标准误
的计算方法.
抽样研究的目的之一,是用样本指标来估计总体指标.
例如:用样本均数来估计总体均数.由于两者间存在抽样误
差,且不同的样本可能得到不同的估计值,因此,常用“区间
估计”的方法,来估计总体均数的范围.即: X ±1196 Sx 表
示总体均数的95 %可信区间; X ±2158 Sx 表示总体均数的
99 %可信区间.
95 %可信区间指的是:在X ±1196 Sx 范围中,包括总体
均数的可能性为95 % ,也就是说,在100 次抽样估计中,可能
有95 次正确(包括总体均数) ,有5 次错误(不包括总体均
数) .99 %可信区间也是这个道理,只是包括的范围更大.
在实际工作中,由于抽取的样本较小,不呈标准正态分
布( u 分布) ,而遵从t 分布,所以常用t 值代替1196 或2158.
可在t 值表上查出不同自由度( n ′) 下、不同界值时的t 值.
可见到自由度越小, t 值越大,当自由度逐渐增大时, t 值也
逐渐接近1196 或2158 ,当n ′= ∞时, t 值就完全被其代替
了.所以,我们常用X ± t 0105 Sx 表示总体均数的95 %可
信区间,用x ± t 0101 Sx 表示总体均数的99 %可信区间.
综上所述,标准差与标准误尽管都是反映变异程度的指
标,但这是两个不同的统计学概念.标准差描述的是样本中
各观察值间的变异程度,而标准误表示每个样本均数间的变
异程度,描述样本均数的抽样误差,即样本均数与总体均数
的接近程度,也可以称为样本均数的标准差.二者不可混
淆.
由此可见,在众多的医刊上出现的x ±s 的表示方法是
错误的.原因就是混淆了二者的概念.当两样本均数进行
比较时,正确的用法应该是x ±t0105( n′) Sx .
标准差是对总体而言的,抽样误差是对抽样样本而言的!只要抽样的样本足够大,抽样误差就会很接近标准差,在现实处理时,常常由于总体巨大,因而用抽样误差来代替标准差!
简单来说就是误差越大 标准差的值越大 反之亦然
标准差是所有差值中最接近正确值的数,可以说是整体而言的,而抽样误差是由于考虑的不全面,出现的误差,也可以说是对部分样本而言…