数据的波动程度 方差比较数据的波动程度大小为什么要用方差呢?为什么是平方的形势?如果用米一个数据与平均值的差的绝对值之和 或者别的什么不可以吗?
来源:学生作业帮助网 编辑:六六作业网 时间:2024/12/20 04:21:33
数据的波动程度 方差比较数据的波动程度大小为什么要用方差呢?为什么是平方的形势?如果用米一个数据与平均值的差的绝对值之和 或者别的什么不可以吗?
数据的波动程度 方差
比较数据的波动程度大小为什么要用方差呢?
为什么是平方的形势?
如果用米一个数据与平均值的差的绝对值之和 或者别的什么不可以吗?
数据的波动程度 方差比较数据的波动程度大小为什么要用方差呢?为什么是平方的形势?如果用米一个数据与平均值的差的绝对值之和 或者别的什么不可以吗?
并不是说用数据与平均值的差的绝对值之和不行,其实实际值与数据期望的差的绝对值的均值也可以度量数据波动,在统计上被称为平均偏差,衡量数据波动的统计量还有极差、四分位差等.各种统计量并没有严格意义上的优劣,要根据具体情况来选用.
之所以经常用方差,一个很重要的原因是,以平方和的形式表示的方差是可导的,公式推导的时候方便一些.平均偏差的表达式由于绝对值的存在,在零点不可导.
——————————————————
采用何种统计量主要取决于数据的分布和统计的目的.平均偏差和方差的一大区别在于对个别偏差较大的值的处理.比如下面两组值:
A:10 10 10 10 10 10 10 10 10 110
B:10 50 10 50 10 50 10 50 10 50
方差:A为1000,B为444
平均偏差:A为180,B为200
如果你认为个别异常数据对数据质量影响较大的话,就选用方差;如果你认为正常数据的波动更有意义就选平均偏差.
其实统计是种很主观的东西,统计量的选择服务于你想要说明的现象.
现代统计学有一个概念叫“稳健”,就是个别异常值对统计量的影响程度,从这个角度来说,平均偏差比方差稳健.
如果不平方,就需要取|xn-x的平均数|,相对来讲操作麻烦些,所以平方了。
就是规定的。你要偏得四次方也能比,麻烦,平方是最简单的偶次幂。
绝对值也可以,但是可能操作上平方更好。其实也是可以的。
采用平方的形式本身就是为了避免负值的产生,和你使用绝对值的道理是一样的。
因为平方形式便可以避免正负抵消的情况。
学了这么多年,觉得方差这个东西繁杂,所得数据也只是个参考罢了。
它用平方是防止正负数之和被抵消
如:1 2 3 4 5
不用平方的话就成0了,实际却不是
如果用绝对值应该也是可行的,至于为什么,估计是属于约定俗成
如果楼主能成为国际数学届领军人物,也许可以改成用绝对值算标准差...
全部展开
学了这么多年,觉得方差这个东西繁杂,所得数据也只是个参考罢了。
它用平方是防止正负数之和被抵消
如:1 2 3 4 5
不用平方的话就成0了,实际却不是
如果用绝对值应该也是可行的,至于为什么,估计是属于约定俗成
如果楼主能成为国际数学届领军人物,也许可以改成用绝对值算标准差
收起