平均数、中位数、众数三个统计量的相同点和不同点是什么?
来源:学生作业帮助网 编辑:六六作业网 时间:2024/11/21 20:41:37
平均数、中位数、众数三个统计量的相同点和不同点是什么?
平均数、中位数、众数三个统计量的相同点和不同点是什么?
平均数、中位数、众数三个统计量的相同点和不同点是什么?
平均数、众数和中位数三个统计量的特点 2009-12-02 17:34:44| 分类: 摘抄 | 标签: |字号大中小 订阅 .
平均数、众数和中位数都是描述一组数据的集中趋势的特征数,但描述的角度和适用范围有所不同,它们有各自的特点.
平均数应用最为广泛,用它作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数据都有关系,能够最为充分地反映这组数据所包含的信息,在进行统计推断时有重要的作用;但容易受到极端数据的影响.即:平均数表示数据的总体水平,但无法表现个体之间的差异
中位数在一组数据的数值排序中处于中间的位置,故其在统计学分析中也常常扮演着“分水岭”的角色,人们由中位数可以对事物的大体趋势进行判断和掌控.中位数则仅与数值排序后中间一个或两个数据有关,当一组数据中有个别偏大或偏小时,可以用它来描述其大体趋势. 即:中位数表示数据的中等水平,但不能代表整体
众数着眼于对各数据出现频数的考察,其大小仅与一组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,它的众数往往是我们关心的一种统计量,用众数表示数据的“集中趋势”比较合适.即:众数表示数据的普遍情况,但没有平均数准确.
平均数的大小与一组数据里的每个数据均有关系,其中任何数据的变动都会相应引起平均数的变动;众数则着眼于对各数据出现的次数的考察,其大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往是我们关心的一种统计量;中位数则仅与数据排列位置有关,当一组数据从小到大排列后,最中间的数据为中位数(偶数个数据的最中间两个的平均数).因此某些数据的变动对它的中位数影响不大.
在同一组数据中,众数、中位数和平均数也各有其特性:
(1)中位数与平均数是唯一存在的,而众数是不唯一的;
(2)众数、中位数和平均数在一般情况下是各不相等,但在特殊情况下也可能相等.
具体来说,平均数、众数和中位数都是描述一组数据的集中趋势的特征数,但描述的角度和适用范围有所不同.平均数的大小与一组数据里的每个数据均有关系,其中任何数据的变动都会引起平均数的相应变动;众数着眼于对各数据出现的频数的考察,其大小只与这组数据中的部分数据有关;中位数则仅与数据的排列位置有关,某些数据的变动对中位数没有影响,当一组数据中的个别数据变动较大时,可用它来描述其集中趋势.
一般来说,平均数、中位数和众数都是一组数据的代表,分别代表这组数据的“一般水平”、“中等水平”和“多数水平”.平均数涉及所有的数据,中位数和众数只涉及部分数据.它们互相之间可以相等也可以不相等,没有固定的大小关系.
其实,它们三者有关联也有区别.在一组数据中出现次数最多的数就是这组数据众数,众数和平均数一样,也是描述一组数据集中趋势的统计量,但它和平均数有以下两点不同:一是平均数只是一个“虚拟”的数,即一组数据的和除以该组数据的个数所得的商,而众数不是“虚拟”的数,是一组数据中出现次数最多的那个数据,是这组数据中真实存在的一个数据;二是平均数的大小与一组数据里的每个数据都有关系,任何一个数据的变动都会引起平均数大小的改变,而众数则仅与一组数据的出现的次数有关,某些数据的变动对众数没有影响,所以在一组数据中,如果个别数据变动较大,但某个数据出现的次数最多,此时用该数据(即众数)表示这组数据的“集中趋势”比较合适.
中位数和平均数一样,也是反映一组数据集中趋势的一个统计量.平均数主要反映一组数据的一般水平,中位数则更好地反映了一组数据的中等水平.它和平均数有以下不同:一是平均数只是一个“虚拟”的数,而中位数并不完全是“虚拟”数,当一组数据有奇数个时,它就是该组数据顺序排列后中间的那个数据,是这组数据中真实存在的一个数据;二是平均数的大小与一组数据里的每个数据都有关系,任何一个数据的变动都会引起平均数大小的改变,而中位数则仅与一组数据的排列位置有关,某些数据的变动对中位数没有影响,所以当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适.
对于一组数据来说,平均数、中位数与众数,三者哪个更具有代表性,要看具体情况而定.
一般来说,平均数比中位数、众数更有可靠性和代表性,但它易受极大或极小两极端数值的影响.当一组数据中有特大或特小两极端数值时,或者一组数据中有个别数据不确切时;或者资料属于等级性质时,用中位数比较合适.当需要快速而粗略地找出一组数据的代表值时,可以用众数.不能简单地给这三种数按代表性来排序,选用哪个数还是要看实际情况和需求.
例 有一组同学的体重分别是31、28、24、29、29、32、50(千克),这组数据的平均数是31.86,中位数是29,众数29.用哪个数表示这组同学的体重更具有代表性?
(1)每个数据都确定,一般就可以用平均数来代表;
(2)从极端数据来看,有24、50两个极端数据,所以也可以用中位数;
(3)众数29,并且也只有2个,虽然与中位数一样,但从选择策略上众数不具有很大的代表性;
(4)如果一定要用哪一个数来代表这组数据,这个问题不够典型,因为它们都有合理的成份;
(5)从统计学上来说,选择中位数和平均数也并非只考虑数据的分布是否对称或者偏斜以及有否极端数据出现,而是要看实际用途.在美国统计学家戴维·S·穆尔的《统计学的世界》中,就专门介绍了一个案例:米德尔敦房屋售价的分布无疑会是右偏的,但是如果该市的市议会为了决定税率,而要估计所有房屋的总市值的时候,那么对他们有帮助的数是平均数而非中位数.因为总市值只不过是房屋总数乘上平均数而已,和中位数并没有什么关系.