卡方检验中的界值是怎么计算出来的?最好能有工公式
来源:学生作业帮助网 编辑:六六作业网 时间:2024/11/24 09:25:51
卡方检验中的界值是怎么计算出来的?最好能有工公式
卡方检验中的界值是怎么计算出来的?
最好能有工公式
卡方检验中的界值是怎么计算出来的?最好能有工公式
虽然你所问的问题已有人问过,并有人回答过,不过我觉得回答的不够完善,至少还有三点需要补充,如果忽略这三点,很可能结果就是错的,或者结果不完整.请看下文.
举例说明吧.相对于不做运动的女子,慢跑或快跑可能会对月经周期产生影响,那这种经期的变化是否会改变她们去咨询医生的频率呢?下面是一组统计数据,记录了三组运动状态的女子是否向医生咨询过经期变化的数据.
Observed (O),观察值
是否向医生询问过
组 是 否 总数
对照 14 40 54
慢跑 9 14 23
快跑 46 42 88
总数 69 96 165
简单点说,就是问,慢跑女子是不是会比不跑步的女子更频繁地向医生询问月经的问题?快跑相对于不跑呢?快跑相对于慢跑呢?
方法如下:
1.计算每行和每列的总数,如上表所示.
2.计算每列的百分比,即询问过的百分比.在165个女子中,有69个询问过医生,即69/165=42%,那么没询问过医生的就是1-42%=58%.
3.如果跑不跑步,都不会影响询问医生的频率,那么这个询问过医生的可能性,42%,将适用于所有的组别,即在对照组的54个人中,我们预期54*42%=22.58个人会去询问医学,而54*58%=31.42个人不会去询问.用同样的方法把慢跑和快跑组是否会去询问医生的人数分别算出,如下表所示.
Expected (E),预期值
是否向医生询问过
组 是 否 总数
对照 22.58 31.42 54
慢跑 9.62 13.38 23
快跑 36.8 51.2 88
总数 69 96 165
4.接下来就是要计算,这个预期值和实际观测到的值之间的区别大不大?是只是因为随机抽样产生的误差,还是具有统计学意义的显著性差异?计算公式如下:
χ2=∑[(O-E)2/E]
O为每个观察值,E为每个预期值
在这个例子中,
χ2=(14-22.58)2/22.58+(40-31.42)+…=9.63
5.计算自由度=(行数-1)*(列数-1)=2
6.查表,自由度为2,p=0.01时的值为9.21,而9.63比9.21大,所以p