名义和有序变量的应用(能否作因变量?能否作自变量?如果能如何处理?)
来源:学生作业帮助网 编辑:六六作业网 时间:2024/12/19 08:16:17
名义和有序变量的应用(能否作因变量?能否作自变量?如果能如何处理?)
名义和有序变量的应用(能否作因变量?能否作自变量?如果能如何处理?)
名义和有序变量的应用(能否作因变量?能否作自变量?如果能如何处理?)
觉得意思差不多:
有序变量就是指可以用具体数字序列来衡量的变量,表示了样本间程度的差别.比如年龄,工资水平,人数之类的.而且也可以用+和-来表示增加或者减少.
名义变量也可以称作“无序变量”或者“虚拟变量”.这些一般是用来表示样本间的属性差别.比如年龄、性别、人种(黑人、白人、黄人).
一般来说,有序变量的数值可以是某个定义下的任意数值.比如工资可以是1000块到10000块,因此,有序变量X=1000,X=1001.X=10000.因此理论上变量X的赋值是1000-10000之间的任意数;而名义变量的值只能是某一定义下的某几个值.比如性别只有男、女之分.那么名义变量D=1,代表男人,D=0,代表女人,因此该变量D只能有这两个值1、0.
那么如何将他们引入回归模型呢?
其实名义变量和有序变量都是可以作为自变量,但据个人了解,只有有序变量能够做因变量.处理的理论我说不太清楚,给你举个例子:
比如,我想要研究CPI受什么因素的影响,例如GDP.如果只考虑有序变量,那么可以建立模型
CPI=C+a*GDP
C是常数项,也就是假定GDP=0时,CPI会是多少;
a是GDP与CPI的相关系数,也就是GDP若变化1个单位,CPI就会变化a个单位.也就是GDP能以什么程度影响CPI.
但这样的模型显然太简单,不可能反应现实情况.那么此时,就可以引入一些名义变量,或者称之为“虚拟变量”.例如设某季度变量为D.
D=0代表第一个季度的情况,也就是1-3月;
D=1代表第二个季度的情况,也就是4-6月;
D=2代表第三个季度的情况,也就是7-9月;
D=3代表第四个季度的情况,也就是10-12月.
现在将变量D引入回归模型,就变成了
CPI=C+a*GDP+b*D
下面把D的赋值分别代入方程:
当D=0时,CPI=C+a*GDP,也就是第一个季度的CPI是这么多;同理,
当D=1时,CPI=C+a*GDP+b,也就是第二个季度的CPI值;
当D=2时,CPI=C+a*GDP+2b,也就是第三个季度的CPI值;
当D=3时,CPI=C+a*GDP+3b,也就是第四个季度的CPI值.
那么,系数b的意思就是除了GDP的影响之外,季度也会对CPI产生影响,而b就是某一个季度,CPI额外增加或减少的值.
在确定了系数的具体数值之后,就可以检验其显著性了,例如t-检验之类的,就不多说了.
以上就是我自己对于这两种变量的定义和应用的理解,