一个方程如何表示两条直线.一个方程如何表示两条直线,一般要哪些条件?
来源:学生作业帮助网 编辑:六六作业网 时间:2024/11/27 20:21:53
一个方程如何表示两条直线.一个方程如何表示两条直线,一般要哪些条件?
一个方程如何表示两条直线.
一个方程如何表示两条直线,一般要哪些条件?
一个方程如何表示两条直线.一个方程如何表示两条直线,一般要哪些条件?
(ax+by+c)(mx+ny+k)=0
这就表示ax+by+c=0和mx+ny+k=0两条直线
一个方程只能表示一条直线
第五章 相关与回归
本章重点内容:本章主要讲授相关分析的概念,相关与回归的关系,简单线性回归模型,多元线性回归模型等。难点是讲授相关与回归的关系以及线性回归模型的基本原理。
第一节 相关关系分析的意义和种类
一、相关关系的概念
世界是普通联系的,孤立的现象或事物是不存在的。事物或现象之间的相互联系、相互制约,构成错综复杂的客观世界,构成世界的运动和发展。...
全部展开
第五章 相关与回归
本章重点内容:本章主要讲授相关分析的概念,相关与回归的关系,简单线性回归模型,多元线性回归模型等。难点是讲授相关与回归的关系以及线性回归模型的基本原理。
第一节 相关关系分析的意义和种类
一、相关关系的概念
世界是普通联系的,孤立的现象或事物是不存在的。事物或现象之间的相互联系、相互制约,构成错综复杂的客观世界,构成世界的运动和发展。所有各种现象之间的相互联系都通过数量关系反映出来。
如果进一步加以考察,可以发现,现象之间相互联系可区分为两种不同的类型:
(一)函数关系。它反映着现象之间存在着严密的依存关系,在这种关系中,对于某一变量的一个数值,都有另一变量的确定的值与之对立,如:S=πR2圆的面积S与半径R是函数关系,R值发生变化,则有确定的S值与之对应。在客观世界广泛存在着函数关系。
(二)相关关系。它是指现象之间确实存在的,但关系值不固定的相互依存关系。即对于某一变量的每一个数值,另一变量有若干个数值与之相适应。如:身高1.75米的人可以表现为许多不同的体重;再如,施肥量与亩产之间,一定的施肥量,其亩产数值可能各不相同。之所以发生这种情况,是因为体重、亩产受很多因素的影响。但是很明显施肥量与亩产量之间、身高与体重之间的关系是非常密切的。在各种经济活动和生产过程中,许多经济的、技术的因素之间都存在着这种相关关系。分析这种关系的内在联系和表现形式是统计研究的一项重要任务。
为了进一步理解相关关系,下面说明一下相关关系与其他关系的区别与联系。
相关关系和函数关系有区别。函数关系是指两个变量之间存在着相互依存关系,但是它们的关系值是固定的,而具有相关关系的变量之间关系值是不固定的。相关关系与函数关系也是有联系的,由于有观察或测量误差等原因,函数关系在实质中往往通过相关关系表现出来。
相关关系的因果关系也有区别。从相关关系的内容来讲,有许多是由于因果关系而产生的,如施肥量和亩产量,劳动生产率和成本等,但它也包括互为因果的关系。如身高如体重,生产量和销售量。同时它还包括非直接的因果关系。如:哥哥高,妹妹也高,这产生于同一原因,父母亲的身材比较高。所以相关关系比因果关系的概念要广泛。但是这种关系必须是客观存在的真实的关系。
相关关系是变量之间关系值不确定的相互依存关系,但在一定条件下,变量之间又可能存在着某种确定的函数关系,要找出这种关系要应用统计中的回归分析与相关分析的方法。
回归分析与相关分析的作用主要在于:(1)确定特定变量之间是否存在相关关系,并根据观察资料建立比较合适的回归方程,从而分析变量之间相互关系的密切程度。(2)根据一个或几个变量的数值,预测或控制另一个变量的数值,并且了解这种预测或控制的精确度。(3)在共同影响一个变量的许多变量之间,找出哪些是重要因素,哪些是次要因素。
二、相关关系的种类
(一)按影响因素的多少分为单相关与复相关。
(二)按相关关系的表现形态分为直线相关和曲线相关。
(三)按变量之间相关关系的方向分为正相关与负相关。
(四)按相关的程度分为完全相关、不完全相关和不相关。
三、相关关系分析的主要内容
对现象之间变量关系的研究,统计是从两方面进行的:一方面是研究变量之间关系的紧密程度,并用相关系数或指数来表示,这种研究称为相关分析。另一方面是关于自变量和因变量之间的数量变动关系,并用数学方程表达之,在统计上称为回归分析。相关——回归分析的目的是对相关的密切程度和变化的规律性在数量上加以表现,进而得各种推算和预测。相关与回归分析的主要内容如下:
(一)确定现象之间有无关系及相关关系的表现形式。
(1)根据对客观现象的定性认识。
(2)用列相关表、画相关图或数学解释进行判断。
(二)确定相关关系的密切程度。
(三)关系不密切,就不必重视它,不必花费大量的精力研究它;
(四)对具有比较密切相关的变量进行回归分析,以测定变量之间数量变化上的一般关系。
(五)确定因变量估计值的误差程度,计算估计标准差。
第二节 直线相关的测定
一、相关表和相关图
进行相关分析必须具备若干个自变量与因变量的对应的实际(观察)资料,作为相关分析的原始数据,一般来讲,资料越多越全面,越有利于分析和研究。
(一)简单相关表和相关图
进行相关分析,先要将原始统计资料进行整理。根据总体单位的原始资料,将其中一个变量的数值按一定的顺序排列,同时列出与之对应的其它变量的变量值,这样形成的表格称为相关表。例如
某种棉纱产量与单位成本之间的关系
月份 产量(吨) 单位成本(千元/吨)
1 97 7.2
2 100 7
3 103 6.9
4 109 6.7
5 110 6.5
6 115 6.5
7 108 7.2
8 106 7.2
9 114 6.8
10 118 6.8
从上述相关表可以看出,随着棉纱产量的增加,其单位成本有减少的趋势。
相关图也称散点图,是根据原始数据,在直角坐标中绘制出两个变量相对应的观察值的所有点,从这些点的分布情况观察分析两个变量间的关系,这个图称为相关图。该图表明相关点分布状况,如将上表的资料画在一坐标系中,以x轴代表产量,y轴代表单位成本,各点的分布状况如图,即散点图(相关图)。
从图7—1中10个点的分布情况看,产量越大单位成本越低,点的分布接近一直条线,该直线是从左上角至右下角,即变量之间呈负相关,另外,从图中还可以看出,各点是比较密集的,说明这两个变量之间的相关关系是比较密切的。
(二)分组相关表和相关图
当相关资料包括的对应数值很多时,直接根据两变量各原始值编制相关表、绘制相关图进而计算各相关指标,工作量很大,且相关表会很长,也不方便,相关图也不好绘制,在这种情况下,可编制分组相关表或绘制分组相关图。
分组相关表就是将原始资料进行分组而编制的相关表。根据分组的情况不同,分组表有两种,一是单变量分组表,一是双变量分组表。
1、单变量分组表。
2、双变量分组表。
二、直线相关分析的特点
(一)两个变量是对等关系。
(二)直线相关分析中,只能计算出一个相关系数,相关系数的绝对值在0与1之间,其值大小反映两变量间相关的密切程度。
(三)相关系数有正、负之分。
(四)相关系数计算的资料要求是:相关的两个变量必须是随机的,这也是对等关系的反映。
三、相关系数的测定和应用
通过编制相关表和绘制相关图对现象之间的关系做了初步的了解,关系的密切程度如何,还需计算相关系数。相关系数是说明两个变量之间有无直线相关关系及相关关系密切程度的统计指标。相关系数计算方法有多种,如积差法、等级相关系数、另外还可根据回归方程方差分析来测定相关系数,这里主要介绍积差法和等级相关系数两种方法。
(一)用积差法测定相关系数
其计算公式为:
据此推倒得到以下公式:
从公式中可以看出:(1)γ取正值或负值决定于分子,当分子为正值,得出γ为正,x与y是正相关;当分子为负值,得出γ为负,变量x与y为负相关。(2)γ是一个相对数,不受计量单位的影响,无论x与y的计算单位如何,x与y相关的相关系数只有一个。γ数值有个范围,在+1和-1之间,即-1≤γ≤1。
为判断时有个标准,有人提出了相关关系密切程度的等级,下面介绍一种四级划分法:
|γ|<0.3 弱相关
0.3≤|γ|<0.5 低度相关
0.5≤|γ|<0.8 显著相关
0.8≤|γ|<1 高度相关
按以上标准来判断,计算相关系数的原始资料要比较多,这样关系程度是可以相信的,否则相信的程度会降低,即判断相关关系的起点值要高。
(二)等级相关系数
等级相关也是一种直线相关分析法。这种方法是以变量的等级作为基础计算相关系数的方法。其计算公式如下:
式中:R为等级相关系数
n为样本容量
d为两个变量的等级差数:
等级相关系数R与相关系数γ作用或者说意义相同。
第三节 简单直线回归分析
一、回归分析的概念
相关系数是说明在直线相关条件下两个现象相关的方向和相关的紧密程度,这只是研究相关问题的一个方面,它不能指出两变量相互关系的具体形式,也无法进行数量上的推算。相关分析的另一面,就是要研究变量之间数量变化的一般关系,通常把测定现象之间数量变化上的一般关系所使用的数学方法总称为回归分析法,回归分析能够解决相关系数不能解决的问题。
相关关系是变量之间数量关系不严格不固定的相互依存关系,要找出这种关系数量变化的一般关系值或者平均值,也就是找出这种关系数量变化的一般规则,其方法是配合相应的直线或曲线,这条直线称回归直线方程,曲线称为回归曲线。其中两个变量之间的回归称简单回归,三个变量之间的回归称复回归。由于简单回归分析中的简单直线回归是最基本、也是最常用的分析方法,故本节主要以简单直线回归为主介绍回归分析法。
二、回归分析的特点
(一)两变量中,一个是自变量,一个是因变量。
(二)回归方程不是抽象的数学模型,而是用自变量数值推算因变量数值的根据,必须反映变量之间关系的一般变动情况。
(三)对于没有明显因果关系的两个变量,可以确定两个不能互相替代的回归方程,一是以x为自变量,以y为因变量的回归直线方程;另一是以x为因变量,以y为自变量的回归直线方程,这两条回归直线方程斜率不同,意义不同。需要注意的是,一个回归方程只能作出一种推算,即只能根据自变量的取值推算因变量的可能值,不能反过来由因变量推算自变量,尽管在数学形式上这样计算是可能的,但在实际意义上却是不允许的。 (四)直线回归方程系数即斜率有正有负,正回归系数表明两变量之间是正相关,负回归系数表明两变量之间是负相关,至于回归系数数值的大小,视原数列使用的计算单位而定,这不能表明两个变量之间的变动程度。
(五)计算回归方程的资料要求是,因变量为随机的,而自变量是给定的数值,求出回归方程后,也是给定自变量值,代入方程中,推算出因变量的一般值或平均数值。
以上为回归分析的特点,下面来分析回归分析与相关分析的区别与联系。
区别主要表现在:
1、相关关系是用来度量变量与变量之间关系的紧密程度的一种方法,在本质上只是对客观存在的关系的测度。回归分析是根据所拟合的回归方程研究自变量与因变量一般关系值的方法,可由已给定的自变量数值来推算因变量的数值,它具有推理的性质。 2、在研究相关关系时,不需要确定哪个是自变量,哪个是因变量,但回归分析的首要问题就是确定哪个是自变量,哪个是因变量。
3、现象之间的相关关系的研究,只能计算一个相关系数;而回归分析时回归系数可能有两个,也就是两现象互为因果关系时,可以确定两个独立回归方程,从而就有两不同的回归系数。
联系表现为:
两者是相辅相成的,由相关分析法测定的变量之间相关的密切程度,对是否有必要进行回归分析以及进行回归分析意义的大小起着决定的作用,相关程度大,进行回归分析的意义也大,相关程度小,进行回归分析的意义就小,甚至没有必要进行回归分析。同时,相关系数还是检验回归系数的标准,回归分析的结果也可以推算相关系数。因此,相关分析与回归分析是相互补充密切联系的,相关分析需要回归分析来表明现象数量关系的具体形式,而回归分析则应建立在相关分析的基础上。
三、简单直线回归方程的建立和求解
两个变量的相关关系最简单的形式就是直线相关,其直线方程称为一元一次方程。即:
y=a+bx
式中,y为因变量,x为自变量,a与b是特定参数。a为直线的截距,b为直线斜率又称回归系数。参数a、b的确定方法有随手画法、最小平方法,统计中使用最多的是最小平方法,用这种方程求出的回归直线方程是原资料的最适合的方程,也就是这条直线是代表x与y之间关系最优的一条直线。
若用(x,y)表求几对观察值,yc为估计值,则拟合的回归直线方程的形式为:
yc=a+bx
用最小平方法求回归直线,就是要使观察值y与估计值yc的离差平方和最小,即直线的误差平方和最小,也就是Q需要取最小值,来确定参数a和b。即:
Q=∑(y-a-bx)2=最小值
得到
解出参数a、b,并代入回归直线方程,得到一个确定的回归直线方程。该回归直线方程的意义是,自变量每增加1各单位,因变量平均变动b个单位。
回归直线的特征:
1、回归直线是一条平均线
2、观察值与回归值之差的平方和最小,即∑(y-yc)2取最小值。
3、观察值y与回归值yc之差的和为零,即∑(y-yc)=0
4、回归直线yc=a+bx必定经过x与y的交点即点(x,y) y=a+bx。
5、回归直线的走向由b决定。
当b>0,直线走向是由左下角至右上角,两变量为线性正相关;
当b<0,直线走向是由左上角至右下角,两变量为线性负相关;
当b=0,直线平行于x轴,说明x与y之间无线性相关关系。
不难看出,直线回归方程中的回归系数与相关系数的符号是一致的,它们都能判断两变量线性相关的方向,但相关的密切程度则只能由相关系数值判断。同时,还可根据回归系数计算相关系数相关系数。
四、估计标准差
在建立了回归方程后,就可以利用回归方程进行预测。要进行预测,就需首先测定回归估计值的可靠性,计算估计标准差(s),即观察值与估计值之间的标准差。根据回归直线方程,当给定某一特定值(x),就可以推算出y的数值yc=a+bx,但是yc的数值并不就是特定x值所对应的实际值y,因为x与y并不存在函数关系,估计值yc是实际值y之间的平均值,实际值y与yc之间的上下波动。估计值与对应的观察值y之间的离差称为估计误差,这种误差的大小反映回归估计的准确程度,也就是说明回归直线方程代表性的大小,为了说明估计误差,需要从变差的分析开始。
(一)离平方和的分解
在直线回归中,观察值y的取值大小是上下波动的,但这种波动总是围绕其均值而在一定范围内,统计上将y取值的这种波动现象称为变差,这种变差的产生是由两方面原因引起的:
(1)受自变量变动的影响。(2)其他因素(随即因素)的影响,为了分析这两个方面的影响,需要对总的变差进行分解。
总平方和(总变差)=剩余平方和(剩余变差)+回归平方和(回归变差)(二)估计标准差的计算
回归标准差是观察值y对估计值yc的平均离差,就直线回归来说,这个离差值愈小,则所有观察点愈靠近回归直线即关系愈密切;而当离差的值愈大,则所有观察点离回归直线愈远,即愈不密切。可见这个指标是从另一侧面反映关系的密切程度的。
剩余标准差是以回归直线为中心反映各观察值与估计值平均数之间离差程度的大小,从另一方面看,也就是反映着估计值平均数yc的代表性的可靠程度,通常剩余变差也称为估计标准误差。
估计标准误差的计算有两种方法:
公式中Syx代表估计标准误差,即x为自变量,y为因变量时的估计标准误差。
此种方法在计算时运算量比较大的,也比较麻烦,需计算出所有的估计值。如果已经有了直线回归方程的参数值,用下面方法计算。
五、运用回归方程分析时注意的问题
用回归方程分析变量之间的变动关系,是一种科学的方法,在计算和应用时,应注意如下几点:
(一)在定性分析的基础上进行定量分析,是保证正确运用回归分析的必要条件。
(二)在回归方程中,回归系数的绝对值只能表示自变量与因变量之间的联系程度所用计算单位的大小。
(三)应用回归分析方法进行推算或预测时要注意条件的变化。
(四)注意社会经济现象的复杂性。
(五)在进行回归分析时,最好要与相关分析、估计标准误并同时使用。
收起