数学建模中同样的指标有些对象没有给指标怎么办数学建模处理数据时,所提供数据中(excel)有些指标,有的对象有,有的没有(格子中就一个“.”),怎么处理?
来源:学生作业帮助网 编辑:六六作业网 时间:2025/01/21 17:49:38
数学建模中同样的指标有些对象没有给指标怎么办数学建模处理数据时,所提供数据中(excel)有些指标,有的对象有,有的没有(格子中就一个“.”),怎么处理?
数学建模中同样的指标有些对象没有给指标怎么办
数学建模处理数据时,所提供数据中(excel)有些指标,有的对象有,有的没有(格子中就一个“.”),怎么处理?
数学建模中同样的指标有些对象没有给指标怎么办数学建模处理数据时,所提供数据中(excel)有些指标,有的对象有,有的没有(格子中就一个“.”),怎么处理?
先给你一篇想要哪方面的建模论文我都有
一、问题重述
学科的水平、地位是高等学校的一个重要指标,而学科间水平的评价对于学科的发展有着重要的作用,它可以使得各学科能更加深入的了解本学科(与其他学科相比较)的地位及不足之处,可以更好的促进该学科的发展.因此,如何给出合理的学科评价体系或模型一直是学科发展研究的热点问题.现有某大学(科研与教学并重型高校)的13个学科在一段时期内的调查数据,包括各种建设成效数据和前期投入的数据.
1、根据已给数据建立学科评价模型,要求必要的数据分析及建模过程.
2、模型分析,给出建立模型的适用性、合理性分析.
3、假设数据来自于某科研型或教学型高校,请给出相应的学科评价模型.
二、问题假设
1、学科评价不受国家政策、地方政府导向等宏观调控的影响.
2、学科的实力、地位短期内不会因突发状况而产生骤变.
3、题目所给的13个学科的调查数据准确可靠,能反映不同学科的真实情况.
三、符号说明
:第i项评价指标( );
:重要程度比对值;
:权重向量;
:判断矩阵的最大特征根;
:误差值矩阵;
:评价指标的熵权值;
:误判系数;
:学科间指标的相差系数;
: 标准化的数据矩阵.
四、问题分析
本题为学科综合评价的问题.题中分别给出了评价教学与科研的各学科的指标与数据,为快速准确的评判各学科间的差别,需建立评价模型来量化分析.
问题一,题目要求建立学科综合评价模型.为解决这一综合评价问题,在评价指标确定的情况下,考虑到每张表的指标均存在分项目,且分项有的重要性明显不同,有的则没有明显的重要性区分,各指标间的相关性也不高,故每张表运用相应的权值计算方法计算分项目的权值,各学科每一指标的权值取分项目的加权代数和.综合评价时,运用熵权理想解法给出各指标的权值,再计算各学科的总分值,即可依此对各学科进行排序.
问题二,是对问题一中给出的模型进行适用性与合理性的分析.考虑此模型适用性等效于模型稳定性,故运用刀切法对评价指标进行交叉确认评判,将模型的适用性量化成数值以作精确评判.模型的合理性需额外给出几项指标,通过对比分析,确定模型各指标给出的权值的合理性.
问题三,是建立当此学科数据均来自于某科研型或教学型高校时的综合评价模型.由于不同类型高校的评价指标权重不同,采用因子分析法得出代表科研的因子和教学的因子,在问题一模型的基础上,改变因子在不同类型高校模型的得分,得到基于问题一对比模型的新学科排名.
五、模型建立与求解
5.1 评价模型的建立与求解
该题给出了八项指标(如图1所示),在处理8个不同指标时,由于各个指标的性质不同,故采取不同处理方式.
综合评价指标体系 图1
5.1.1 学科建设情况指标A
学科建设情况有一级学科国家重点学科、二级学科国家重点学科、博士学位授权点、硕士学位授权点四个二级指标,不同指标对学科建设情况的影响程度不同,权重也各不相同,而且有不同的实际含义.以此我们可以用综合模糊评判方法对各学科的学科建设情况给出一个综合评估方案.
根据问题的实际情况,并通过查询相关资料,我们知道一级国家重点学科比二级国家重点学科的评定更难,博士学位授权也比硕士学位授权重要,我们对其赋予不同的权值.得出各级指标及其权值,如表1:
表1 各级因素及其权值
主要因素 二级因素 权重 模糊矩阵 三级因素 权重
学科建设情况 A1国家重点学科建设 a1=0.6 RA1 一级国家重点学科(A11) 0.65
二级国家重点学科(A22) 0.35
A2学位授权情况 a2=0.4 RA2 博士学位授权点A21 0.7
硕士学位授权点A22 0.3
因为影响学科建设情况的有国家重点学科建设(A1)和学位授权情况(A2)两个二级因素和四个三级因素.我们用每个三级因素数目占总数目的百分比组成每个二级因素的模糊评判矩阵Ra1,RA2.
我们拿学科a1为例
RA1={}
RA2
同理可出其他各学科的学科建设情况综合评价指标.D2,D3.D13
得学科建设情况的评价指标向量:
A=(D1D2 …..D13)
=
5.1.2 获教学奖情况指标 :
教学奖分为国家级和省级两个等级,且明显国家级奖项比省级奖项重要得多,查询资料知,每年国家颁发的国家级和省级教学奖的数量比大约为1:8,因此确定国家级奖项和省级奖项权重为8:1,所以用各级获奖数与其权重相乘之后的和来作为获教学奖评价指标 ,结果如表3:
表3 学科教学奖指标
学科代号 a1 a2 a3 a4 a5 a6 a7
教学奖指标Z2 14 11 1 0 13 3 11
学科代号 a8 a9 a10 a11 a12 a13
教学奖指标Z2 16 1 4 0 24 18
5.1.3 获科研经费指标
国家级、省级、其它、横向经费分别为 、 、 、 ,各项经费之和为总经费 ,结果如表4.
表4 学科获科研总经费
学科代号 a1 a2 a3 a4 a5 a6 a7
总经费(万元) 23916 18943 7201 3088 12657 3379 29506
学科代号 a8 a9 a10 a11 a12 a13
总经费(万元) 6240 3254 1307 449 971 672
总经费 与国家级经费 的相关系数为:
求得:
检验:
查表可知:显著性水平为5%,自由度为11的t临界值为:2.145,上式中的t值大于2.145,因此, r通过显著性检验.分别计算总经费与其他各项经费的相关系数 、 、 .所以总经费和其他各项的相关性显著.为简化数据,用总的科研经费来衡量各学科所获科研经费的情况,即 .
5.1.4 获科研成果奖情况指标
科研成果奖分为国家级、部级和省级三个等级,且明显国家级奖项比部级奖项、省级奖项重要得多,部级也要比省级重要,类比教学奖情况的处理方法,确定国家级奖项、部级奖项、省级奖项权重为8:2:1,所以用各级获奖数与其权重相乘之后的和来作为获教学奖评价指标 ,结果如表5:
表5 学科获科研奖指标
学科代号 a1 a2 a3 a4 a5 a6 a7
科研成果奖指标Z4 57 66 17 23 49 8 76
学科代号 a8 a9 a10 a11 a12 a13
科研成果奖指标Z4 63 55 18 52 46 35
5.1.5 队伍建设情况指标
题目给出的有关队伍建设情况的数据种类繁多,经观察发现,除前两项“教授人数”和“副教授人数”为职称外,其他各项均为个人荣誉且数量相对都较少.因此把后八项(b1~b8)相加合为一项.因为“教授”比“副教授”职称等级要高,且个人荣誉属于锦上添花,也存在一人多项荣誉的可能,不能作为主导指标,比重不能太大.之后类比前文学科建设情况指标的处理方法,给出判断矩阵 :
求的权重向量:
同样求出队伍建设情况指标:
5.1.6 科研成果指标
科研成果包括SCI/SSCI、EI、ISTP、CSSCI、政府报告、专利、专注等七项,其中SCI、 EI 、ISTP是世界著名的三大科技文献检索系统,是国际公认的进行科学统计与科学评价的主要检索工具,其中以SCI最为重要,SSCI则是SCI的姐妹篇.CSSCI是我国人文社会科学评价领域的标志性工程,为人文社会科学事业发展与研究提供第一手资料.而政府报告、专利、专著在学术科研成果评价重也占有重要地位.
分析数据可以看出,对于每个学科,由于学科本身的特点所致,科研成果的侧重点不同,比如a1学科的SCI/SSCI、EI、ISTP、专利较多而CSSCI、政府报告、专著则较少,而学科a13的SCI/SSCI、EI、ISTP、专利较少而CSSCI、政府报告、专著则较多.为简化数据,对每种科研成果等同看待,但是由数据明显看出SCI/SSCI与专著数量相差很大,单纯累加必然会减少专著数量对科研成果的贡献率,因此进行规范化处理再相加作为科研成果指标:
具体结果如表6:
表6 学科科研成果指标
学科代号 a1 a2 a3 a4 a5 a6 a7
科研成果指标Z6 4.048 2.465 0.703 0.719 0.945 0.974 2.069
学科代号 a8 a9 a10 a11 a12 a13
科研成果指标Z6 1.312 2.830 1.725 1.023 1.501 1.220
5.1.7 人才培养情况指标
因为有关人才培养情况给出了各学科博士、硕士、博士后的人数,且博士后的学识水平明显高于博士,博士高于硕士.因此类比前文给出的利用判断矩阵确定权重的方法来得人才培养情况指标 :
判断矩阵 :
求得权重向量为:
同样求的人才培养情况指标:
5.1.8 前期投入资金
前期投入资金是对各科最初实力、地位、受重视程度的体现,也一定程度影响了学科后来的发展情况,因此在对学科进行评价时,也把前期投入资金作为一项衡量的指标 .
综合数据处理,得到8项指标情况.如表7
表7 学科各项指标汇总
学科 学科建设 所获教学奖 所获科研经费 所获科研奖 队伍
建设 科研成果 人才
培养 前期投入资金
a1 2 14 23916 57 81 4.048 261 4689
a2 4.534 11 18943 66 72.75 2.465 310 5123
a3 2.639 1 7201 17 38.25 0.703 53 1876
a4 1.917 0 3088 23 17.25 0.719 127 1234
a5 3.914 13 12657 49 30.5 0.945 62 1345
a6 1.617 3 3379 8 27.25 0.974 114 987
a7 8.181 11 29506 76 104 2.069 287 1070
a8 4.388 16 6240 63 32.75 1.312 222 792
a9 4.812 1 3254 55 35.5 2.830 216 450
a10 2.967 4 1307 18 19 1.725 115 360
a11 3.038 0 449 52 15 1.023 112 362
a12 3.677 24 971 46 20.5 1.511 162 370
a13 1.782 18 672 35 18.5 1.220 183 460
5.1.9 运用基于熵权法的理想解法求出各学科之间的比较,建立数学模型
已求得八项指标中各学科的比较情况,根据题目要求,需要得到的是学科之间的比较,在并没有给出各指标权重的情况下,指标中数据的差异程度就显得尤为重要,所以,采用熵权法来构建每一个指标的权重,而后再利用理想解法求得各个学科的综合比较情况.以下是具体步骤:
Step1:对原始评价矩阵进行规范化处理.由于不同指标的量纲各不相同,因此首先对原始评价矩阵 (其中 表示有13个学科, 表示有8个指标, 表示第 个学科在第 个指标中的权值)进行规范化处理,而且根据分析,可以看出各个指标都是效益型指标,也就是说各指标中的数据都与学科的水平正相关,所以可以采用下述规范化公式将原始评价矩阵 转化成 .
规范化公式:
Step2:对规范化矩阵进行归一化处理.利用公式
Step3:计算各个指标的熵.在有 个评价对象、 个评价指标的问题中,第 个评价指标的熵定义为:
由于存在对数,所以要求归一化矩阵中所有项都必须大于0,然而归一化矩阵中确存在数值为0的项,因此假设当 时, .
Step4:计算评价指标的熵权.公式为:
求得熵权结果为:
指标的熵越大,其熵权越小,该指标越不重要,而且满足 和 .熵权并非反映指标在实际意义上的重要性,而是在评估中的相对重要性,它反映的是当给定被评价对象集后各种评价指标值确定情况下,各指标在比较上的相对激烈程度.
Step5:构造加权规范化评价矩阵.公式为:
Step6: 计算正理想解和负理想解的指标加权评价值集合.
Step7:用欧式距离来计算各学科在所有指标中总的接近度系数并排序.
欧式距离公式:
,
,
接近度系数计算公式:
,
最后将该系数作为学科综合评价指标 对各学科进行排序,结果如表8为:
表8 学科综合评价指标
排名 1 2 3 4 5 6 7 8 9 10 11 12 13
学科代号 a1 a7 a2 a5 a12 a8 a13 a3 a9 a6 a4 a10 a11
评价指标 0.88 0.74 0.67 0.33 0.32 0.3 0.2 0.1 0.04 0.02 0.0142 0.0141 0.01
5.2 评价模型的分析
5.2.1 模型的适用性分析
建立模型的目的是对综合学科的好坏进行量化打分.考虑到题目给出教学与科研的各项指标数据,适用性在此处不对模型评价指标的范围不同的情况下进行分析,而是当数据与指标出现错误或是缺失时此模型仍然能给出比较正确的分数,并且误差在一个允许的范围内,则能说明此模型的适用性好.
适用性的判断通常使用指标的误判概率Pw来衡量,这里运用刀切法来处理.其基本思想是每次剔除评价指标中的一个数据,利用其容量为m*n-1的评价指标样本建立判别准则(或判别函数),再用所建立的判别准则对删除的那个样品作判别.对评价指标中的每个样本重复上述步骤,以其误判的比例作为误判概率的估计,若误判比例在一个可以允许的范围内,则可以承认其适用性,比例越小,适用性越好.
在求出各学科八个指标的比较情况(如表7)后,对其进行归一化处理.处理后为一个其数值构成一个 的矩阵,对其进行刀切法处理.具体的刀切算法如下:(取数据构成矩阵 )
:从总体G1的容量为 的训练样本开始,用经平均化处理的数据替换其中的一个 样品,对新的容量为 的矩阵进行判别,取所得的列向量中与该样本相对应的值.
:将上一步的值与未替换时的判别值做差,差值的绝对值对应放入容量为 的新矩阵 .
:重复步骤 与 ,直到G1的训练样本中的m*n个样品依次被替换与判别,新矩阵 则为误差值矩阵.
考虑到题目中给出的各学科每一指标的数据只有一个,为防止数据缺失对排序产生影响过大,一般采用填充同级数据的平均值来处理.故此处不做删除处理,而是采用这一指标的其他数据项的平均值来替换.此处的判别方法即为模型中给出的熵权理想解法.
某学科一个指标的值出现错误,将会影响整体的排名情况,故在此处对列向量作归一化处理,所对应的值即能反映错误对整个排名的影响情况.
所得的误差矩阵如表9:
表9 指标误差矩阵
学科 学科建设 所获教学奖 所获经费 所获科研奖 队伍建设 科研成果 人才培养 前期投入资金
a1 0.0024 0.0281 0.0865 0.005 0.0105 0.0075 0.005 0.0388
a2 0.0326 0.0453 0.1085 0.0342 0.0397 0.0342 0.0343 0.0624
a3 0.0005 0.0209 0.0041 0.0009 0.0006 0.0001 0.0001 0.0059
a4 0 0.0131 0.0114 0.001 0.0009 0.0003 0.0003 0.0002
a5 0.0064 0.0175 0.0198 0.0059 0.0088 0.0086 0.0092 0.0063
a6 0.0003 0.0137 0.0126 0.0008 0.001 0.0006 0.0007 0.0018
a7 0.0104 0.0031 0.1023 0.0103 0.0044 0.0117 0.0114 0.0167
a8 0.0054 0.0324 0.0187 0.0031 0.0071 0.0067 0.0047 0.0122
a9 0.0002 0.0168 0.0138 0.0006 0.0012 0.0016 0.0001 0.0041
a10 0.0005 0.0113 0.0138 0.0016 0.0014 0.0002 0.0009 0.003
a11 0.0003 0.0112 0.011 0.0007 0.001 0.0006 0.0008 0.0025
a12 0.0059 0.0642 0.0425 0.0058 0.0084 0.0062 0.0061 0.0144
a13 0.0047 0.0378 0.0378 0.0049 0.0065 0.0047 0.0039 0.0106
经过对一样本容量为500的标准矩阵作随机判别,计算对比得知误差系数在0.05为正常误差范围.
运用matlab命令find(S>=0.05)得到超出误差系数的相关项如表10:
表10 超出误差系数相关项
0.0642 0.0865 0.1085 0.1023 0.0624
运用误判比例公式 , 表示样本矩阵中超出误差系数的样本个数, 表示样本总容量.
易得其貌似误判率 .就此例情况,上述判别指标还是比较好的,即表明此模型的适用性好.