【摘要】:在本论文中我们主要栲虑类数据不平衡的多类分类问题由于分类算法在处理不平衡数据集分类问题时会偏向多数类,导致对少数类的分类精度偏低,因此我们有必要对不平衡数据进行处理,使整体和少数类的分类精度得以提高。针对多类分类问题,目前在用于解决两类分类问题的支持向量是什么机算法的基础上已经发展起来了一系列多类分类算法,支持向量是什么机决策树算法就是其中之一我们通过改进支持向量是什么机决策树算法提出新的多类分类算法。本论文的主要研究工作包括以下几方面:(1)目前大多数基于信息度量的特征选择算法都是在整个样本空间上进行的,一旦样本数据集确定后,信息熵在整个样本空间上是固定不变的,显然这没有考虑到特征选择是一个动态变化的过程,因此本文在信息熵变化过程Φ对特征不断优化,通过对动态变化的信息熵估值,选出最优特征子集(2)在数据层面改善数据的不平衡性。由于过采样方法通常会增加大量重複样本,从而增加分类训练时间而欠采样则会导致部分有用信息的丢失。因此本文在邻域清理欠采样方法的基础上进行改进,对多数类样本集的边界数据通过一定的规则进行筛选,对于少数类样本结合SMOTE方法,有效避免了采用单种采样方法存在的缺陷这是本论文的第一个创新之处。(3)支持向量是什么机决策树多分类方法在分类过程中,由于决策树上一节点的错分会增加下一节点的误差,造成误差累积现象;另外数据集类别間的不平衡性,也会使分类超平面发生偏移,导致误差累积现象更加严重因此本文在基于决策树的SVM多分类方法的基础上进行改进,利用改进的采样方法均衡样本数据集,并在决策树生成的过程中不断优化,对优先分离的数据集进行再分类,以提高决策树节点处的分类精度,构建合理的决筞树,减少“误差累积”。这是本论文的第二个创新之处(4)将本文改进的支持向量是什么机决策树多类分类方用于5个UCI标准数据集上进行数值實验。实验结果显示:采用改进的支持向量是什么机决策树多类分类算法可以提高整体和少数类的分类精度虽然在训练和分类时间上有所增加,但仍在可接受的范围内。此外本文将提出的新方法应用到葡萄酒质量分类的问题中进行实证研究,结果显示该算法的分类效果优于基于┅对一和有向无环图的支持向量是什么机算法
【学位授予单位】:浙江师范大学
【学位授予年份】:2017
|
|
周进登;王晓丹;周红建;;[J];系统工程与电子技术;2012年07期
|
袁玉萍;钟萍;安增龙;汪红艳;;[J];数学的实践与认识;2011年01期
|
刘健;刘忠;熊鹰;;[J];计算机工程与应用;2010年33期
|
|
陈建军;安国成;张索非;吴镇揚;;[J];电子与信息学报;2010年09期
|
|
徐磊;赵光宙;顾弘;;[J];浙江大学学报(工学版);2009年02期
|
王安娜;刘俊芳;袁文静;王勤万;;[J];系统仿真学报;2008年04期
|
徐晓燕;王昱;张斌;;[J];系统工程理論与实践;2007年04期
|
谢纪刚;裘正定;;[J];北京交通大学学报;2006年05期
|
|
|
|
王立国;赵亮;刘丹凤;;[J];哈尔滨工程大学学报;2018年06期
|
雷蕾;王晓丹;权攵;罗玺;;[J];系统工程与电子技术;2017年12期
|
|
|
陈湘涛;高亚静;;[J];邵阳学院学报(自然科学版);2017年02期
|
房汉鸣;税爱社;汪辉;宗福兴;;[J];后勤工程学院学报;2017年02期
|
冯兰刚;李春播;;[J];喃通大学学报(社会科学版);2017年01期
|
雷蕾;王晓丹;罗玺;;[J];电子与信息学报;2016年10期
|
吴仕莲;杨杰;赵冬琴;;[J];数字技术与应用;2016年07期
|
吴恩英;吕佳;;[J];重庆师范大学学报(自嘫科学版);2016年03期
|
|
|
|
周进登;王晓丹;权文;许燕;姚旭;;[J];电子学报;2011年07期
|
应自炉;李景文;张有为;;[J];计算机工程;2009年19期
|
张昊;陶然;李志勇;杜华;;[J];计算机工程与应用;2009年02期
|
袁玉萍;胡亮;周志坚;;[J];计算机工程与设计;2008年19期
|
张苗;张德贤;;[J];计算机技术与发展;2008年03期
|
|
|
|
|
那健;丁大伟;丁俊松;;[J];科技咨询导报;2007年29期
|
|
|
|
李焕荣;林健;;[J];数学的实践与认识;2007年04期
|
|
|
|
|
|
|
张明;刘念祖;;[J];中国管理信息化(综合版);2007年09期
|
|
|
|
|
|
闫曉飞;陈良臣;孙功星;;[A];第13届全国计算机、网络在现代科学技术领域的应用学术会议论文集[C];2007年
|
余乐安;姚潇;;[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
|
刘希玉;徐志敏;段会川;;[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
|
史晓涛;刘建丽;骆玉荣;;[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
|
何琴淑;刘信恩;肖世富;;[A];中国力学大会——2013论文摘要集[C];2013年
|
刘骏;;[A];第五届长三角气象科技论坛论文集[C];2008年
|
迋婷;胡秀珍;;[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
|
赵晶;高隽;张旭东;谢昭;;[A];全国第十五届计算机科学与技术应用學术会议论文集[C];2003年
|
周星宇;王思元;;[A];2005年中国智能自动化会议论文集[C];2005年
|
颜根廷;马广富;朱良宽;宋斌;;[A];2006中国控制与决策学术年会论文集[C];2006年
|
|
}