文本聚类算法 python真正能实用的有哪些算法?

基于语义相似度的文本聚类算法的研究--《南京航空航天大学》2007年硕士论文
基于语义相似度的文本聚类算法的研究
【摘要】:
文本聚类在很多文本挖掘和信息检索系统中发挥着重要的作用。这种技术可以改善检索性能、提供导航/浏览机制、发现相似文本等。因此,对文本聚类的研究已成为数据挖掘中一个非常重要的课题。
文本聚类的首要问题是文本数据的数学表示。目前多数文本聚类算法都是以向量空间模型(VSM)为基础的。这种文本表示方法非常简单,但却引发了高维稀疏的问题。而且,基于向量空间模型的聚类算法都没有很好地解决文本数据所特有的两个自然语言问题:近义词和多义词。所有这些问题都极大干扰了文本聚类算法的效率和准确性,使文本聚类的性能下降。尽管人们提出通过向量空间权重调整和降维来解决上述问题,但是这些方法都有自身的缺点。向量空间权重调整法实际上并没有解决以上问题,它只能非常有限地提高文本聚类的性能。降维法虽然解决了高维稀疏问题,但是降维的代价一般都非常大。另外,现有的文本聚类算法大多没有给出聚类描述的方法。
为了避免上述问题的产生,本人采用了一种新的思路,即采用语义相似度作为文本间相似度的度量。为了完善这一思想,本文对文本表示,语义相似度计算以及聚类算法作了深入讨论。提出了一种更利于语义相似度计算的概念列表文本表示法;结合Quillian的联合概念距离计算的方法,提出了文本间语义相似度的计算方法;最后提出了一种基于语义相似度的文本聚类算法—TCUSS算法。TCUSS算法利用语义相似度作为文本间相似度的度量,不仅解决了多义词和近义词的问题,而且不会产生高维稀疏的问题。TCUSS算法以图为基础进行聚类分析,避免了算法对聚簇形状的限制。经实验证明,TCUSS算法比以往的文本聚类算法具有更高的分类正确率。
【关键词】:
【学位授予单位】:南京航空航天大学【学位级别】:硕士【学位授予年份】:2007【分类号】:TP18【目录】:
ABSTRACT5-10
第一章 绪论10-16
1.1 文本聚类的研究背景10-11
1.2 文本聚类概述11-13
1.2.1 文本聚类的定义11
1.2.2 文本聚类的应用11-12
1.2.3 文本聚类面临的挑战12-13
1.2.4 文档聚类的一般过程13
1.3 本文的研究13-14
1.4 论文大纲14-16
第二章 文本数据的数学模型16-27
2.1 文本预处理16-20
2.1.1 分词16-17
2.1.2 词根还原17-18
2.1.3 停用词过滤18-19
2.1.4 英文文本预处理的过程19-20
2.2 文本数据的数学描述20-22
2.2.1 向量空间模型20-21
2.2.2 其它文本数据表示法21-22
2.3 距离计算方法22-24
2.3.1 Minkowski 距离22
2.3.2 Cosine 距离22-23
2.3.3 Pearson 距离23
2.3.4 扩展Jaccard 距离23
2.3.5 Kullback-Leibler(KL)距离23-24
2.4 概念列表表示法24-25
2.5 小结25-27
第三章 语义相似度27-41
3.1 WORDNET :一个词汇数据库27-31
3.1.1 WordNet 简介27-28
3.1.2 名词的语义关系28-31
3.1.2.1 继承关系28-30
3.1.2.2 整体部分关系30
3.1.2.3 反义关系30-31
3.2 概念间语义相似度31-39
3.2.1 相似度的定义31-33
3.2.2 概念(synset)间语义相似度的计算33-39
3.2.2.1 基于节点的方法33-35
3.2.2.2 基于边的方法35-37
3.2.2.3 混合法37-38
3.2.2.4 扩展的混合法38-39
3.3 文本间语义相似的计算39-40
3.4 小结40-41
第四章 基于语义相似度的文本聚类算法41-49
4.1 传统的文本聚类技术41-45
4.1.1 层次凝聚聚类法41-43
4.1.2 平面划分聚类法43-44
4.1.3 神经网络聚类法44-45
4.1.4 基于密度的聚类法45
4.2 一种基于语义相似度的文本聚类算法(TCUSS)(TEXT CLUSTERING USING SEMANTIC SIMILARITY)45-47
4.3 聚簇描述47-48
4.4 小结48-49
第五章 实验和结果49-68
5.1 文本预处理49-54
5.1.1 文本预处理的输入51
5.1.2 分词51-52
5.1.3 停用词过滤和词根还原52
5.1.4 判断是否具有名词词性52-54
5.2 语义相似度计算54-58
5.2.1 WordNet54
5.2.2 WordNet:: QueryData54
5.2.3 Text::Similarity54
5.2.4 WordNet::Similarity54-56
5.2.5 单词间语义相似度的计算56-58
5.2.6 文本间语义相似度的计算58
5.3 聚类算法58-61
5.4 实验61-67
5.4.1 数据集61
5.4.2 实验环境61-62
5.4.3 实验结果62-67
5.4.3.1 单词间语义相似度实验结果与分析62-65
5.4.3.2 聚类算法的实验结果与分析65-67
5.5 小结67-68
第六章 总结68-70
参考文献70-75
在学期间的研究成果及发表的学术论文76
欢迎:、、)
支持CAJ、PDF文件格式
【引证文献】
中国期刊全文数据库
胡艳波;崔新春;路青;;[J];情报科学;2013年07期
中国硕士学位论文全文数据库
黎军;[D];西南大学;2011年
吕斐斐;[D];哈尔滨工业大学;2010年
马军红;[D];西北大学;2011年
解艳;[D];辽宁科技大学;2012年
张妍;[D];东北师范大学;2008年
熊浩勇;[D];武汉理工大学;2008年
贺海波;[D];北京邮电大学;2010年
史忠贤;[D];兰州大学;2013年
【参考文献】
中国期刊全文数据库
高小梅,冯云,冯兴杰;[J];计算机工程;2005年S1期
解冲锋,李 星;[J];软件学报;2002年04期
中国硕士学位论文全文数据库
张猛;[D];东北大学;2005年
【共引文献】
中国期刊全文数据库
华文立;胡学刚;;[J];安徽电子信息职业技术学院学报;2006年04期
李优;;[J];信息安全与技术;2011年06期
高志明,关岩,于洪梅,吴秀红,李井会;[J];鞍山钢铁学院学报;2000年03期
李爱军,罗四维,刘蕴辉,黄华;[J];北京交通大学学报;2005年02期
万春红;邵超;;[J];北京交通大学学报;2009年06期
王宇晖;业宁;沈丽容;;[J];北京交通大学学报;2009年06期
王新军;卿华;姚娇艳;;[J];兵工自动化;2011年10期
冯志新;蔡玉俊;黎振;潘鑫;;[J];北京工业大学学报;2012年05期
陶兰;;[J];北京农业工程大学学报;1993年01期
庞倩超;王晏民;;[J];北京建筑工程学院学报;2005年04期
中国重要会议论文全文数据库
贾允毅;胥布工;王世华;刘步春;;[A];第二十六届中国控制会议论文集[C];2007年
鲁俐;;[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
;[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
林达真;李绍滋;;[A];第六届汉语词汇语义学研讨会论文集[C];2005年
马莉;章玲;;[A];新环境下图书馆建设与发展——第六届中国社区和乡镇图书馆发展战略研讨会征文集(下册)[C];2007年
卫颖奇;彭进业;;[A];第三届全国嵌入式技术和信息处理联合学术会议论文集[C];2009年
蔡中华;;[A];第九届中国青年信息与管理学者大会论文集[C];2007年
谭嘉星;;[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
郭云峰;张集祥;;[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
张星星;黎宁;李文灿;;[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
中国博士学位论文全文数据库
时长江;[D];中国海洋大学;2009年
李曼荔;[D];电子科技大学;2010年
桑永胜;[D];电子科技大学;2010年
李一啸;[D];浙江大学;2010年
罗向阳;[D];解放军信息工程大学;2010年
单玉红;[D];武汉大学;2009年
吕琳;[D];吉林大学;2011年
孟佳娜;[D];大连理工大学;2011年
雷迎科;[D];中国科学技术大学;2011年
梁涛;[D];山东大学;2011年
中国硕士学位论文全文数据库
韩晓峰;[D];山东科技大学;2010年
岳海亮;[D];辽宁师范大学;2010年
张书春;[D];郑州大学;2010年
Rojanakat P[D];哈尔滨工程大学;2010年
刘振广;[D];哈尔滨工程大学;2010年
刘洁;[D];哈尔滨工程大学;2010年
叶铂;[D];哈尔滨工程大学;2010年
周东海;[D];哈尔滨工程大学;2010年
李丽;[D];哈尔滨工程大学;2010年
辛涛;[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库
顾益军,樊孝忠,王建华,汪涛,黄维金;[J];北京理工大学学报;2005年04期
许云,樊孝忠,张锋;[J];北京理工大学学报;2005年05期
薛为民;陆玉昌;;[J];北京联合大学学报(自然科学版);2005年04期
方辉;王倩;;[J];长春师范学院学报;2007年06期
杜新林;刘丹;董妍;;[J];长春大学学报;2009年06期
马建斌;李滢;滕桂法;王芳;赵洋;;[J];河北农业大学学报;2008年03期
孙岩清;尹树华;林初善;;[J];电讯技术;2010年05期
吕学强,任飞亮,黄志丹,姚天顺;[J];东北大学学报;2003年06期
朱靖波,陈文亮;[J];东北大学学报;2005年08期
陈文宇;张忠全;向涛;桑楠;;[J];电子科技大学学报;2010年06期
中国重要会议论文全文数据库
李红霞;袁晓芳;田水承;王莉;;[A];中国职业安全健康协会2008年学术年会论文集[C];2008年
车万翔;刘挺;秦兵;李生;;[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
曲维光;;[A];第二届全国学生计算语言学研讨会论文集[C];2004年
丁秉公;黄昌宁;黄德根;;[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库
宋枫溪;[D];南京理工大学;2004年
安金龙;[D];天津大学;2004年
张国云;[D];湖南大学;2006年
曾志强;[D];浙江大学;2007年
尚文倩;[D];北京交通大学;2007年
周子力;[D];华东师范大学;2009年
中国硕士学位论文全文数据库
薛慧芳;[D];西北大学;2011年
吴全娥;[D];西南大学;2011年
李剑;[D];安徽工业大学;2011年
马军红;[D];西北大学;2011年
马长林;[D];华中师范大学;2002年
张俊艳;[D];福州大学;2004年
毛嘉莉;[D];重庆大学;2003年
李力;[D];电子科技大学;2004年
黄琼英;[D];河北工业大学;2005年
汤华丽;[D];重庆大学;2005年
【二级引证文献】
中国期刊全文数据库
谭敏;;[J];价值工程;2011年11期
吴丽华;冯建平;曹均阔;;[J];计算机与数字工程;2012年11期
谭敏;范强;;[J];网络安全技术与应用;2012年07期
李晓鹏;颜端武;蔡金霞;成晓;;[J];现代图书情报技术;2013年03期
中国博士学位论文全文数据库
黄永文;[D];重庆大学;2009年
中国硕士学位论文全文数据库
耿倩;[D];哈尔滨工程大学;2010年
罗亚平;[D];东北财经大学;2010年
盛魁;[D];安徽大学;2011年
熊杨;[D];国防科学技术大学;2010年
王品;[D];河南科技大学;2011年
吴世竞;[D];北京邮电大学;2012年
李奎;[D];南京理工大学;2009年
刘慧;[D];西南交通大学;2010年
李萍;[D];东北师范大学;2010年
赵行;[D];北京邮电大学;2010年
【二级参考文献】
中国期刊全文数据库
苏中,马少平,杨强,张宏江;[J];软件学报;2002年01期
【相似文献】
中国期刊全文数据库
聂卉;龙朝晖;;[J];情报学报;2007年05期
王惠敏;聂规划;付魁;;[J];情报杂志;2008年10期
申改英;李建华;;[J];计算机工程;2009年16期
黄宏斌;刘志忠;张维明;邓苏;马丽丽;;[J];系统工程与电子技术;2009年07期
吴飞珍;马文丽;王旺迪;陈启龙;郑文岭;;[J];生物信息学;2010年01期
骆正华,樊孝忠,夏天;[J];微电子学与计算机;2005年07期
张承立;陈剑波;齐开悦;;[J];计算机工程与应用;2006年17期
徐德智;C.O王怀民;;[J];计算技术与自动化;2007年02期
张晓孪;王西锋;;[J];现代图书情报技术;2007年03期
路松峰;冯玲;刘芳;胡和平;;[J];小型微型计算机系统;2008年08期
中国重要会议论文全文数据库
关毅;王晓龙;;[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
黄佳来;王立波;袁道敏;;[A];浙江省电子学会2008年学术年会论文集[C];2008年
刘晓平;沈冠町;;[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
刘寒磊;关毅;徐永东;;[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
刘立;余正涛;王蒙;毛存礼;郭剑毅;;[A];第六届全国信息检索学术会议论文集[C];2010年
章成志;章成敏;王萍;;[A];第二届全国学生计算语言学研讨会论文集[C];2004年
章成志;;[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
骆正华;;[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
李月雷;师瑞峰;林丽冰;周一民;;[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
叶正;林鸿飞;杨志豪;;[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库
刘宏哲;[D];北京交通大学;2012年
宋玲;[D];山东大学;2009年
杨月华;[D];北京邮电大学;2013年
周子力;[D];华东师范大学;2009年
潘建国;[D];上海大学;2009年
胡晓;[D];上海交通大学;2011年
李宏伟;[D];解放军信息工程大学;2007年
魏军英;[D];山东科技大学;2011年
王芳;[D];河北农业大学;2012年
杨峰;[D];吉林大学;2011年
中国硕士学位论文全文数据库
郑丽萍;[D];山东科技大学;2005年
张红宇;[D];中南大学;2005年
常晓环;[D];吉林大学;2009年
任波;[D];浙江工业大学;2005年
秦鹏;[D];华东师范大学;2010年
郭嘉琦;[D];北京邮电大学;2007年
陈爱明;[D];中南大学;2008年
赵大明;[D];西北大学;2009年
关淞元;[D];吉林大学;2009年
尹睿;[D];大连理工大学;2009年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 大众知识服务
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备75号基于Web文本的聚类算法的应用研究--《湖北工业大学》2009年硕士论文
基于Web文本的聚类算法的应用研究
【摘要】:
随着因特网的讯速发展,互联网的数据信息量越来越大。如何对互联网的信息进行分析,便捷准确的挖掘出需要的信息知识急需解决。对聚类分析的研究可在相当程度上解决这个问题,不仅可以节省时间,并且可以提高效率。将聚类研究理论用于Web挖掘具有深刻的理论意义和重要的实际价值。本文从理论和实践两个方面分析与研究了聚类技术在Web文本挖掘中的应用。
Web文本挖掘涉及众多领域的重要内容,包括:数据挖掘、信息检索、智能算法等。而本文研究的文本聚类技术是其中的重要内容之一,它不仅是一种非指导学习方法,而且不需干涉,可由计算机自动处理。
本文研究的重点是通过文本聚类技术对中文文本对象进行聚类操作,首先有侧重点的对挖掘过程中的重要阶段进行研究,主要包含文本的预处理阶、聚类分析阶段。在预处理阶段,根据特征选取的特点,利用遗传学的基本知识采用一种基于遗传策略的特征选取方法。它可以在非监督学习的情况下对用特征向量来表示的文本个体进行降维操作,可以起到降低聚类算法的复杂度,保证聚类精度的作用。在聚类算法阶段,通过比较各种聚类算法的优缺点,重点分析了经典的K-means算法,然后提出一种对孤立点先检测再提取最后归并的改进K-means(WIPD)算法。改进的WIPD算法首先遍历整个样本数据集,找出所有的孤立点等异常数据进行提取,接下来对提取后的样本集进行聚类,在处理时采用自适应策略与基于最大距离的聚类中心相结合的选取方法,在相当程度上避免了聚类结果陷入局部最优的局面,在聚类完成后再将这些孤立点整理后归并入聚类结果当中,从而确保聚类结果的完整性,排除孤立点对聚类结果的影响。通过在matlab平台的实验证明改进的WIPD算法具有优良的属性,并且新算法具有的特点比原算法要好的多。最后,本文将改进前后的聚类算法应用到实际的系统当中,实现了中文Web文本聚类的整个过程,通过系统和实验证明了新算法的可行性和有效性。
【关键词】:
【学位授予单位】:湖北工业大学【学位级别】:硕士【学位授予年份】:2009【分类号】:TP391.1;TP18【目录】:
ABSTRACT5-9
第1章 绪论9-13
1.1 研究背景9-10
1.2 课题研究的意义10
1.3 Web 文本聚类面对的挑战10-11
1.4 本文的主要内容结构11-13
第2章 相关概念13-17
2.1 数据挖掘13-14
2.1.1 数据挖掘特点13
2.1.2 数据挖掘常用方法13-14
2.2 WEB文本挖掘14-15
2.2.1 Web 挖掘14
2.2.2 文本挖掘简介14-15
2.3 数据标准化15
2.4 文本表示15-16
2.4.1 向量空间模型15-16
2.4.2 特征抽取16
2.5 本章小结16-17
第3章 WEB 文本挖掘技术17-22
3.1 WEB文本挖掘的过程17-18
3.2 WEB 文本预处理技术18-21
3.2.1 Web 文本去噪18
3.2.2 中文文本分词18-19
3.2.3 文本特征表示19-20
3.2.4 文本特征选取20-21
3.3 本章小结21-22
第4章 基于遗传策略的特征选取方法22-29
4.1 遗传算法22
4.2 基于遗传策略的特征选取方法22-27
4.2.1 基本思想22-23
4.2.2 算法的基本流程23-27
4.3 实验分析27-28
4.4 本章小结28-29
第5章 基于文本的聚类算法的改进与应用29-48
5.1 文本聚类29-32
5.1.1 聚类的研究属性29-30
5.1.2 文本聚类的特点30-32
5.2 文本聚类算法的比较32
5.3 聚类算法的比较32-33
5.4 K-means 算法分析33
5.4.1 K-means 算法33
5.4.2 经典K-means 算法的局限性33
5.5 改进 K-means(WIPD)算法33-39
5.5.1 基本思想33-34
5.5.2 检测提取孤立点阶段34-36
5.5.3 聚类阶段36-37
5.5.4 整理阶段37
5.5.5 算法步骤37-39
5.5.6 改进K-means 算法聚类流程39
5.6 实验与分析39-41
5.6.1 聚类性能评价指标39-40
5.6.2 文本数据聚类实验40-41
5.7 改进后聚类算法的原型系统的实现实验论证41-47
5.7.1 实现环境41
5.7.2 数据集的选取41-42
5.7.3 评价方法42-47
5.8 本章小结47-48
第6章 总结与展望48-49
参考文献49-53
欢迎:、、)
支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库
林鸿飞,战学刚,姚天顺;[J];东北大学学报(自然科学版);2000年03期
王继成,潘金贵,张福炎;[J];计算机研究与发展;2000年05期
马玉春,宋瀚涛;[J];计算机应用;2004年04期
梅馨,邢桂芬;[J];江苏大学学报(自然科学版);2003年05期
朱克斌,唐菁,杨炳儒;[J];计算机工程;2004年13期
张春霞,郝天永;[J];系统仿真学报;2005年01期
刘明吉,王秀峰,饶一梅,黄亚楼;[J];小型微型计算机系统;2002年06期
何飞,蒋冬初;[J];湖南城市学院学报;2003年03期
中国博士学位论文全文数据库
王建会;[D];复旦大学;2004年
陈晓云;[D];复旦大学;2005年
程军;[D];中国科学院研究生院(文献情报中心);2003年
宋枫溪;[D];南京理工大学;2004年
熊云波;[D];复旦大学;2006年
【共引文献】
中国期刊全文数据库
化柏林;赵亮;;[J];现代图书情报技术;2007年07期
钱立三;[J];安徽广播电视大学学报;2005年03期
安振刚,李谋渭,尹显东,于宁,唐伟;[J];鞍钢技术;2001年06期
袁军,邱扬,田锦;[J];安全与电磁兼容;2003年06期
张军红,谢安国,沈峰满;[J];鞍山钢铁学院学报;2001年06期
张剑;李大卫;;[J];鞍山科技大学学报;2006年04期
张志华;王莉;;[J];鞍山科技大学学报;2006年05期
曾齐红;[J];鞍山师范学院学报;2004年06期
武旭,须德;[J];北方交通大学学报;2003年02期
周丽娟;乐晓波;;[J];办公自动化;2007年06期
中国重要会议论文全文数据库
何平;周辉;;[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
耿玉磊;张翔;;[A];福建省科协第四届学术年会提升福建制造业竞争力的战略思考专题学术年会论文集[C];2004年
陈佳彬;张翔;;[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
尹秋菊;;[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
舒辉;文劲宇;曹一家;罗春风;王大光;宋福海;;[A];湖北省电工技术学会2004年学术年会论文集[C];2004年
刘维东;陈德春;王志平;;[A];第十二届中国海岸工程学术讨论会论文集[C];2005年
刘永;张立毅;;[A];2006中国西部青年通信学术会议论文集[C];2006年
郑日荣;毛宗源;谭洪舟;;[A];第二十四届中国控制会议论文集(下册)[C];2005年
杜志文;曾文华;;[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
冯秋红;刘全坤;;[A];第三届华东六省一市塑性工程学术年会论文集[C];2005年
中国博士学位论文全文数据库
刘云峰;[D];华中科技大学;2005年
许建潮;[D];吉林大学;2005年
刘皓玮;[D];铁道部科学研究院;2000年
彭真明;[D];成都理工学院;2001年
刘贵喜;[D];西安电子科技大学;2001年
张家树;[D];电子科技大学;2001年
熊仲宇;[D];南京航空航天大学;2001年
杨启文;[D];浙江大学;2001年
童梅;[D];浙江大学;2002年
颜学峰;[D];浙江大学;2002年
中国硕士学位论文全文数据库
杨盛;[D];中南大学;2005年
庄世芳;[D];福州大学;2006年
黄衍标;[D];广东工业大学;2008年
戚华春;[D];浙江工业大学;2005年
付曙光;[D];辽宁工程技术大学;2005年
刘艳青;[D];山东大学;2005年
瞿继合;[D];东北财经大学;2005年
雷庆;[D];华侨大学;2005年
王娜;[D];兰州理工大学;2005年
黄素珍;[D];广西大学;2001年
【同被引文献】
中国期刊全文数据库
顾益军,樊孝忠,王建华,汪涛,黄维金;[J];北京理工大学学报;2005年04期
湛燕,陈昊,袁方,王丽娟;[J];河北大学学报(自然科学版);2003年02期
王继成,潘金贵,张福炎;[J];计算机研究与发展;2000年05期
雷景生,林冬雪,符浅浅;[J];计算机工程;2005年01期
代六玲,黄河燕,陈肇雄;[J];中文信息学报;2004年01期
刘远超;王晓龙;徐志明;关毅;;[J];中文信息学报;2006年03期
中国博士学位论文全文数据库
罗会兰;[D];浙江大学;2007年
中国硕士学位论文全文数据库
茅剑;[D];厦门大学;2007年
王继丽;[D];浙江大学;2008年
【二级参考文献】
中国期刊全文数据库
蔡颖琨,谢昆青,马修军;[J];北京大学学报(自然科学版);2004年03期
高军,陈锡先;[J];北京邮电大学学报;1997年04期
朱靖波,姚天顺;[J];东北大学学报(自然科学版);2002年05期
张俐,李晶皎,胡明涵,姚天顺;[J];东北大学学报(自然科学版);2003年04期
麻志毅,林鸿飞,姚天顺,马佳琳;[J];东北大学学报(自然科学版);1999年03期
詹卫东;[J];当代语言学;2000年02期
王显芳,杜利民;[J];电子与信息学报;2003年09期
刘挺,吴岩,王开铸;[J];哈尔滨工业大学学报;1998年06期
陈卓;孟庆春;魏振钢;任丽婕;窦金凤;;[J];哈尔滨工业大学学报;2005年12期
郭艳华,周昌乐;[J];杭州电子工业学院学报;2000年01期
中国重要会议论文全文数据库
刘群;张浩;白硕;;[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库
肖明;[D];中国科学院文献情报中心;2001年
中国硕士学位论文全文数据库
孙思;[D];重庆大学;2005年
【相似文献】
中国期刊全文数据库
刘斌,曾立波,刘生浩;[J];计算机工程;2003年01期
任江涛;孙婧昊;黄焕宇;印鉴;;[J];计算机科学;2006年10期
张惠春;;[J];电脑知识与技术;2009年08期
王卫玲;孔波;初建崇;杨玫;;[J];信息技术与信息化;2009年06期
孙雷,王新;[J];计算机工程与应用;2004年21期
张向荣,焦李成;[J];复旦学报(自然科学版);2004年05期
闫相国,明利强;[J];天津职业技术师范学院学报;2004年03期
张莉,孙钢,郭军;[J];计算机应用研究;2005年03期
张维东;朱宏明;周闻钧;;[J];无线电通信技术;2006年03期
徐峻岭;徐宝文;张卫丰;崔自峰;;[J];东南大学学报(英文版);2006年02期
中国重要会议论文全文数据库
李娜;曾向阳;;[A];2009年西安-上海声学学术会议论文集[C];2009年
张永;陈思睿;杨志勇;;[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
王强;曾向阳;王曙光;李娜;;[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
高砚军;徐华平;;[A];第六届全国信息获取与处理学术会议论文集(1)[C];2008年
李晓丽;王彤;杜振龙;;[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
徐燕;孙春明;王斌;李锦涛;;[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
李爱新;孙铁;郭炎峰;;[A];自动化技术与冶金流程节能减排——全国冶金自动化信息网2008年会论文集[C];2008年
靖红芳;王斌;杨雅辉;;[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
周志红;周新聪;严新平;袁成清;;[A];2006全国摩擦学学术会议论文集(一)[C];2006年
李占潮;陈超;周喜斌;邹小勇;;[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
中国重要报纸全文数据库
闻丹岩;[N];中国计算机报;2001年
周晓娟;[N];通信产业报;2008年
洪飞 宋志坤;[N];中国计算机报;2005年
闻群?王聃聃;[N];中国证券报;2007年
孙志伟;[N];齐齐哈尔日报;2008年
郑卫东;[N];中国畜牧兽医报;2007年
娄静?吴先兴;[N];上海证券报;2007年
陈泓娟;[N];计算机世界;2001年
张小东;[N];黑龙江经济报;2006年
吴璟;[N];上海证券报;2008年
中国博士学位论文全文数据库
韦娜;[D];西北大学;2006年
张颖;[D];大连理工大学;2008年
吕铁军;[D];电子科技大学;2000年
燕忠;[D];东南大学;2005年
陈晓云;[D];复旦大学;2005年
李勇明;[D];重庆大学;2007年
刘天羽;[D];上海大学;2007年
杨水山;[D];哈尔滨工业大学;2009年
黄东山;[D];华中科技大学;2011年
熊文;[D];北京邮电大学;2010年
中国硕士学位论文全文数据库
房一鸣;[D];对外经济贸易大学;2006年
刘何秀;[D];中国海洋大学;2009年
张隆;[D];西南农业大学;2005年
侯小静;[D];郑州大学;2005年
秦永;[D];辽宁工程技术大学;2005年
刘宜萍;[D];合肥工业大学;2006年
杨打生;[D];东南大学;2005年
庞宵;[D];辽宁科技大学;2008年
王玉晶;[D];西南大学;2008年
杨瑞请;[D];西南大学;2008年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 大众知识服务
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备75号}

我要回帖

更多关于 文本聚类 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信