语音识别芯片如何使用需要使用人工神经网络吗

工具类服务
编辑部专用服务
作者专用服务
隐马柯夫模型与人工神经网络相结合用于语音识别
学科专业:
授予学位:
学位授予单位:
导师姓名:
学位年度:
本文读者也读过
相关检索词
万方数据知识服务平台--国家科技支撑计划资助项目(编号:2006BAH03B01)(C)北京万方数据股份有限公司
万方数据电子出版社君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
人工神经网络技术在语音识别中的应用
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口人工神经网络理论在语音识别技术中的应用--《第八届全国信息获取与处理学术会议论文集》2010年
人工神经网络理论在语音识别技术中的应用
【摘要】:介绍了语音识别技术发展的历史,对传统的语音识别技术及特点进行了分析。就近年来人工神经网络理论在语音识别中的应用做了比较详细的介绍,对传统的HMM识别方法和神经网络方法的优缺点做了比较,并就如何将HMM的较强的时间序列处理能力和人工神经网络的学习能力强、分类识别速度快相结合以提高语音的识别率做了分析介绍。
【作者单位】:
【关键词】:
【分类号】:TN912.34【正文快照】:
引言语音处理技术近年来发展的十分迅速,己成为信息技术领域中一个重要的分支。语音处理技术包含语音识别、语音分析、语音处理等多个方面。在当今信息时代,信息处理正朝着多媒体化的方向快速发展,人们已不再满足键盘、鼠标等沿用多年的人机信息交换方式,而希望用自然语
欢迎:、、)
支持CAJ、PDF文件格式,仅支持PDF格式
【共引文献】
中国期刊全文数据库
焦俊婷;于霖冲;;[J];玻璃钢/复合材料;2006年05期
胡志军;王鸿斌;;[J];长春师范学院学报;2006年10期
郝云芳,冯晓明,黄天禄;[J];传感器技术;2004年11期
吴正茂,罗健;[J];长江工程职业技术学院学报;2005年02期
王立华;[J];沧州师范专科学校学报;2005年01期
陈晓楠;黄强;邱林;段春青;;[J];河北农业大学学报;2006年01期
李玉坤,寒枫,高朝辉;[J];信息记录材料;2004年03期
王立舒,戚国强,杨广林,钮志勇;[J];东北农业大学学报;2005年03期
张世海,刘晓燕,欧进萍,王光远;[J];地震工程与工程振动;2002年04期
吕伟锋,毕净,沈继忠,姚茂群;[J];电路与系统学报;2003年06期
中国重要会议论文全文数据库
戴立新;胡洁;李美叶;;[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
王俊松;钱飞飞;张兴会;谷兆麟;吴真;;[A];第二十四届中国控制会议论文集(下册)[C];2005年
王桂坤;;[A];2006年山东省制冷空调学术年会“格力杯”优秀论文集[C];2006年
张瑞林;;[A];瓦斯地质与瓦斯防治进展[C];2007年
陈晓楠;黄强;邱林;段春青;;[A];中国水利学会2005学术年会论文集——水旱灾害风险管理[C];2005年
王福明;黄云;;[A];2007年中国机械工程学会年会论文集[C];2007年
张文涛;Wlodek K;[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库
吕天启;[D];大连理工大学;2002年
马成勇;[D];天津大学;2003年
王瑞梅;[D];中国农业大学;2003年
李霞;[D];西北工业大学;2003年
赵冲冲;[D];西北工业大学;2003年
许桢英;[D];合肥工业大学;2004年
刘学庆;[D];中国科学院研究生院(海洋研究所);2004年
杜文斌;[D];辽宁中医学院;2004年
张新占;[D];长安大学;2004年
王睿;[D];北京中医药大学;2004年
中国硕士学位论文全文数据库
付中华;[D];西北工业大学;2001年
姜永波;[D];广东工业大学;2003年
王业宏;[D];南京气象学院;2003年
谢忠红;[D];南京气象学院;2003年
朱瑜馨;[D];西北师范大学;2003年
张全;[D];西北工业大学;2003年
高琳;[D];西北工业大学;2003年
王东升;[D];西北工业大学;2003年
赵敏;[D];华北电力大学(河北);2003年
代庆新;[D];华北电力大学(河北);2003年
【二级参考文献】
中国期刊全文数据库
吴淑珍,冯成林,黄新宇;[J];北京大学学报(自然科学版);2001年03期
杨华民,姜会林,李平;[J];电子技术应用;1997年09期
林坤辉;息晓静;周昌乐;;[J];厦门大学学报(自然科学版);2006年01期
【相似文献】
中国期刊全文数据库
木合塔尔·沙地克;李晓;布合力齐姑丽·瓦斯力;;[J];中文信息学报;2011年04期
张汀;;[J];电脑知识与技术;2011年23期
王霞英;王福明;孟廷豪;管敏杰;李红兰;;[J];科技信息;2011年16期
孙晶;凌云峰;;[J];科技资讯;2011年20期
高美娟;杨智鑫;田景文;;[J];电子测量技术;2011年07期
韦国光;;[J];信息与电脑(理论版);2011年07期
安逸;江丹;;[J];山西电子技术;2011年04期
斯芸芸;徐道连;周卓然;;[J];微型机与应用;2011年16期
史晓东;卢亚军;;[J];中文信息学报;2011年04期
倪崇嘉;刘文举;徐波;;[J];计算机应用研究;2011年08期
中国重要会议论文全文数据库
蔡伟建;;[A];第八届全国信息获取与处理学术会议论文集[C];2010年
杨学增;方棣棠;;[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
王作英;;[A];第二届全国人机语音通讯学术会议论文集[C];1992年
王承发;赵德彬;金山;苗百利;朱志莹;;[A];第二届全国人机语音通讯学术会议论文集[C];1992年
胡春静;吴善培;;[A];第三届全国人机语音通讯学术会议论文集[C];1994年
董林;袁保宗;周继成;;[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
国立新;莫福源;李昌立;;[A];第三届全国人机语音通讯学术会议论文集[C];1994年
王昆仑;樊志锦;吐尔洪江;方晓华;徐绍琼;吾买尔;;[A];第五届全国人机语音通讯学术会议论文集[C];1998年
崔毓菁;刘刚;;[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
王承发;肖毅壮;韩纪庆;;[A];第二届全国人机语音通讯学术会议论文集[C];1992年
中国重要报纸全文数据库
;[N];国际商报;2000年
平远;[N];北京电子报;2000年
北京清华大学电子工程系副教授
刘润生;[N];科技日报;2001年
;[N];检察日报;2002年
;[N];中国计算机报;2001年
本报记者 刘学习;[N];计算机世界;2002年
陈丹;[N];科技日报;2010年
王佳彬;[N];电脑报;2002年
钟远;[N];国际商报;2000年
北大企研中心研究部
一清;[N];中国计算机报;2001年
中国博士学位论文全文数据库
段江娇;[D];复旦大学;2008年
李超雷;[D];中国科学院研究生院(电子学研究所);2007年
雷杰;[D];华中科技大学;2008年
李虹;[D];吉林大学;2009年
孔德光;[D];中国科学技术大学;2010年
田斌;[D];西安电子科技大学;1999年
陶冶;[D];山东大学;2009年
王海艳;[D];吉林大学;2011年
王维;[D];国防科学技术大学;2011年
刘青松;[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库
周慧芳;[D];广东工业大学;2011年
付维;[D];武汉科技大学;2011年
陈成;[D];西安理工大学;2010年
李新超;[D];华南理工大学;2010年
宋阳;[D];电子科技大学;2011年
黄文涛;[D];广东工业大学;2012年
魏玮;[D];中南大学;2010年
韩培宽;[D];太原理工大学;2010年
韦丽兴;[D];广东工业大学;2011年
文林;[D];中南大学;2011年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 大众知识服务
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备75号本类论文推荐后使用快捷导航没有帐号?
查看: 569|回复: 1
揭秘语音识别背后的技术,GPU集群+DNN算法
金牌会员, 积分 1187, 距离下一级还需 1813 积分
论坛徽章:10
感觉DNN应用已经有很多应用,不过好想有机会了解下相关细节
揭秘语音识别背后的技术,GPU集群+DNN& & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & &
& & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & &
& & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & 摘要:智能语音主要依靠的技术实现,深度学习在于建立、模拟人脑进行分析学习的,使得机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测,以达到具有人类一样的思考能力。& & & & & & & & & & & & & & & &
& & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & 日,浪潮在北京召开2014高性能计算用户大会。从天河一A问鼎世界冠军,到天河2号连续三次位列TPO500的第一名。这几年一路走来,可以看到高性能计算在中国的发展势不可挡,除了在科研领域之外,高性能计算正展现出强大的延展性,与金融、互联网、工业设计、文化创意等各行各业之间的交叉关联变得前所未有的紧密。同时,高性能计算与云计算、大数据之间的交叉融合趋势越发明显,成为推动全球信息产业发展的三大动力之一。
目前智能和连接成为了互联网发展的核心词语,语音控制也逐渐火热。目前,Facebook、Google、IBM、苹果、微软、百度、科大讯飞等均在此方面做了多种尝试。
智能语音目前主要依靠深度学习的技术实现,作为的一个重要分支,深度学习在于建立、模拟人脑进行分析学习的神经网络,使得机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测,以达到具有人类一样的思考能力。
在本届HPC大会上CSDN采访了科大讯飞高级副总裁胡郁与浪潮Inspur-Intel中国并行计算联合实验室首席工程师张清,和他们深入探讨了如何通过深度学习模拟人类大脑以及如何通过GPU集群来进行算法效率的提升等问题。
胡郁表示超算是项目中的关键要素。首先,深度学习技术的再度崛起,正在颠覆统计模式识别、机器学习和人工智能领域,相关专家成为“香饽饽”;其次,大数据目前已经和深度学习融合,在语音识别和图像识别等感知人工智能方面发挥了巨大的作用;最后,超算平台是人工智能的基础,提供海量数据处理、存储以及高性能运算解决方案。
科大讯飞是一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的国家级骨干软件企业,他们的语音技术实现了人机语音交互,使人与机器之间沟通变得像人与人沟通一样简单。他们认为语音作为交互的手段,距离能够实现人与人之间的交流的自然鱼眼效果,还有很多多问题没有解决,比如噪音、口音、个性化等等,这还有很打的市场空间,这远不是一些简单的模型与海量数据就能够解决的。那么在科大讯飞语音识别背后隐藏着哪些故事呢?我们慢慢来看!
要深入了解一个深度学习计算平台,必须从它的算法和架构谈起。深度学习技术有很多支撑的计算机算法,而目前最常用的是DNN算法,它能比较好地模拟人脑神经元多层深度传递的过程,解决智能语音中的复杂问题。然而,要模拟人脑绝非易事,人脑的计算能耗比是世界上最快的超级计算机天河2号的200万倍,众所周知,人类大脑大致有1000亿神经元,每个神经元有大约5000个神经突触。要使机器无限接近人类的思考能力意味着要模拟出更多的神经元和神经突触,这就会带来巨大的计算挑战。
此时的科大讯飞面临着数千倍训练数据及数千倍模型参数的巨大挑战,迫切的需求更大规模、更多存储的超算平台集群建设;更优的深度学习并行化及集群调度算法;深度定制的人工神经网络专属芯片系统。
面对这些问题,该如何解决呢?首先是算法上优化,科大讯飞将整个DNN环节进行优化压缩,取缔了MFCC、HLDA、VTLN、FMPE等环节,只保留Filter Bank、FFT、Wave、Seq.Train、FMPE等流程,整个架构循环由优化了40%,大幅度的增加了运算速度与效率。
在算法调整完以后面临的就是基础设施的建设,如何设计一套占地面积小、计算性能高、又绿色节能的高性能计算集群成为科大讯飞面临的问题。此时浪潮针对这一问题,利用GPU加速技术为该公司设计构建了一套GPU集群,双方联合设计了针对DNN算法特点的GPU集群并行计算框架,采用了每个计算节点配置双路CPU和4块NVIDIA Tesla K20m GPU,以及一块HCA卡的方案,通过GPU提高计算能力、通过IB网络提速节点之间的通信速度,最终完成GPU集群版的DNN并行算法,大幅减低了DNN的计算时间。
特别在软件方面,浪潮与科大讯飞户算法专家团队共同成立专门联合项目组,节点内使用CPU+GPU协同计算,大幅降低了计算时间。
双方联合针对GPU架构进行了算法层面的优化,重写了计算部分代码,将整体速度大幅提升。经过优化后的软件,在单GPU上运行的速度与串行程序相比,加速比达到41倍,1块GPU相当于4.4个8核CPU并行的性能,同时由于浪潮GPU版本K-means具有很好的性能可扩展性,这使得GPU服务器具有很好的性价比非常适合于此类应用大规模部署。
目前科大讯飞的整个基础架构分为:业务、调度、计算、存储四个层次,内含2000颗CPU、300片GPU、4PB的存储、40TB的内存。
在介绍架构建设过程的时候,张清说道:“浪潮已经分别与英特尔和英伟达成立联合并行计算实验室,合作开发优化基于MIC和GPU的并行应用。目前已经建立了一套非常完善的高性能计算集群解决方案,将不仅为用户提供好用的高性能计算集群,还会针对每一个用户的应用特点量身定制集群解决方案,这也就说明未来浪潮将跟用户在应用测试、集群搭建、加速优化等各方面展开合作,把用户的需求看作是浪潮设计构建集群的根本要求。”
解决了算法和平台的问题,科大讯飞成功将语音的识别的正确率提升到95%。谈及以后的发展,胡郁表示目前他们正在做“讯飞超脑”计划,他认为人工智能分为三个阶段:计算智能,能存会算;感知智能,能听会说、能看会议;认知智能,能思考会理解。他表示人工智能目前面临的问题主要有三点:
第一点就是如何让人工神经网络能够像人的大脑神经网络链接一样,人脑神经元的连接还是比较复杂的;第二个大的挑战就是能够将神经元的数量建立到和人的大脑比较接近的程度,虽然还不能够完全达到人的大脑的水平;第三个就是实现机器学习的另外一种模式,不仅仅让人教给机器怎么做,而是让机器能够具有自动学习的功能。
同时胡郁表示目前他们正在探索让机器自动学习,能够让机器理解自然语言,同时将自然语言与我们人类的概念连接在一起。对于讯飞超脑未来的研究方向胡郁总结为一下三点:
更加贴近人脑认知机理的人工神经网络设计,更好的支撑认知智能的实现实现与人脑神经元复杂度可比的超大人工神经网络(相当于目前感知智能网络规模的1000倍)构建基于连续语义空间分布式表示的知识推理以及学习智能引擎
讯飞超脑未来的应用场景
注册会员, 积分 179, 距离下一级还需 21 积分
论坛徽章:6
学习了,先mark下。。}

我要回帖

更多关于 语音识别 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信