概率编程技术能彻底取代pnn概率神经网络算法吗

基于分布函数概率神经网络的故障诊断
基于分布函数概率神经网络的故障诊断
张正道,张卫华江南大学通信与控制工程学院,江苏无锡摘   要:提出一种α稳定分布基函数概率神经网络(Alpha?PNN)结构,该网络隐层的神经元激活函数采用了对称α稳定分布的概率密度函数,和常规的高斯分布函数相比,其具有更好的可变性和延展性,从而使隐层的神经元在函数近似上具有更高的适应性,同时也克服了概率神经网络对输入数据的独立同分布假设,提高了神经网络对局部脉冲突变的近似能力。在此基础之上,提出
张正道,张卫华江南大学通信与控制工程学院,江苏无锡摘   要:提出一种α稳定分布基函数概率神经网络(Alpha?PNN)结构,该网络隐层的神经元激活函数采用了对称α稳定分布的概率密度函数,和常规的高斯分布函数相比,其具有更好的可变性和延展性,从而使隐层的神经元在函数近似上具有更高的适应性,同时也克服了概率神经网络对输入数据的独立同分布假设,提高了神经网络对局部脉冲突变的近似能力。在此基础之上,提出了一种新的根据系统输入输出数据实现的故障诊断算法,并将其应用到轴承的故障诊断中。仿真结果表明,在有色噪声的背景下,该算法仍然能够实现较好的识别效果,故障的误报率低于概率神经网络方法。关 键 词:α稳定分布;基函数;概率神经网络;故障诊断;有色噪声1 引 言概率神经网络[1](ProbabilisticNeuralNetwork,PNN)是在径向基函数(RBF)神经网络的基础上发展而来的一种前馈型神经网络,最早是由D?F?Specht博士在1989年提出。其实质是基于贝叶斯最小风险准则的一种并行算法,特别适合于模式识别及分类。近年来,PNN以其良好的数据分类性能,被广泛地应用于故障诊断领域,并在大量的实际工程中获得了成功应用[5?8]。目前对PNN的研究主要集中在算法学习理论及改进模型上,并获得了丰硕的成果[9?11]。然而,PNN的隐层单元采用高斯函数作为激活函数,这就默认了一个假设,即:训练数据的独立同分布假设。但实际上训练数据相互之间往往是相关的,这就极大地限制了PNN的应用。为此,本文提出了一种基于对称α稳定分布基函数概率神经网络的故障诊断算法,回避了对数据独立同分布的要求,并由此提出新的故障诊断方法。最后,以风扇端子轴承的故障诊断为例验证了所提算法的有效性。
型号/产品名
重庆旭照科技有限责任公司
深圳市长兴烽科技有限公司
深圳市新诺亚显示技术有限公司
深圳市佳豪电子商行您的位置: &
基于概率神经网络的流行音乐分类研究
优质期刊推荐  摘要: 基于概率神经网络,提出一种与尿液反应后尿试纸的颜色识别方法。针对颜色色空间转换的非线性复杂关系,获取标准阈值颜" />
免费阅读期刊
论文发表、论文指导
周一至周五
9:00&22:00
基于概率神经网络的尿样颜色识别
  摘要: 基于概率神经网络,提出一种与尿液反应后尿试纸的颜色识别方法。针对颜色色空间转换的非线性复杂关系,获取标准阈值颜色色度值,进行归一化处理后,建立基于概率神经网络的尿样颜色识别模型。实验结果表明,用概率神经网络进行尿样颜色识别是可行而有效的。与颜色色差评价方法作比较,该方法无须进行色空间转换,只利用设备原有RGB颜色空间的RGB值即可实现,更易于操作。 中国论文网 /1/view-5284510.htm  关键词: 概率神经网络(PNN); 颜色识别; 生化分析   中图分类号: TP 391.4文献标识码: Adoi: 10.3969/j.issn.2.05.005   引言颜色识别在遥感技术、工业过程控制、材料分拣识别、图像处理、产品质检、机器人视觉系统等领域已得到广泛应用。利用已有的彩色图像处理设备,如彩色扫描仪、彩色数码相机、摄像头等,可以进行尿液的医学生化分析[1]。但是,由于系统信号传输的非线性、硬件设备本身的局限性及其它各种外在因素的影响,不同设备间颜色信息的传递也不是线性的,而是非常复杂的。即使是同一彩色图像,经不同的彩色图像处理设备扫描或拍摄后再输入到计算机中所得到的RGB数据文件在比例关系上和数量大小方面也会呈现明显的失调和不一致[2]。概率神经网络(PNN)是一种基于概率密度函数理论且泛化能力很强的神经网络,并且能够广泛地应用于模式识别等领域。可以利用线性学习算法完成以往非线性算法的工作,又可以保持非线性算法的高精度特性[34]。现基于PNN,提出一种与尿液反应后尿试纸的颜色识别方法。针对颜色色空间转换的非线性复杂关系,在获取标准阈值颜色色度值后,进行归一化处理,建立PNN,用于尿样颜色的识别,并与颜色色差评价方法进行比对。1概率神经网络(PNN)   1.1PNN特点PNN是统计方法与前馈神经网络相结合的一种神经网络模型。与多层前馈神经网络(back propagation,BP)相比较,PNN的主要优势为:(1)网络收敛速度快。网络结构仅有两层,并且运算时不需要返回网络再对权值进行修改;(2)无论多么复杂的分类问题,只要有足够的训练数据,PNN可以保证获得贝叶斯准则下的最优解;(3)允许减少或增加训练数据而无需进行长时间的训练。   光学仪器第34卷   第5期王春红,等:基于概率神经网络的尿样颜色识别   图1概率神经网络结构   Fig.1Schematic diagram of PNN structure1.2PNN结构PNN是一种能够用于模式分类的径向基神经网络,实质是基于贝叶斯最小风险准则的一种并行算法[5]。PNN网络结构如图1所示,共三层:输入层、隐含层和输出层。第一层为输入层,网络第二层为隐含层,用径向基函数作为激励函数,一般为高斯函数(即exp(-n2),n为径向基函数神经元输入值);第三层为输出层,即竞争层。图1中Q为输入向量的个数,R为输入向量的维数,LW1,1为输入权值向量,LW2,1为隐层权值向量,K为输出神经元个数,C为扩展常数。C值越大,隐含层神经元对输入向量的响应也越大。PNN分类方法:径向基层计算输入向量同样本输入向量间的距离dist,输出一个距离向量。竞争层接受距离向量,计算各个模式出现的概率,通过竞争传递函数compet寻找输入向量中的最大元素,把响应的神经元输出设置为1,其余输出设置为0。2样本体系结构   2.1标准阈值尿液生化分析中每一具体项目分为正常(-)、临界正常(-+)和非正常情况(+,++,+++)。将尿试纸与标准阈值实验液作用,在规定的时间内,检测尿试纸可见光谱反射率或用色度仪器测试颜色三刺激值XYZ。CIE1931颜色三刺激值XYZ计算公式为X=k∑λS(λ)R(λ)x―(λ)Δλ   Y=k∑λS(λ)R(λ)y―(λ)Δλ   Z=k∑λS(λ)R(λ)z―(λ)Δλ(1)式(1)中,S(λ)为照明光源相对光谱功率分布、R(λ)为物体可见光谱反射率、x―(λ)、y―(λ)和z―(λ)为CIE标准观察者的光谱三刺激值函数,Δλ为采样间隔,一般Δλ=10 nm。在Lambda 9紫外可见近红外分光光度计上测试获得光谱反射率数据,即可由式(1)得到光源下的颜色三刺激值XYZ。实验中比对实验所用光源和测试标准阈值颜色所用光源相同。为能更好地反映两个颜色间色差大小与人眼感知程度的一致性,通常将物体颜色三刺激值XYZ转换成CIE Lab匀色空间色度值[6],依据下式进行计算。L*=116×fYYn-16   a*=500×fXXn-fYYn   b*=200×fYYn-fZZn(2)式(2)中,L*为米制明度;a*、b*为米制色度。Xn,Yn,Zn为标准照明体的三刺激值。fXXn、fYYn、fZZn的计算公式为f(I)=I13I>0.008 856   f(I)=7.787×I+16116I≤0.008 856(3)实验在A标准光源、D65标准光源下分别进行,尿胆素原(URO)标准阈值色度数据如表1所示。表2为标准光源A和标准光源D65下的相邻标准阈值间的色差。由表1和表2中的色度数据可以看出,标准阈值间的色差远远超出了人眼分辨颜色差别的阈值。标准光源A和标准光源D65下的色差值较接近。D65标准光源下,对于尿胆素原测试,RGB空间色度值如表3所示。   2.2指标数据的量化、规范化处理为减少网络的训练难度,需要对输入数据进行归一化处理[7]。利用计算公式将输入数据量化为闭区间[0.05,0.95]上的无量纲指标属性值。当输出越大分析结果越高时,效应系数计算公式为:Fj=0.9×(Xj-Xjmin)/(Xjmax-Xjmin)+0.05(4)当输出越小分析结果越高时,效应系数计算公式为:Fj=1-[0.9×(Xj-Xjmin)/(Xjmax-Xjmin)+0.05](5)其中,Fj为目标值Xj的效应系数,Xjmin为第j个指标的最小值,Xjmax为第j个指标的最大值,j是评价指标数。将D65标准光源下标准阈值的RGB值经过上述处理后,便得到样本数据。3用PNN进行尿液生化分析
  3.1PNN的建立每项检测项目中均有5个阈值,即共有5个训练样本,与待测尿液反应后的尿试纸颜色的RGB值为测试样本。(1)输入层神经元数的确定。输入层神经元数的多少与评价指标数相对应。采用颜色RGB值对尿液生化分析结果进行模拟评价,因此,网络输入层神经元个数为3。(2)隐含层神经元数与训练样本数相同。共计5个,传递函数为高斯函数(radbas),加权函数设为欧氏距离加权函数(dist)。编程中设计输人函数为netprod,输出函数为compet,加权函数为dotprod。(3)输出层神经元数的确定。网络输出结果共分5个等级,即-、-+、+、++、+++,因此输出神经元个数取为5。   3.2PNN的训练和预测用MATLAB神经网络工具箱中newprm()函数设计PNN网络,代码:net=newpnn(P,t,spread),其中P为归一化样本向量,t为输出目标向量,即评价等级,分别用1、2、3、4、5代表-、-+、+、++、+++五个等级,net为产生的PNN,spread为径向基函数分布密度,设为0.1[8]。利用vec2ind函数可将分类结果转换为容易识别的类别向量,亦可用ind2vec函数将类别向量转化为PNN可以使用的目标向量。将验证样本数据输入已训练完成的PNN进行预测,测试函数Y=sim(net,X),Y为预测结果,X为归一化验证样本矢量。网络输出:Y=1354212归一化后的尿胆素原验证样本数据和网络的预测结果如表4所示。   表4尿样颜色分类结果   Tab.4The classification results of urine color   验证样本.049 00.601 70.152 60.567 20.843 60.152 60.567 2G0.092 20.505 20.939 30.748 70.229 80.187 50.304 0B0.083 60.627 10.847 80.813 90.321 40.134 50.389 3期望输出-++++++-+--+预测结果-++++++-+--+   4结论(1)与尿液生化分析颜色色差方法[1]进行了比对,预测值Y与计算颜色色差方法结果完全一致,说明网络有较好的预测精度,概率神经网络用于尿液生化分析中的尿样颜色识别是完全有效的。(2)该方法无须进行色空间转换,只利用设备原有RGB颜色空间RGB值即可实现,用MATLAB语言编程,结果直观,具有良好的图像界面支持,易于操作,具有一定的使用价值。(3)由于照明光源直接影响物体的颜色,因此尿样检测的照明光源要和提供检测项目标准阈值的照明光源相同或相近。参考文献:   [1]王春红,周越,赵红霞.基于色差评定理论的尿液生化分析方法研究[J].生物医学工程学杂志,):77-82.   [2]蔡明杰,贾宏志,毕波,等.基于黑白摄像系统的伪彩色处理[J].光学仪器,):33-36.   [3]YOUNES C,SURANJAN P,RONALD M.Conjugate gradient and approximate newton methods for an optimal probabilistic neural network for food color classification[J].Optical Engineering.):.   [4]LIU G.Remote sensing image segmentation with probabilistic neural networks[J].Geospatial Information Science,):28-32.   [5]柳松,王展.基于径向基概率神经网络的人脸识别方法[J].计算机工程与科学,):57-60.   [6]荆其诚,焦书兰,俞柏林.色度学[M].北京:科学出版社,1979.   [7]王文成.神经网络及其在汽车工程中的应用[M].北京:北京理工大学出版社,1998.   [8]飞思科技产品研发中心.神经网络理论与MATLAB7实现[M].北京:电子工业出版社,2005.
转载请注明来源。原文地址:
【xzbu】郑重声明:本网站资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息。
xzbu发布此信息目的在于传播更多信息,与本网站立场无关。xzbu不保证该信息(包括但不限于文字、数据及图表)准确性、真实性、完整性等。2018 年十大 AI 技术趋势:自动化机器学习(AutoML):无需编程即可创建模型
Anand Rao、Joseph Voyles和PiaRamchandani
本文介绍了人工智能(AI)领域将带来最大影响力的一些趋势。
眼下AI备受瞩目,许多商界和政府领导人在认真思考正确的举措。但是在实验室又有怎样的进展?毕竟学术和企业研究人员发现的成果将奠定AI在未来几年的发展方向。普华永道AI创业孵化器的研究人员团队将注意力放在了技术专家和商业领袖都应该密切关注的重大动向。下面介绍了这些趋势及其重要性。
1. 深度学习理论:揭密神经网络的工作原理
它是什么:模仿人类大脑的深度神经网络已经证明了它们通过图像、音频和文本数据来“学习”的本领。不过即使深度学习已使用了十年多,还是有许多方面我们并不了解它,包括神经网络如何学习,或者为什么它们表现如此出色。这种情况可能会发生变化,这归功于将信息瓶颈原理运用于深度学习的一种新理论。实际上,该理论认为:在初始拟合阶段之后,深度神经网络将“遗忘”并压缩噪声数据(noisy data),噪声数据指含有大量额外的无意义信息的数据集,同时仍保留数据表示什么方面的信息。
为什么很重要:只有理解深度学习确切的工作原理,深度学习才能有更大的发展和应用。比如说,那样可以深入了解最佳的网络设计和架构选择,同时为安全苛求或监管应用提供更高的透明度。如果探索将这个理论运用于其他类型的深度神经网络和深度神经网络设计,预计会看到更多成果。
2. 胶囊网络:模拟大脑的视觉处理本领
它是什么:胶囊网络(capsulenetwork)是一种新型的深度神经网络,它处理视觉信息的方式与人类大脑基本上如出一辙,这意味着它们可以保持层次关系。这与使用最广泛的神经网络之一:卷积神经网络形成了鲜明对比,卷积神经网络没有将简单对象和复杂对象之间重要的空间层次关系考虑进来,因而导致错误分类、错误率很高。
为什么很重要:对于典型的识别任务而言,胶囊网络有望通过减少错误来提高准确率,幅度高达50%。它们还不需要同样多的数据来训练模型。预计会看到胶囊网络广泛应用于许多问题领域和深度神经网络架构。
3. 深度强化学习:与周围环境进行交互以解决商业问题
它是什么:这种神经网络的学习方式是通过观察、行动和奖励,与周围环境进行交互。深度强化学习(DRL)已用于学习游戏策略,比如Atari和Go,包括击败人类冠军的著名的AlphaGo软件。
为什么很重要:深度强化学习是所有学习技术中通用性最强的,所以它可以用于大多数商业应用。与其他技术相比,它训练模型所需要的数据较少。而尤其抢眼的是,它可以通过模拟来加以训练,因而完全不需要标记数据。鉴于这些优势,预计明年会出现更多的商业应用结合深度强化学习和基于代理的模拟。
4. 生成式对抗网络:配对神经网络以促进学习、减轻处理负担
它是什么:生成式对抗网络(GAN)是一种非监督式深度学习系统,通常部署两个竞争型神经网络。一个网络即生成器(generator)创建与真实数据集一模一样的虚假数据。第二个网络即鉴别器(discriminator)获取真实数据和合成数据。随着时间的推移,每个网络都不断改进,从而让这对网络能够学习特定数据集的整个分布情况。
为什么很重要:生成式对抗网络让深度学习可以处理种类更广泛的非监督式任务,这些任务要么标记数据不存在,要么获得数据的成本太过高昂。它们还减轻了深度神经网络所需的负担,因为这两个网络分摊负担。预计会看到更多的商业应用(比如网络检测)采用生成式对抗网络。
5.精益增强数据学习:克服标记数据挑战
它是什么:机器学习(尤其是深度学习)最大的挑战是有大量的标记数据来训练系统。两种广泛的技术有助于解决这个问题:(1)合成新数据,(2)将针对某一个任务或领域训练的模型迁移到另一个任务或领域。一些方法让这两种广泛的技术成为“精益数据”学习技术,比如迁移学习(transferlearning,将从一个任务/领域学到的洞察力迁移到另一个任务/领域),或一次性学习(one-shot learning,迁移学习应用到极端情况下,在只有一个相关例子,甚至没有例子的情况下学习)。与之相仿,通过模拟或插值来合成新数据有助于获取更多的数据,因而增强现有的数据以改善学习。
为什么很重要:使用这些技术,我们可以解决一系列更多的问题,尤其是历史数据较少的问题。预计会看到更多种多样的精益增强数据,以及不同类型的学习运用于一系列广泛的商业问题。
6. 概率编程:简化模型开发的语言
它是什么:这是一种高级编程语言,更容易让开发人员能够设计概率模型,然后自动“解答”这些模型。有了概率编程语言,就可以重复使用模型库,支持交互式建模和形式验证,并提供促进通用模型类别中的泛型高效推理所必不可少的抽象层。
为什么很重要:概率编程语言能够适应不确定、不完整的信息,而这类信息在商业领域司空见惯。我们会看到这些语言得到更广泛的采用,预计它们还会运用于深度学习。
7. 混合学习模型:结合为不确定性建模的多种方法
它是什么:不同类型的深度神经网络(比如GAN或DRL)已经在性能和广泛应用方面展现出了大好前景,适用于许多不同类型的数据。然而,深度学习模型无法像贝叶斯方法或概率方法那样为不确定性建模。混合学习模型结合了这两种方法,集每种方法的优点于一身。混合模型的几个例子是贝叶斯深度学习、贝叶斯GAN和贝叶斯条件GAN。
为什么很重要:有了混合学习模型,就可以扩大可处理的商业问题的种类,包括具有不确定性的深度学习。这可以帮助我们提升模型的性能和可解释性,进而会促使得到更广泛的采用。预计会看到更多的深度学习方法获得贝叶斯方法,而概率编程语言开始会结合深度学习。
8. 自动化机器学习(AutoML):无需编程即可创建模型
它是什么:开发机器学习模型需要一个耗时、专家驱动的工作流程,这个流程包括数据准备、特征选择、模型或技术选择、训练以及调优等。AutoML使用许多不同的统计和深度学习技术,旨在使这个工作流程实现自动化。
为什么很重要:AutoML是AI工具大众化的一部分,让商业用户能够在编程方面没有扎实背景的情况下开发机器学习模型。它也有望缩短数据科学家用来创建模型的时间。预计会看到更多的商业AutoML软件包、更庞大的机器学习平台里面整合AutoML。
9. 数字孪生:虚拟复制品不仅仅用于工业领域
它是什么:数字孪生(digitaltwin)是一种虚拟模型,为详细深入地分析和监控物理系统或心理系统提供便利。数字孪生这个概念起源于工业界,广泛用于分析和监控风车农场或工业系统之类的系统。现在,使用基于代理的建模(用于模拟自主代理的行为和交互的计算模型)和系统动力学(计算机辅助的策略分析和设计方法)行为,数字孪生被运用于分析和监控非物理对象和流程,包括预测客户行为。
为什么很重要:数字孪生有助于促进物联网(IoT)的发展和更广泛的采用,为预测性诊断和维护物联网系统提供了一条途径。展望未来,预计数字孪生在物理系统和消费者选择建模中会得到更广泛的使用。
10. 可解释的AI:了解黑盒子
它是什么:如今使用的机器学习算法种类繁多,这些算法可以在各种不同的应用中感知、思考和行动。然而其中许多算法被认为是“黑盒子”,它们如何得出结果方面几乎不为人知。当下可解释的AI蔚然成风,旨在开发这种类型的机器学习技术:在保持预测准确性的同时,生成更易解释的模型。
为什么很重要:可解释、可证明、透明化的AI对于为技术赋予可信任性至关重要,并促进机器学习技术得到更广泛的采用。在开始大规模部署AI之前,企业会采用可解释的AI,作为一个要求或最佳实践,而各国政府在将来可能会将可解释的AI列作一项监管要求。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点}

我要回帖

更多关于 神经网络 输出概率 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信