为什么说深度学习不是万能的锤子

点击联系发帖人 时间：2017-12-16 02:31

MP: 连续登录：天
条关于我的新回复，
条新通知，
条新传呼，
> 五花八门
人类是如何认知世界的？
我们的大脑前额叶皮质是认知发生的主要区域。它是人类大脑进化中变化最大的部分，有着广泛复杂的神经联系。它主要负责认知、记忆、判断、分析、思考，而且善于纠错。我们的大脑中有近千亿的神经元，每个神经元又有数千突触，突触之间以生物电流相连接，形成回路，而这样的回路是可以改变的。比如你过去以为所有的天鹅都是白色的，直到遇见一只黑天鹅。从此以后，你对“天鹅”的认知就有了改变。这就是我们的学习过程。
深度学习就是受到了人类神经系统工作机制的启发。
深度学习终于能够见效，总结起来原因有二：一是我们今天拥有了具备强大计算能力的计算机，二是我们所处的社会拥有了大量的数据。
我很认同“谷歌大脑”创始人吴恩达的一句比喻：深度学习就像是建造火箭，如果你想造火箭，怎么做？太空火箭是个巨大的引擎，同样需要很多燃料。如果引擎太小或燃料不够，火箭哪儿都去不了。火箭引擎就是我们必须要训练的电脑，以及神经网络，燃料就是大数据，两者结合，火箭才能越飞越远。
过去人类几千年的实验科学、几百年的理论科学，以及几十年的计算科学，似乎是由一些非常智慧的“最强大脑”引领的，例如牛顿、爱因斯坦，他们从比较小的数据中进行观察，比如看到一只苹果掉下来，会思考万有引力；观察到在不同铁轨上迎面开来的两列火车，考虑到相对运动的问题，然后再进行推理演绎，归纳出一条定律或一个公理。
中国人工智能学会理事长、工程院院士李德毅却认为如今的大数据时代下，已经不太可能再出现像牛顿、爱因斯坦这样用一个约束好的方程来描述一个规律的科学家。
大数据改变了我们对整个世界的管理方法，我们不再是简单地靠一个天才想象一个公理来演绎，相反，我们是通过大数据来归纳，而且在归纳过程中，还需要特别注意一些特例现象。所以，我们有了大数据，我们需要强调个性化，强调对数据的收集和挖掘。机器的深度学习便是上述现象的一个缩影。
当然，深度学习虽然足够让大多数人工智能的研究者为之振奋，却还是具有明显的局限性。
如何让机器学会常识、直觉，对机器和研究者来说，都是大难题。怎么去做一个策划或计划安排，而不是做一次性的决定，比如我们要有一次很好的旅游体验，不是买张机票就解决了，我可能要知道去什么地方、做哪些事情、住什么酒店、吃什么食物、看什么景点，需要有计划安排，深度学习还是没有办法做到的。
如果小孩子要认识苹果，妈妈要给他识别一万只甚至更多苹果，他才能认出“这是只苹果”，妈妈一定要崩溃了。小孩子学习认识苹果，你只要告诉他这是苹果，也许给他看三只苹果，他就能完全认知“苹果”的概念，而不用给他展示一万只苹果。再比如机器虽然可以从一堆图片中辨认出某种鸟类，也能识别哪种会飞、哪种不会飞，但需要成千上万甚至更多的例图，并且始终不会明白为什么这种鸟会飞、那种鸟不会飞。因为有些数据不可能大量提取，成本太高，就好像如果学开车不可能要出过很多次车祸才能学会不撞车。
还有一点不可忽视，研究者通常只是知道机器是否在深度学习，很难说出机器自身的程序、参数究竟怎么在学习，看上去就像是一个“黑盒子”，甚至有时候机器会出现一些出乎意料的学习结果，这也引发一些哲学层面的思考：机器会不会失控，会不会给人类带来一些恼人的结果？
这些未解之谜，都等待着我们一步步探索、一步步解决，不故步自封，亦不妄自菲薄。这也许就是科学本来的样子，学无止境，但总有执着的人为之跋涉。
乐昆说：“这正是我们现在做的——训练机器和预测未来会发生什么，就算那个未来可能是我们无法想象的。”&
赞() 推荐() 收藏()
使用匿名回复评论需回复可见
24小时热评推荐
猜你也喜欢
扫码关注猫扑微信
扫码关注猫扑微博深度学习在无人驾驶中发挥了什么作用？
新智驾按：作者Kevin Zhong，博世辅助驾驶研发工程师。原文载于知乎，雷锋网获授权转载。深度学习在无人驾驶领域主要用于图像处理，也就是在摄像头上。当然也可以用于雷达的数据处理，但是基于图像极大丰富的信息以及难以手工建模的特性，深度学习能最大限度的发挥其优势。现在介绍一下全球摄像头领域的巨擘，以色列的Mobileye是怎么在他们的产品中运用深度学习的。 深度学习可以用于感知，识别周围环境，各种对车辆有用的信息；也可以用于决策，比如AlphaGo的走子网络（Policy Network），就是直接用DNN训练， 如何基于当前状态作出决策。环境识别方面，Mobileye把他们识别工作主要分为三部分：物体识别；可行驶区域（Free Space）检测；行驶路径识别。物体识别一般的物体识别是这样的：有一个长方形框能识别出来车在哪里，但是Mobileye识别出来是这样的：以及这样的：很明显的区别就是Mobileye可以实现非常准确的车辆正面及侧面的检测，以及完全正确的区分左边侧面以及右边侧面（黄色和蓝色）。上图两种检测结果的信息量是完全不同的：左边的检测结果告诉我们什么位置大概有一辆车，但其具体位置，车的朝向信息完全没有。但右边的检测结果，可以相对精确的估算出车的位置、行驶方向等重要信息，与人看到后可以推测的信息差不多。这样出众的结果，对于较近距离的车，用其他基于几何的方法，多跟踪几帧，可能可以做到接近的效果，但是留意远处很小的车，结果也完全正确，这就只可能是深度学习的威力了。虽然Mobileye创始人兼CTO常发论文共享一些技术，但在车辆识别怎么建模，神经网络可以输出这么精确带方向的包围框（Bounding box），他只是微微一笑，说这里面有很多“tricks”。可行驶区域检测深度学习以前的可行驶区域检测，有两种方法：一是基于双目摄像头立体视觉或者运动恢复结构（Structure from motion）； 二是基于局部特征，马尔科夫场之类的图像分割。结果是这样的：绿色部分是可行驶区域检测，看着还不错对不对？ 但是注意左边的绿色部分涵盖了马路“倒鸭子”（注：路边石）以及人行道部分，因为“倒鸭子”也就比路面高十厘米左右， 靠立体视觉是很难跟马路区分开来的。而传统的图像分割也很困难，因为局部特征上，“倒鸭子”上和路面的颜色极其接近。区分二者需要对环境的综合理解。自从有了深度学习可以做场景理解（ Scene Understanding ）之后，这个问题终于被攻克了：绿色部分还是可行驶区域，马路右边的路肩跟路面的高度相差无几，颜色也是一模一样，用立体视觉的方法不可能区分开来。不仅仅可行驶区域的边界准确检测出来，连为什么是边界的原因也可以检测出来：红色表示是物体跟道路的边界，鼠标位置表示的是Guard rail（护栏），而上一张图应该是Flat。这样在正常情况下知道哪些区域是可以行驶的，而在紧急情况下，也可以知道哪里是可以冲过去的。当然，相较于第一部分，这一部分的原理是比较清楚的，就是基于深度学习的场景理解。学术界也有蛮不错的结果，如下图（Cambridge的工作），路面跟“倒鸭子”就分的很好（蓝色跟紫色）：行驶路径检测这一部分工作要解决的问题主要是在没有车辆线或者车辆线状况很差的情况下，汽车怎么驾驶的问题。如果所有的路况都如下图所示，那当然很完美，但是由于路况或者天气，有些时候车辆线是很难检测到的。深度学习为此提供了一个解决办法。我们可以用人在没有车道线的路况下驾驶的数据来训练神经网络，训练好之后，神经网络在没有车道线的时候也能大概判断未来车可以怎么驾驶。这一部分原理也是比较清楚的，找一个人驾驶，把整个驾驶的过程摄像头的录像保存下来，把人驾驶的策略车辆的行驶路径也保存下来。用每一帧图片作为输入，车辆未来一段时间（很短的时间）的路径作为输出训练神经网络。结果如下，可以看到神经网络提供的行驶路径基本上符合人类的判断：更极端的情况：绿色是预测的行驶路径。没有深度学习，这种场景也是完全不可能的。当然，不能完全依靠神经网络来做路径规划，Mobileye是综合传统的车道线检测、上述提到的场景分割检测到的护栏等、这一部分的神经网络输出等等，做信息融合最后得到一个稳定、完美的行驶路径。点击关键词可查看相关历史文章● ● ●热门文章● ● ● |  |  |  |  |  | 华为5G | Autopilot 2.0 |  |  | |  |  |  |  |  | 为什么说深度学习不是万能的锤子？
深度学习是人工智能的热门领域，发展非常迅速，有望在未来几年进入市场成熟阶段。但非不幸的是，迫不及待的市场炒作把深度学习变成了人工智能的代名词，言必称深度学习，无深度学习不人工智能，。数据分析公司Interset首席技术官Stephan Jou近日以人工智能在信息安全领域的应用为例，探讨了深度学习的定位和局限性，IT经理网编译整理如下：
在网络安全领域，人们使用各种技术理论，包括统计、概率论以及各种机器学习算法（深度学习只是其中之一），来分析用例和数据，选择最好的数学方法或者算法来完成任务。安全分析的数据来自各种渠道，例如应用日志、源代码等等，根据安全专家对数据集和用例的理解来对症下药，选择最合适的算法。
这个过程更依赖的是安全人员的一种工匠精神，因为他们面对的是相对较小的数据集，而各种行为的侦测非常微妙，例如从源代码审计日志中侦测内部威胁。相比之下，深度学习只是人工智能大框架中的一个专项技术而已，而且并不适用于上述场景。
简单来说，深度学习是一组机器学习算法，其学习过程离不开大量多层互联处理流程和海量数据样本。在很多行业深度学习处理之所以可行，是因为有大量的数据和计算力可用，例如云计算和GPU。在海量数据和计算力的驱动下，深度学习的研发成果突飞猛进。以恶意软件侦测为例，若干安全创业公司尝试利用深度学习来分析恶意软件样本大数据，取得了令人瞩目的成效。另外一方面，研究人员也在尝试如何让深度学习的训练基于相对较小的数据集，例如医学影像深度学习系统。（参考阅读：）
虽然在恶意软件侦测方面取得斐然的成绩，但是但是在安全领域，深度学习的局限性也很明显，例如内部人员威胁。安全专家或者企业通常无法获取足够多的相关攻击信息，虽然也有一些基于实例的描述和模拟数据，但是故事描述无法用来训练深度学习网络，而真实内部人员攻击事件的信息又太过稀缺。至少在今天，深度学习对于内部人员威胁是牛刀杀鸡或者说无能为力的。
未来，安全网络的深度学习处理系统将能够自动调整来适应不断增长的数据量，不断优化学习流程，深度学习网络将能够自动判断那些数据更加容易预测，从而大幅减少对数据科学家引导的依赖。这种基于深度学习的自动化学习能力，将持续大幅提升分析结果的准确性，减少误报。这些远景，在今天还只是一种炒作。
在当下的现实中，与OpenStack等开源云计算技术类似，深度学习系统的搭建依然过于复杂，成本也居高不下，而且不经过大量实验，很难实现确定所谓的超参数（Hyperparameter）。训练一个深度学习模型需要的计算力和采购成本也远高于其他机器学习模型。例如逻辑回归模型简单到可以在单机上处理小规模数据集，目前也依然是非常有效的分类任务处理方法，而深度学习系统的成本则远高于这些机器学习算法。
总之，深度学习仅仅是诸多机器学习方法中的一种，对于特定类型的问题来说，应用潜力巨大，但并非百病包治的万灵药。深度学习技术在一个领域的突破，也并不意味着对其他传统人工智能或机器学习方法的实用性和价值的贬损。
本文作者Stephan Jou是数据分析公司Interset的CTO
第一时间获取面向IT决策者的独家深度资讯，敬请关注IT经理网微信号：ctociocom
&&&除非注明，本站文章均为原创或编译，转载请务必注明出处并保留：文章来自
相关文章：
隐私已经死去，软件正在吃掉世界，数据即将爆炸
企业员工对WiFi的依赖性越来越高，企业的安全边界和数据安全正在面临与日俱增的WiFi移动安全威胁
来自开源组件和开源代码的安全威胁呈几何级数增长，严重威胁到信息安全“上游水源地”——安全开发和代码安全
一个电子商务网站只要速度慢一秒钟，每年的销售额损失就可能高达16亿美元。
对于大多数的企业技术和业务决策者来说，制定符合自身需求的物联网技术和方案开发展战略非常困难
企业的安全运营中心到底应该具备哪些核心职能，新时期CISO的技能、职责领导力需要覆盖那些领域呢？
用一百万欧元，一个企业就可以拥有含一万六千个 x86 核的私有云架构基础，并且对成本，外来情报威胁拥有绝对控制权，这是任何国家的公有云供应商都无法提供的。
要使物联网真正成为主流，企业就需要遵循清晰的检查清单来确保其物联网计划的安全。
Ruckus Wireless今天宣布推出全面定制解决方案Ruckus服务提供商云，帮助服务提供商向其客户提供高价值托管服务。
针对不同类型的设备和使用场景，教育机构如何能够确保学生安全进入Wi-Fi网络并获得最佳质量的连接呢？
为进一步推动消费品产业信息化应用，真正实现消费品产业信息化需求与供应有效对接，搭建消费品行业CIO与信息化解决方案供应商精准沟通的桥梁。
&Copyright (C) 2011,ctocio.cc - IT经理网}

我爱游戏网

为什么说深度学习不是万能的锤子

我要回帖

更多推荐