人眼在识别眼睛是怎么看到物体的时,主要的局限性有哪些

深度: 刷脸时代到来!你的脸就是最强密码
智东西(公众号:zhidxcom)
导语:去年,马云刷脸在淘宝上买下汉诺威展邮票,“刷脸场景”火遍大江南北。实际上,除了金融支付,当单位门禁、课堂考勤识别从指纹换成人脸时,人脸识别类应用已经被频繁应用。未来,分散在各地的摄像头连接成一个有机的巨大“天网”,“刷脸”应用将成为下一代重要的交互模式。
人脸识别,类属视觉模式的一个细分领域,成为继智能语音后的又一块技术热点。不限于好莱坞科技电影中炫酷的“天眼”扫描场景,人脸识别技术已经渗透到多类日常。去年,马云刷自己的脸在淘宝上买下汉诺威展邮票,“刷脸场景”火遍大江南北。实际上,除了金融支付,当单位门禁、课堂考勤识别从指纹换成人脸时,人脸识别类应用已经被频繁应用。
一、摄像头代替“人眼”
所谓“计算机视觉”,即让计算机模仿人的双眼,完成相关任务和指令。如获得物体信息,识别有意义的概念、与此前知识体系匹配,进行判断和解读。这一系列看似简单的任务,对机器来说却并不那么容易实现。
要完成人脸识别的工作,首先需要进行准确的“人脸检测”,即计算机在图像或视频中找到人脸的位置,只需要判断目标图像是不是人脸。例如当前大部分照相机,及手机摄像头都有人脸检测功能,可以自动获得人脸位置,从而对图片作一些自动调焦和优化。
随后,计算机会针对图像的具体信息进行提取,包括人脸部件点定位,人脸图像的对齐和归一化,人脸图像质量选取,特征提取,特征比对等。此时,可以对人脸进行一些身份信息判读,包括性别、年龄,甚至颜值。
值得强调的是,在金融支付与身份验证场景中,多将人脸检测作为辅助性手段,使用者往往需要提前出示自己的身份。这是一种“1:1”的身份验证,计算机对当前人脸和库存人脸进行比对,是对其他验证方式的一种辅助,从而提高身份验证的可靠性。
但在一些侦查类戏剧作品中,警察通过联机查保存了所有通缉犯数据的人脸库,将所获取的通缉犯信息放到通缉犯数据库中去逐个比对,以获取匹配度最高的嫌疑犯。每次人脸识别计算机要作n次人脸比对,这就是“1:n”的人脸查找。
如果要求计算机只凭人脸识别出一个人的身份,就是最常见的“1:n”模式,其目标人脸库由n个人脸组成,随着n的增大,准确识别的难度也会增大,一次识别所需要的计算时间也会增加。一个普通的人能对数十量级上进行判断人脸的准确识别,随着n的增加,计算机识别的优势得到凸显。
人脸识别技术的比较维度很多,除了常见1:1,1:n比对级,还包括n:n,其衡量的标准不同。单从精确度上看,国内外视觉识别技术公司的识别正确率差异多体现在小数点上,比较意义不大。商业适用性则成为更加最关键的强化方向,以及实际使用场景中的准确率和可靠性。
二、初创和巨头的不同玩法
目前国内人工智能方向的创业公司约200家左右,其中一半获得了投资,超过70%的公司主攻图像或语音识别两个分类,其中部分人脸识别水平可比肩甚至超过美国。诸如Face++、Sensetime等初创公司,正在不遗余力地引进尖端人才方面。包括汉王、大恒、奥普光电等上市公司已经在B端市场的安防、工业制造领域占据领先份额。
计算机视觉已成为人工智能板块最受投资青睐的领域。 据数据网站显示,国内计算机视觉领域公司约30家,其中完成融资的公司接近80%。换个说法,凡是公司的业务与技术以计算机视觉应用为主,那么被投资的概率就是80%。这样的资本青睐程度放到整个互联网圈都是十分可怕的。
另一方面,相比于小规模创业者的做法,拥有海量数据与庞大业务规模的互联网巨头们开始了从内向外的创新和布局。腾讯在内部组建了人脸识别团队优图实验室。百度人脸识别也依靠庞大的数据资源得到指数级积累,阿里巴巴控股某人脸识别企业,将结合自家平台人脸数据优势,推动人脸识别2C的发展。
但此类公司对机器视觉产业的开发主要还是集中在工具化方面,例如腾讯的鉴黄服务、百度的识图功能等,主要应用在自有的产品体系中。
视觉尝试盈利模式、换取利润的同时,也积累了大量的底层影像和图片数据。图片数据支持着相关技术算法的优化,在机器视觉技术越来越先进的同时,也将会渗透到更多的场景当中去,例如电商的图片检索、机器人模块植入等。
巨头和初创们在起跑线摆出了火拼的架势,商业大战前的硝烟味在弥漫。
三、渗透进不同场景
目前,人脸识别技术重点应用的领域是安防和金融。前不久,科大讯飞在年度会议上推出的“晓曼机器人”,可替代银行柜台人员完成交易,称明年三月产品将落地。
据统计,国内至少已有多家银行开始试水人脸识别技术,不用带卡就可以从ATM机上“刷脸”取款。比较早的有招商银行、上海银行。另外,中国银联也联手Linkface打造人脸识别互联网+金融支付新产品,并试点于徽商银行。此外还在以下领域得到应用。
布局金融人脸识别的大佬已排满,看看其他领域还可分杯羹吗?
1)身份验证
今年十一月滴滴引入了人脸识别技术,以此来提高安全系数。据悉,滴滴顺风车新车主首次接单前需通过人脸识别系统审核后才能在平台接单,以防止私换司机等违规行为,保障乘客安全。
顺风车系统会要求车主通过摇头、眨眼等动作进行人像采集,并将车主上传的面部信息及其注册时使用的证件信息与公安部数据库进行比对,成功后才能正式接单。而采用人脸识别技术是为了保证司机注册账户和本人信息相符。
2)公共安全
在旅客进行正常的安检工作的同时,人脸识别系统会自动将旅客证件照片与之核对,识别旅客身份,其准确率远高于人眼识别,即使旅客换了发型、化了浓妆也没关系。
国家网络安全宣传周上获悉,目前“人脸识别技术”已经用于反恐活动中,该技术为动态识别,每秒钟能够识别5-8个人的身份。今年6月份已在广州地铁站进行试点。
此外,人脸识别门禁应用也在万科、金地、广州越秀、四川蓝光等智慧小区落地。通过人脸识别对访客、外来人员、周边服务人员起到良好的管理作用,并提升O2O服务水平和保障。
3)娱乐社交
微软曾推出刷脸应用 ——“微软我们”(TwinsOrNot.net),只需任意上传两张人物照片,就可以知道他们长的有多像,比如,测试你是否和某个明星长得很像,或者夫妻/男女朋友是不是有夫妻相等。
How-Old.net风靡全球,它们都很巧妙地将人脸辨认与社交网络中的人际交往结合在一起,年龄、性别、颜值、测测就知道。
时拍照贴脸录像的娱乐性app–脸优。脸优是利用人脸多个特征点,实时完成“贴脸”的功能。
4)物件签收
今年十月,中国邮政与腾讯达成全面战略合作,EMS将充分利用微信公众号与手机QQ平台,实现’预约-寄件-支付-查询-收件’的自有平台一站式服务。
据介绍,未来腾讯优图人脸识别技术也将广泛应用于EMS的政务、贵重物品和重要文书快递中。这也意味着,以后去取快递可以直接“刷脸”。
四、待填满的市场缺口
现在不管是国际、国内,针对人脸识别还没有(行业)标准,处于比较混沌的早期状态,具有实力的公司在未来还有很大机会脱颖而出。
人脸识别技术在使用方式上,辨识方便性上,留存现场使用者人像照片上均有非常明显的优势,在ImageNet等国际测试中准确率不断被刷新,但在实际场景的应用中还存在些许的发展瓶颈。
第一,视频传感设备的制约。人脸识别技术成像必须依靠摄像头采集深度信息,常采用红外光和可见光两种方案。
对于近红外技术而言,人脸识别的摄像头模组需专门的模组提升辨识精度,势必降低其摄像头的兼容性;而可见光技术,理论上任何普通摄像头均可使用,但是当前摄像头行业中在视频清晰度、光线适应性上缺乏明确标准,聚焦方式和聚焦能力也各不相同。
在一定程度上,摄像头本身的发展速度,制约着人脸识别技术的拓展以及普及性,也势必制约大市场的爆发和使用的辨识效率。
第二,由于软件开发以及各种半导体零部件占据了绝大多数成本,而其中较为核心的零部件还需要进口、底层软件开发方面在国内更是存在大量市场空白。
第三,易受到光照,角度,人脸部的装饰物等各种因素的影响。这也不难解释为什么人脸识别技术目前还没有大量应用在日常生活中,大部分人只能在科幻电影中接触人脸识别了。
第四,活体识别。能区分真人和照片的技术,这个研究领域叫liveness detection,中文叫做“活体取证”。
因为现在社交网络、电子成像产品很发达,人们可以很方便获取他人的人脸照片,进而来欺骗人脸识别系统,所以区分系统前的人脸是真的人脸,还是照片/视频/三维面具,就变得非常重要。
对于照片欺骗,主要是根据分辨率(翻拍的照片分辨率比直接从真人上采集的照片在质量、分辨率上有差别)、三维信息、眼动等来区分。对于视频欺骗,根据三维信息、光线等来区分。对于三维面具欺骗,这方面的研究还很少(实际欺骗场景也相对较少)。
计算机算法是可以区分照片和真人的。但是人脸活体取证在实际应用中,还有很大局限性。现在的算法基本还是基于实验室数据,离实用存在一段距离。
另外,在指纹、虹膜等模式识别上也面临这个问题。
历经两起两落,人工智能技术在第三次高潮的推动下初见落地之势。基于深度学习神经网络算法在语音和视觉识别上的进展,识别率分别超过了99%和95%,感知智能时代已经逼近。最初在工业领域应用的机器视觉,逐步在日常生活场景中得到落地,从平面的图像识别向含有深度信息的人脸和其他模式识别过渡。
但据业内人士透露,国内人脸识别厂商在核心算法上拥有自主知识产权的极少,大部分国内外的人脸识别技术多数在OpenCV等开源库上进行新规则添加,或使用其它公司的收费SDK等。并且该领域的创业公司整体规模仍较少,从侧面也反映出其技术门槛和对口人才稀缺。
从总体上来看,从机器视觉产业的构成来看,视觉处理软件、镜头、工业相继、图像处理单元、图像采集卡都是必不可少的几个环节。未来,视觉识别技术公司对于芯片和模块厂商的支持需求旺盛,双方将走得更近,另外,创业公司的产品在扩宽渠道和领域时会偏更向消费者市场,如机器人和无人机等产品。上周,鸿海集团旗下子公司FOXTEQ HOLDINGS 参投了Face++ 2000万美元投资,不无与富士康投资的Pepper合作可能。
从产业链上发力,创业公司可能寻找到更多的投资机会。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。理解深度学习的局限性 - 娱乐圈
理解深度学习的局限性
大数据文摘作品,转载要求见文末作者 | THINKMARIYA编译 | 张礼俊,曹翔人工智能空前火热。许多公司已经用 IBM Watson 系统取代了工人;人工智能算法甚至能比医生更准确地诊断病人。新的人工智能创业公司如雨后春笋,宣称可以使用机器学习来解决你所有个人问题和商业问题。 许多平时看似普通的物品,像是果汁机、Wi-Fi 路由器,做广告时都说自己由人工智能驱动。又比如智慧书桌,不仅能记住你不同时段所需要的高度设置,还能帮你叫外卖。许多喧嚣人工智能的报道其实是由那些从没亲手训练实现过一个神经网络的记者,或是那些还没解决任何实际商业问题却想招募天才工程师的初创公司写的。怪不得大众会对人工智能能做什么不能做什么有那么多误解。不可否认,深度学习让人异常兴奋神经网络早在六十年代就被发明,但最近大数据和计算能力的提升才使它在实际应用中取得效果。已经出现了一个名为 " 深度学习 " 的新学科,它可以应用复杂的神经网络架构,比以前更准确地对数据模型进行建模。深度学习成果斐然。如今,深度学习可以识别图像和视频中的物体,可以将语音转化成文字,甚至比人做得更好。谷歌将谷歌翻译的结构替换成了神经网络,现在机器翻译的表现已经非常接近人类。
深度学习的实际应用同样让人兴奋。计算机可以比政府农业机构更准确地预测农作物产量;在诊断癌症上,甚至比最优秀的医师更加准确。美国国防部高等研究计划署的主管 John Launchbury 描述了人工智能的三个浪潮:1. 人工选择的知识表达,或者像是 IBM 深蓝、沃森这样的专家系统。2. 统计学习,包括机器学习和深度学习。3. 内容适应,涉及到用稀疏数据给现实世界的现象构建可靠可解释的模型,像人类一样。作为人工智能第二波的一部分, 深度学习算法效果很好,这是因为 Launchbury 所说的流形假设。简单来说,这是指出了在较低维度下可视化时,不同类型的高维自然数据如何趋于聚集和变形。通过数学操作和分离数据块,深度学习能够区分不同的数据类型。虽然神经网络可以取得精确的分类及预测能力,这些本质上源于 Launchbury 所说的 " 增强版的电子表格 "。深度学习也有深层问题最近湾区人工智能创业者会议上,Francois Cholle 强调说深度学习仅仅只是比之前的统计和机器学习方法更强大的模式识别方法。 Cholle 是谷歌人工智能研究员,也是发明了深度学习 Keras 的著名开发者。他认为人工智能最关键的问题是抽象和推理。现如今的监督学习和强化学习需要太多数据,无法像人一样做推理规划,只是在做简单的模式识别。相反,人类可以从非常少数的例子中学习,可以安排长期的计划,并且能够形成一种情形的抽象模型,并将这些模型用到更多不同的情况之中。即便让深度学习算法学会非常简单的人类行为也是一件费劲的事! 想想看当你走在路上想要躲开撞向你的车时,如果你想通过监督学习决定下一步要怎么做,你需要大量标记了车辆情景和应该采取的行动的数据,像是 " 停止 " 或者 " 移动 "。然后你要训练一个神经网络去学习情景和应该采取的行动之间的映射。如果用强化学习的方式,给你的算法一个目标,然后让它自行决定最佳的行动是什么,在计算机学会不同道路情况下躲开汽车之前,可能早已经被车撞死几千次了Chollet 提醒人们不可能仅仅通过加强当今的深度学习算法来取得通用智能。人类只要别人说一次就知道要避开车。我们有能力从少数例子来泛化我们学到的知识,并且可以想象从被车撞到后会有多糟糕。我们大多数人很快就能学会毫发无损的躲开汽车。当神经网络在大规模数据上取得统计意义明显的成果时,个体数据上却是不可靠的,并且常常会犯人们不会犯的错误,比如把牙刷预测成棒球棍。你的结果只会和你的数据一样好。给神经网络不准确或者不完整的数据只会得到错误的结果。这些结论既很尴尬,还很危险!两次公关危机中,谷歌错误得把黑人识别成大猩猩,微软的系统仅仅用推特的数据训练几小时后就学会种族歧视,女性歧视的言论了。我们的输入数据中潜藏着不希望的偏差。谷歌庞大的词向量系统建立在谷歌新闻的三百万条新闻之上。数据集会自己做出像父亲是医生母亲是护士的联系,反映了我们语言中的性别偏见。波士顿大学的研究人员 Tolga Bolukbasi 借助了亚马逊 Mechanical Turk 众筹平台,利用人们的评分来尝试去除这些偏见的联系。Bolukbasi 认为这个思路是至关重要的,因为词向量不仅会反映成见,还会放大成见。如果医生更多的和男性联系在一起,那么算法会优先将男性工作申请者匹配到医师的职位上去。最后,生成式对抗性网络的发明人 Ian Goodfellow 展示了神经网络会被反例给欺骗。给图像做一些人眼看不出来的操作之后,复杂的攻击者欺骗了神经网络使其无法正确识别出物体。深度学习之后是什么?我们如何克服深度学习的局限性并通向通用智能呢?Chollet 最早的计划是从数学证明领域开始使用超越人类的模式识别,比如深度学习来帮助增强搜索和形式系统。自动定理证明器通常暴力搜索每一种可能的情形,实际应用中很快就会遇到组合爆炸的问题(搜索时间指数性上涨)。在深度数学项目中,Chollet 和他的同事使用深度学习来协助定理搜索的过程,模拟数学家关于哪些引理会是有用的直觉。另一种方式是开发更易于解释的模型。手写识别中,神经网络通常要有成千上万的数据才能达到还不错的分类结果。相比着眼于像素,Launchbury 认为生成式模型可以学会任意一个文字的笔划,然后用这些笔划信息来区分相似的数字,比如 9 和 4。卷积神经网络的创始人兼脸书人工智能研究总监 Yann LeCun 提出了一种基于能量的模型来克服深度学习中的局限性。通常而言,我们只会训练神经网络产生一个输出,像是一个图像的标签或者一句话的翻译。LeCun 的基于能量的模型则给出了所有可能输出的集合,比如说一句话所有可能的翻译方式,以及每种翻译方式对应的评分。深度学习之父 Geoffrey Hinton 想用块状结构
来取代神经网络中的神经元结果。他相信这样能更准确地反映人类大脑的生理学模型。生物进化必然已经发现了一种能高效地在初级神经感知回路进行特征调整的方式,这些调整会对后续神经回路特征表达非常有用。Hinton 希望块状的神经网络结构能够更有效的应对之前 Goodfellow 提出的对抗训练。也许所有这些克服深度学习局限性的方法都有自己的价值,也许都没有。只有时间和人工智能领域的持续投入才能告诉我们答案。扫码报名Strata Data Conference 大会大数据文摘专享优惠截至 5 月 5 日来源://understanding-the-limits-of-deep-learning/关于转载如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 | bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称 - 待授权公众号名称及 ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:。志愿者介绍回复 " 志愿者 " 了解如何加入我们往期精彩文章点击图片阅读文章手把手 | 教你爬下 100 部电影数据:R 语言网页爬取入门指南人眼疲劳识别系统
咨询眼科医生,年轻人眼疲劳,以后导致玻璃体浑浊,可以治愈吗?现在每天看事物有毛毛来回飘动。 咨询眼科医生,年轻人眼疲劳,以后导致玻璃体浑浊,可以治愈吗?现在每天看事物有毛毛来回飘动。
医生建议:你这个可能是飞蚊症,有没有眼底的检查报告
aikang10941 |
14:21:43共有1条回答
请问,老年人眼疲劳,是何原因?吃什么食物有益?
你好:可以吃一些鱼肝油。有什么问题,可以继续提问。
11:03:25共有2条回答
老年人眼疲劳,吃什么食物有益?
你好,可以适当多吃一些鱼肉、猪肝、胡萝卜等含维生素A丰富的食物,有利于改善眼干等症状。
21:26:43共有2条回答
健康咨询描述:
不同色光在人眼系统的留影时间一样长吗?.。。。。。
曾经的治疗情况和效果:
。。。。。。。。。
想得到怎样的帮助: 。。。。。
指导意见:
你好这个不同色光在人眼系统的留影时间是不一样的
16:31:41共有2条回答
请问免疫系统可通过哪些机制识别自身和非自身.
免疫球蛋白(Ig)是一组具有抗体活性的蛋白质,主要存在于生物体血液、组织液和外分泌液中,是检查机体体液免疫功能的一项重要指标。人类的免疫球蛋白分为五类,即IgG、IgA、IgM、IgD和IgE,其中IgD和IgE含量很低,故我们常规所测定的Ig主要为IgG、IgA、IgM三项。血清中免疫球蛋白异常,应该是比较重要的数据。
skymvrong |
19:29:54共有1条回答
Copyright (C)
琼ICP备号-6
& & 爱康版权所有
本网站敬告网民:身体若有不适,请及时到医院就诊。扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
下载作业帮安装包
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
人眼根据什么识别物体的距离物体与眼睛的距离,先从水射入玻璃再射入空气中,所成的虚像与眼睛的距离以及实物发出光线到人眼传播路程的关系。如果有公式帮忙换算一下——传播了两厘米。
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
根据“双眼单视”原理(和“对眼”有点类似,就是不如电影上的“对眼”夸张),通过肌肉调节的紧张程度判断距离.(立体电影或立体电视就是这个道理).实际只有一只眼的人,还可以根据晶状体睫状肌的紧张程度大致判断距离,比双眼效果会相差很多.
帮忙换算一下...谢谢
为您推荐:
其他类似问题
参照物呀。
那参照物的距离呢?
扫描下载二维码404找不到相关页面_久久问答_中国权威的健康问答平台
1.您要访问的网页不存在或已被删除。
2.请检查您输入的网址是否正确。
Copyright (C)   版权所有 玖玖叁玖网络技术(北京)有限公司 京ICP备号
特别声明:本站信息仅供参考 不能作为诊断及医疗的依据 本站如有转载或引用文章涉及版权问题请速与我们联系}

我要回帖

更多关于 眼睛是怎么看到物体的 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信