够了,锻炼人工智能不能再靠暴力填鸭式

沈玥:我们正在颠覆进化论,再造伊甸园 | 造就--百度百家
沈玥:我们正在颠覆进化论,再造伊甸园 | 造就
分享到微信朋友圈
我们能不能扮演上帝,创造生命?
华大基因x造就 联合呈现
华大基因 深圳国家基因库合成与编辑平台负责人
有三个问题困扰了人类几千年——我是谁,我从哪来,我要去哪里?
究竟我们的生命的本质是什么,我们从怎么样的一个形式,演化而来,我们未来可能会变成什么样子?
从上帝决定论到基因决定论
在文明初期,关于这个问题,西方主要是以上帝创世纪的故事呈现,而东方则是盘古开天辟地,女娲造人的传说。
冥冥之中,大家都觉得有一个超越生命之上的存在,在掌控着生命,这好像已经成为一个共识,但是科学的发展使得我们摒弃了这样陈旧的观念。
从孟德尔用三万多株豌豆发现遗传的规律,到后来格里菲斯和艾弗里证明了DNA才是遗传物质的基础,再到富兰克林通过晶体衍射给DNA拍了照片,在这个基础之上,沃森和克里克又通过解析DNA,发现它原来是双螺旋结构……这样一步一步,我们慢慢对生命的本质有了一个清晰的概念。
那么下一步就是研究这些信息是怎么样构成生命的,这样简单的四个碱基,A、T、C、G,它是以怎么样的一个形式,使得我们人成为人,动物成为动物?
在20世纪的最后十年,“人类基因组计划”使这个问题有了决定性进展。
参与“人类基因组计划”的六个国家,用了13年的时间,花了30亿美金,完成了第一个个人的基因组的测定和描绘,这之后,我们才大概知道了原来生命是这个样子。
在这之后有成千上万的基因组得到解析,我们慢慢地知道了我们头发的颜色,五官的样子,我们的高矮胖瘦,为什么会这么不同。
除了人类之外,我们对其它的物种也有了遍地开花的研究,我们越来越了解到生命是怎么样演化过来的;我们也知道物种之间的相似处和差别是什么。
所有的这些秘密都藏在基因和基因组里面。
人类和老鼠有80%的基因相似却样子如此不同,因为基因一直在变化
比如说我们和植物只有17%的相似性,我们和小白鼠却有80%的相似性,我们和猴子、大猩猩的相似性已经超过90%,我们人和人之间这么不同,但是在我们的基因组上,也只有0.5%的差异。
基因这个生命密码,就像是一个启动生命的程序,但它并不是一成不变的,相反,它一直在变化的。
大家看到西兰花、卷心菜、花菜,这几种我们餐桌上非常常见的食物,它们长相不同,味道不同,但它们却是甘蓝这个2500年以前出现的植物,因为基因随机突变,长期自然选择之后演化出来的一些新的生物。
我们逐渐颠覆达尔文之后,有没有可能开始扮演上帝?
随着技术的发展,我们已经进入可以人为加速生命密码改变的阶段。
比如说线粒体缺陷的问题。
线粒体是细胞里面的一个细胞器,当这个很小的细胞器产生缺陷之后,会导致非常严重的结果,比如说先天性心脏病,失明或者是肝衰竭,并且线粒体缺陷是随着母亲向下遗传的,这也就意味着如果一个母亲是线粒体缺陷疾病的患者,那她的孩子无一例外一定都是患者。
而人为的干预可以改变这个情况。
我们把患病母亲的DNA通过核移植的方式,转运到另外一个健康女性的卵子里面,然后用这个卵子,来做受孕的载体,这样一来就可以使得她的孩子不再成为线粒体缺陷类疾病的患者。
他的基因,即他的生命密码,也由此发生了改变,这个改变逆转了他一定会得病的命运。
所以,四十亿年前,生命主要是依靠随机突变和自然选择的一个方式去生存的,而我们现在正在通过一种并行式的思路,把进化的过程加速,使它成为一种可以是非自然选择、定向变异的过程。
在某种程度上,我们已经在逐渐地颠覆达尔文的进化论。
紧接着下一个问题是,我们有没有可能扮演上帝,创造生命?
这里的人造生命不是指AI,不是指Alpha Go,而是指我们在DNA、RNA,以及一系列必需的物质基础上,创造出来的一个活生生的生命。
这个问题在2010年的时候就已经有了一个非常肯定的答案。
第一个人造生命是以计算机为母体
这是一个叫做支原体的基因组的一个序列,科学家通过计算机以及四种不同化学试剂的配合,可以从无到有地创造一个完整的基因组,然后把基因组转移到一个受体的细胞里面,这个生命的密码得以启动,使得这个细胞摇身一变,变成另外一个物种,我们把这个物种叫做“辛西娅”。
“辛西娅”是第一个以计算机为母体的一个生命,它的出现意味着什么呢?意味着我们可以以计算机为起点,创造一个生命。
大多数的细菌都是原核生物,相比较而言是比较低等的生物,而生命的高级形式是真核生物,比如说我们人就是真核生物。
能否创造一个人造的真核生物,这是造物的一个新的高度。
这个微生物叫做酿酒酵母,我们平时用它来做面包、馒头,用来酿酒。最近,我们的团队做了一个酵母2.0版本,这个2.0版本就是世界上第一个真核的人造生物。
跟“辛西娅”和酵母1.0相比较,它的区别是什么?
简单来说,我们不仅是重现了一个真核生命,我们同时使得它变成了一种工具。
举个例子,大家都知道胡萝卜素,它主要是从胡萝卜里面提取出来的,这个胡萝卜素在你摄取之后,可以转化成维生素a,它能够改善你的眼睛和皮肤的问题,那么这个酵母2.0作为工具,只要简单地通过外源基因的导入,就能生产胡萝卜素。
甚至我们可以控制它的产量。所以这意味着未来我们不需要有胡萝卜,就可以获得大量的胡萝卜素。
再举另外一个例子,屠呦呦因为成功地从这种叫做黄蒿的植物中提取出青蒿素,获得了去年的诺贝尔医学或生理学奖。
青蒿素是目前用来治疗疟疾的唯一有效的药物,但是在黄蒿里面提取率非常低,只有1%~5%左右,而如刚才所说,通过酵母外源基因的导入,就可以使得我们的酵母变成青蒿素的一个细胞工厂,利用这样的技术,一个简单的一个生产线,青蒿素年产量即可超过全球需求量的三分之一,这是一个非常可观的数字。
未来5年,合成生物成本降到目前的1%?
在回顾我们创造2.0版本的酵母人造生命的历程里面,我们发现它在基因组的解读上,也是有同样的趋势,就是从小到大,从简单到复杂。
而能够使得我们有这样的发展是因为技术的更新换代。
从我们测第一个基因组需要13年到今天我们只要一天的时间就能完成一个个体基因组的测序;同样,过去合成技术一开始一天只能有百级的产量,到现在每天有万级的通量,使得成本上有了一个非常大的变化。
我们把测序与合成的成本做了一个对比,取了一个log值,你可以看到在2003年,两者的成本还差不多是一致的,但是后来,尤其是过去的五年里面,测序成本急剧降低使得两者之间的成本有了百万级的差距。
在过去的几年里面,我们的团队一直专注于如何提升技术从而降低成本,现在我们可以非常自信地说,在未来的5~10年,我们可以把这个成本降到现在的百分之一。
那么这个技术的突破会带来什么呢?
有可能在不久的将来,它能使得我们这个世界再次进入“寒武纪”时代,有大量的新物种,可以通过数字化的设计而产生。
合成生物学将解决90亿人口在地球生存的问题
大家可能会问,为什么我们要做这样的事情?
我们现在整个世界的人口是60亿,但是在不到40年的时间,这个60亿马上会变成90亿。
我们现在所有的食物、清洁能源以及我们的医药,都是围绕这60亿来准备,满足60亿人口就已经非常困难,更不用提90亿人口会是怎么样的一个挑战。
而合成生物学的知识和技术有可能改变这种现状。
“人造生命”、“新物种”这样的概念,已经不再是离我们很远的事情,好像科幻片里面才有的,它现在就在发生,这一刻就在发生。
在不久的将来,我们也许可以通过生物合成新物种的方式让更高效、更清洁的能源,全面取代传统能源;
青蒿素的产量不再由种植面积和天气来决定,可以完全在实验室通过生物发酵的形式,通过合成生物学的方式,大量地产生,惠及大众;
甚至说有器官移植需求的患者,他也不需要再经过漫长的等待,而是通过生物合成,让人工器官立等可取;
甚至未来我们的海量的数据,都不需要通过硬盘的方式来存储,一管DNA就可以代表整个文明史。
当那一天到来的时候,合成生物学就已经完全的改变了我们的世界。
造就:剧院式的线下演讲平台,发现最有创造力的思想
更多精彩内容及免费演讲门票,敬请关注:
分享到微信朋友圈
在手机阅读、分享本文
还可以输入250个字
推荐文章RECOMMEND
阅读:1150
热门文章HOT NEWS
著名笑星陈佩斯阔别荧屏这20年,他都经历了什么
百度新闻客户端
百度新闻客户端
百度新闻客户端
扫描二维码下载
订阅 "百家" 频道
观看更多百家精彩新闻够了!训练AI不能再靠暴力填鸭
近两年来,一种名叫“神经网络”的技术席卷了整个硅谷,许许多多的互联网服务都被注入了基于它开发的各种人工智能。不过,人工智能的研究人员也清楚地知道,神经网络仍然存在很多缺陷,以至于一些人产生了疑问:这类模式识别系统是不是一条正确的路径,能否带领我们我们走向更先进、更可靠的人工智能?从Facebook的人脸识别功能到微软(Microsoft)的翻译服务,再到谷歌(Google)的互联网搜索,它们背后都有神经网络的助力。因为神经网络能够通过分析海量数据来学习处理工作任务。除此之外,神经网络正开始帮助聊天机器人学习会话的艺术,它也是自动驾驶汽车和其他自动化机器发展潮流的基石。但是,如果没有大量结构化数据作为“粮食”,神经网络就无法理解这个世界,正因为如此,它们并不适合于处理一切工作任务。此外,对于神经网络基于何种逻辑做出特定决策,人工智能研究人员能够掌握的洞见也是有限的。在很多方面,神经网络就像是个不透明的黑箱,这可能会带来严重的问题:如果一辆自动驾驶汽车撞倒了一个人,如果我们并不能清楚知道其智能系统的决策逻辑,那如何才能了解事故原委?“深度学习确实受到很多关注,而且它也当之无愧。但深度学习提供不了任何保证。”卡内基梅隆大学的计算机科学教授图奥马斯·桑德霍尔姆(Tuomas Sandholm)说道。他帮助开发了最近在德州扑克比赛中击败人类顶级选手的人工智能系统Libratus(该系统并未用到神经网络)。新趋势 由于神经网络存在这些显而易见的弱点,世界上一些规模最大的科技公司现在正拓宽他们思考人工智能的方式。从这些公司最近招聘的员工、收购的公司、开展的研究以及众多初创公司纷纷跟进这些事情中,就可以看出一些线索来。我们可以把这股潮流视为贝叶斯学派(一种探讨不确定性的学派)的崛起。该学派研究人员所用的方法,是从一个假说起步,然后基于数据来不断更新这一假说,而不是像神经网络那样仅仅依靠数据去推导结论。把贝叶斯学派思想运用于人工智能,其目的是为了找出处理不确定性的方法,找出为现有模型馈入新证据的方法,以及找出能够解决神经网络所不擅长的问题的方法。跟神经网络一样,贝叶斯方法(Bayesian methods)也可以从数据中学习,但这种类型的机器学习是以一种不同的方式进行的。“我们感兴趣的是让这种科学方法实现自动化。”人工智能初创公司Gamalon的创始人本·维格达(Ben Vigoda)说道,该公司正在通过一种名为概率编程(probabilistic programming)的技术朝这个方向推进。神秘技术 去年12月,当加里·马库斯(Gary Marcus)将自己的初创公司卖给Uber时,他也带来了一种新型人工智能。或者,他自己是这样说的。马库斯的公司名为Geometric Intelligence,原来只有15人。规模虽小,但它做出的承诺却很大。马库斯是纽约大学的心理学教授,他说自己跟同事正在开发能够通过小样本数据展开学习的系统,就像人类所做的那样——这样的系统可能拥有超越深度神经网络的力量。马库斯认为,对于打造能够与人会话的智能机器或是可以自主行驶在公路上的汽车,小样本数据系统至关重要。“语言领域和自动驾驶汽车领域面临着一些问题,我们永远无法拥有足够多的数据来供人工智能进行暴力填鸭式的学习。”马库斯说道。说到底,我们不能在繁忙的道路上人为制造车祸来收集关于如何避免发生事故的数据。“现实情况是,要么是你买不到那些数据,要么就是数据不存在。”马库斯和他的合伙人——剑桥大学的信息工程学教授佐宾·葛拉曼尼(Zoubin Ghahramani)——仍然不愿意谈论他们这种技术的细节。这在技术领域很常见,人工智能尤甚。不过,葛拉曼尼也是贝叶斯学派的一员。他擅长一种特定类型的统计模型,名为高斯过程(Gaussian Process)。我们猜测,在他跟马库斯开发的技术中,高斯过程可能扮演着某种角色。高斯过程 在某个层面上,高斯过程就是一种找到特定问题最佳解决方案的方法。它为另一种数学方法贝叶斯优化(Bayesian optimization)提供了支撑——贝叶斯!高斯!他们都是数学家!而且,现在已经有网站在利用高斯过程来确定应该展示什么广告以及主页应该采用何种设计。Uber一直在招聘专门研究高斯过程的学者,来帮助提升自己的打车服务。在谷歌,该公司正借助高斯过程来控制其为普及互联网连接而放飞的高空气球。 从根本上讲,高斯过程是一种识别不确定性的好方法。“知道自己的无知是一件好事。”爱丁堡大学的人工智能研究人员克里斯·威廉姆斯(Chris Williams)说道,“犯下自信过错是你能做出的最糟糕事情。” 2015年,Twitter收购了一家名为Whetlab的初创公司,该公司利用高斯过程找到了一种设计神经网络的更好方法。设计神经网络是一项需要反复试验的任务,与其说你是在编写一款软件,倒不如说是试图从数据海洋中求得一个结果。这项任务困难重重且非常耗时,而高斯过程和贝叶斯优化可以帮助让该任务实现自动化。正如WhetLab创始人、哈佛大学计算机科学家莱恩·亚当斯(Ryan Adams)所言,这家初创公司是使用“机器学习来提升机器学习”。神经网络可能受到“自信错误”的困扰,并难于识别不确定性,这种类型的优化正好可以帮助解决该问题。后来,亚当斯离开Twitter加盟了Google Brian,这是谷歌研究人工智能的核心团队。 此外,一些研究人员还认为,高斯过程利用小样本数据的能力将在推进人工智能的过程中发挥至关重要的作用。“要创建一个真正自主的智能代理,它必须能够迅速适应自己所处的环境。”人工智能初创公司Prowler首席执行官维沙尔·查特拉斯(Vishal Chatrath)如是说,他曾与葛拉曼尼共事,“那意味着要能以最少的数据完成最高效的学习。”查特拉斯说,更重要的是,高斯过程易于理解。跟神经网络不同,高斯过程不存在黑箱问题。如果发生了意外,我们可以追溯到原因。“不要恐慌” 在Prowler,查特拉斯聘请了三位专门从事高斯过程研究的学者。该公司的总部设在英国剑桥,葛拉曼尼以及高斯过程和相关技术领域的很多其他专家也居住在那里。目前,Prowler正在开发能够学习应对大型网络游戏和其他数字世界的人工智能系统。这是一项复杂的工作,但Prowler希望这是我们向那种能够学习应对现实世界的系统迈出的一步。 与此同时,亚马逊(Amazon)最近招募了贝叶斯方法研究领域的另一位重量级学者,他就是来自英国谢菲尔德大学的计算机科学家尼尔·劳伦斯(Neil Lawrence)。“不要恐慌。”劳伦斯最近在一篇博客文章中写道,“通过使用我们的数学工具来应对深度学习方法的新浪潮,我们可以确保它们在很大程度上仍然是无害的。”翻译:何无鱼来源:WIRED点击标题 查看往期回顾}

我要回帖

更多关于 填鸭式教学 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信