Facebook开源深度学习框架Torchnet与谷歌TensorFlow有何不同

主题信息(必填)
主题描述(最多限制在50个字符)
申请人信息(必填)
申请信息已提交审核,请注意查收邮件,我们会尽快给您反馈。
如有疑问,请联系
傻丫头和高科技产物小心翼翼的初恋
如今的编程是一场程序员和上帝的竞赛,程序员要开发出更大更好、傻瓜都会用到软件。而上帝在努力创造出更大更傻的傻瓜。目前为止,上帝是赢的。个人网站:。个人QQ群:、
CSDN &《程序员》编辑/记者,我的邮箱
一只文艺范的软件攻城狮,Keep Learn,Always.昆明JAVA培训中心
美国上市公司 · 亿元级外企Java培训企业
课程咨询 :186
&&&&&&Facebook开源深度学习框架Torchnet
Facebook开源深度学习框架Torchnet
今天,在新发布的一篇学术报告中,Facebook 详细介绍了新的人工智能开源软件 Torchnet,用于简化深度学习。
深度学习是当下一种时髦的学习方式,涉及到培训人工神经网络处理大量的数据,如图片,然后让神经网络做出新数据的预测。与其建立一个全新的深度学习框架,
Facebook 选择的是在 Torch 上编译一个开源库,Facebook 先前也曾致力于此。
Facebook开源深度学习框架Torchnet,加快A.I研究步伐
“这使得它很容易实现完全隐藏 I/O(输入 / 输出)成本功能,而如果你想创建一个实用的大型深度学习系统,你就很需要这项功能的。” Facebook
人工智能研究所(FAIR)的一名科学家 Laurens van der Maaten 在一次采访中这样说道,“我们并不是要让 Torch
运作的更快或者更慢或者其他怎样,这些都不是框架的重点所在。” van der Maaten 还表示,Torchnet 是用 Lua 脚本语言写成,能够在标准的
x86 芯片或图形处理单元(GPUs)上运行,也可以让程序员重用某些代码。这样一来就能够降低工作量,同时也可以降低出现 bug 的几率。
Facebook 并不是唯一一家为 Torch 编译工具的公司,Twitter 也这样做过,可以肯定的是,同 van der Maaten 聊过的一些
Twitter 的员工似乎也对 Torchnet 感兴趣。亚马逊、谷歌和微软也在近几个月发布了全新的深度学习框架,Facebook
之前一直致力于开发原生开源项目,如 React Native 和 Presto,所以现在 Facebook 做出一些改变看上去还是挺有意思的。
van der Maaten 说道:“这种方法同 Theano 框架的 Blocks and Fuel 库有点相似。”
在这份报告中,van der Maaten 写道:Torchnet 可能并不会一直局限在 Torch 上使用,Torchnet
是抽象的,可以轻松应用到其他框架中,例如 Caffe 还有谷歌的 TensorFlow 框架。
在六、七个月前,Facebook 发布了 Torchnet 的第一版本。van der Maaten
说道:“现在有许多团队在不同应用中使用这一版本。” 他没有说具体是 Facebook 的哪些工作依赖于
Torchnet,但它可以被应用到图像识别和自然语言处理等方面,这样一来便可以在一些事情上派上用场,例如找到相关的 Instagram 图片来为 News
Feed 选择最佳 Facebook 帖子。Facebook 希望它的内容能够比网络上的其他内容都更具吸引力,这样既可以留住 “回头客”
又能够吸引新用户,所以这是很重要的东西。
最新开班日期 &|
Java--零基础全日制班
开班日期:9月29日
Java--零基础业余班
开班日期:9月29日
Java--周末提升班
开班日期:9月29日
Java--零基础周末班
开班日期:9月29日
达内新闻 &|
达内国际公司(TARENA INTERNATIONAL,INC.) 版权所有 京ICP证号-56Facebook开源深度学习框架Torchnet,加快A.I研究步伐
  今天,在新发布的一篇学术报告中,Facebook 详细介绍了新的人工智能开源软件 Torchnet,用于简化深度学习。
  深度学习是当下一种时髦的学习方式,涉及到培训人工神经网络处理大量的数据,如图片,然后让神经网络做出新数据的预测。与其建立一个全新的深度学习框架, Facebook 选择的是在 Torch 上编译一个开源库,Facebook 先前也曾致力于此。
  &这使得它很容易实现完全隐藏 I/O(输入 / 输出)成本功能,而如果你想创建一个实用的大型深度学习系统,你就很需要这项功能的。& Facebook 人工智能研究所(FAIR)的一名科学家 Laurens van der Maaten 在一次采访中这样说道,&我们并不是要让 Torch 运作的更快或者更慢或者其他怎样,这些都不是框架的重点所在。& van der Maaten 还表示,Torchnet 是用 Lua 脚本语言写成,能够在标准的 x86 芯片或图形处理单元(GPUs)上运行,也可以让程序员重用某些代码。这样一来就能够降低工作量,同时也可以降低出现 bug 的几率。
  Facebook 并不是唯一一家为 Torch 编译工具的公司,Twitter 也这样做过,可以肯定的是,同 van der Maaten 聊过的一些 Twitter 的员工似乎也对 Torchnet 感兴趣。亚马逊、谷歌和微软也在近几个月发布了全新的深度学习框架,Facebook 之前一直致力于开发原生开源项目,如 React Native 和 Presto,所以现在 Facebook 做出一些改变看上去还是挺有意思的。
  van der Maaten 说道:&这种方法同 Theano 框架的 Blocks and Fuel 库有点相似。&
  在这份报告中,van der Maaten 写道:Torchnet 可能并不会一直局限在 Torch 上使用,Torchnet 是抽象的,可以轻松应用到其他框架中,例如 Caffe 还有谷歌的 TensorFlow 框架。
  在六、七个月前,Facebook 发布了 Torchnet 的第一版本。van der Maaten 说道:&现在有许多团队在不同应用中使用这一版本。& 他没有说具体是 Facebook 的哪些工作依赖于 Torchnet,但它可以被应用到图像识别和自然语言处理等方面,这样一来便可以在一些事情上派上用场,例如找到相关的 Instagram 图片来为 News Feed 选择最佳 Facebook 帖子。Facebook 希望它的内容能够比网络上的其他内容都更具吸引力,这样既可以留住 &回头客& 又能够吸引新用户,所以这是很重要的东西。
(window.slotbydup=window.slotbydup || []).push({
id: '2467140',
container: s,
size: '1000,90',
display: 'inlay-fix'
(window.slotbydup=window.slotbydup || []).push({
id: '2467141',
container: s,
size: '1000,90',
display: 'inlay-fix'
(window.slotbydup=window.slotbydup || []).push({
id: '2467142',
container: s,
size: '1000,90',
display: 'inlay-fix'
(window.slotbydup=window.slotbydup || []).push({
id: '2467143',
container: s,
size: '1000,90',
display: 'inlay-fix'
(window.slotbydup=window.slotbydup || []).push({
id: '2467148',
container: s,
size: '1000,90',
display: 'inlay-fix'966,690 八月 独立访问用户
语言 & 开发
架构 & 设计
文化 & 方法
您目前处于:
大数据与机器学习周报 第13期:Facebook 开源深度学习框架 Torchnet
大数据与机器学习周报 第13期:Facebook 开源深度学习框架 Torchnet
被首富的“一个亿”刷屏?不如定个小目标,先把握住的优惠吧!
Author Contacted
相关厂商内容
相关赞助商
QCon上海~22日,上海&宝华万豪酒店,!
告诉我们您的想法
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
赞助商链接
架构 & 设计
文化 & 方法
<及所有内容,版权所有 &#169;
C4Media Inc.
服务器由 提供, 我们最信赖的ISP伙伴。
北京创新网媒广告有限公司
京ICP备号-7
注意:如果要修改您的邮箱,我们将会发送确认邮件到您原来的邮箱。
使用现有的公司名称
修改公司名称为:
公司性质:
使用现有的公司性质
修改公司性质为:
使用现有的公司规模
修改公司规模为:
使用现在的国家
使用现在的省份
Subscribe to our newsletter?
Subscribe to our industry email notices?您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
继谷歌、Facebook之后,亚马逊开源的深度学习工具又能带来什么?
按:继Facebook、Google之后,亚马逊也宣布开源其深度学习工具,Open AI成为主流?本文由新智元翻译自GitHub、Hacker News,介绍了亚马逊DSSTNE的深度学习工具到底是什么,以及和其他开源工具相比有何不同?另外,今年夏天,雷锋网(搜索“雷锋网”公众号关注)将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会”,并发布“人工智能&机器人Top25创新企业榜”榜单。如果你也是人工智能、机器人领域的相关公司,想经过层层晒选最终入选榜单,可联系:。亚马逊也被吹上“flow”的风口:继Facebook公开其深度学习训练平台FBLearner Flow细节后,亚马逊昨日下午突然宣布开源其深度学习和机器学习工具DSSTNE,并表示与相比其他深度学习工具,DSSTNE尤其擅于训练稀疏数据。近年来,谷歌,FB和OpenAI先后搭建平台,亚马逊也宣布工具开源,人工智能系统未来开源趋势已成,国内公司何时跟上国际潮流?日下午,亚马逊在GitHub网站将其深度学习和机器学习工具DSSTNE开源(译注:DSSTNE与英语“destiny”谐音)。亚马逊方面称,与其他开源工具相比,DSSTNE尤其擅长训练稀疏数据。新智元第一时间搜集信息,并获得内部核心开发人员对这款工具的详解。向来在开源上不那么积极的亚马逊有了新动作。难道最近在科技巨头间掀起了一股“开源”的浪潮?我们能否期待接下来苹果也会把它家的深度学习来个开源?玩笑说到这里,下面我们就一起来看看,亚马逊这个DSSTNE深度学习工具到底有什么用处。| DSSTNE是什么?根据GitHub网站消息,DSSTNE是英文“Deep Scalable Sparse Tensor Network Engine”的简写,即“深度可伸缩的稀疏张量网络工具”。亚马逊相关研究团队对DSSTNE的描述是&“一个使用GPU训练和部署深度的开源工具”。亚马逊的工程师最初创建DSSTNE是用于解决在亚马逊平台上需要处理的深度学习难题,建立的目标是解决现实中深度学习应用的产品部署问题,在试验灵活性以外,还强调速度和规模。团队希望把深度学习的潜力从语音、语言理解和物体识别领域扩展到搜索和推荐等其他领域,激发更多创意。每一天,有上亿人在亚马逊购物。亚马逊希望DSSTNE能帮助消费者从众多的商品中发现想找的东西。而想要做到好的推荐,就需要神经网络。即便是简单的3层自动编码器,加上一个有上亿节点的输入层(每一个节点代表一件商品),以及一个包含1000节点的隐藏网络,还有一个能反映输入层的输出层,所需要学习的参数就可以达到10亿以上。利用目前的硬件,这是很难实现的。即使把神经网络的大小局限在单一商品目录和身处美国的用户,也几乎要触及当下GPU的能力上限了。举例来说,一个3层的自动编码加权矩阵,加上输入时的800万个界定,以及输出层和隐藏层的256个节点,运行一次简单的计算就需要消耗8G的内存。使用开放资源软件以及上千万用户的消费数据来训练这样的网络,用市场上最快的GPU也得花上数周才能得到结果。亚马逊意识到,如果不能写出软件,然后在多个GPU中分配这些计算的话,他们是不会有大的进步的。DSSTNE有一系列的特征:多GPU伸缩:训练和预测扩展到使用多GPUs,在每一层平行模型拓展计算和存储。多层:模式平行伸缩,让更大型的网络成为可能。稀疏数据:在稀疏数据集中,DSSTNE经过了优化,可以有更快速的表现。特殊的GPU核心程序在GPU中运行稀疏计算。| DSSTNE与其他深度学习工具有何不同之处?在一些数据稀疏(几乎所有的数值都为零)的任务中,DSSTNE的表现要远优于当下的一些开放资源深度学习工具。DSSTNE是从无到有的一个工具,用于训练数据稀疏条件下的模型,其他的数工具,比如Caffe,Tensorflow,Theano和Torch都拥有大型的功能集以及网络支持。DSSTNE在气质上跟Caffe很像,强调产品应用的表现。在涉及稀疏数据的问题中,DSSTNE比其他仍和深度学习工具都要快(2.1x compared to Tensorflow in 1 g2.8xlarge),其中就包括推荐难题和许多自然语言理解(NLU)任务。单个服务器内,多GPU运行的情况,DSSTNE的表现也比其他的数据库表现要好。DSSTNE能够在所有可用的GPU中自动分配计算任务,加速所有的计算过程,并能建立更大的模型。从实际上来看,这意味着它能建立起推荐系统,把上千万种商品囊括到模型中,而不是上万种,或者能处理包含大量词汇的自然语言理解任务。对于这种等级的难题,其他的工具可能会需要转化到CPU来计算稀疏数据,这会将效果降低一级。另外,DSSTNE的网络定义语言会比Caffe的简单得多,只需要33行代码来表示通用的AlexNet图像识别模型,而Caffe语言要求超过300行代码。但是,DSSTNE还不支持图像识别所需要的卷积层,在一些自然语言理解和语音识别任务所需要的复发层中,支持也很有限。| 该怎么用DSSTNE训练神经网络模型?亚马逊在GitHub网站上给出了使用DSSTNE训练神经网络模型的实例,包含3个基本步骤:转换数据、训练、预测。1. 转换数据:下载数据后,把数据转换到NetCDF格式。然后在指定数据集中尝试运行一个自动编码器。1.1 生成输入数据集:1.2 生成输出数据:2. 训练:3层神经网络的隐藏层有128个节点3. 预测:总结| 内部人员神吐槽亚马逊开源DSSTNE的消息发布后不久,一位前DSSTNE核心开发成员就在hackernews网站上透露,DSSTNE创建于2年前,专用于在亚马逊商品目录中进行产品推荐。他表示:当时Tensorflow还没诞生,只有Theano和Torch;DSSTNE通过稀疏数据和多GPU跨神经网络进行优化,跟Theano和Torch都不一样;现在DSSENE还不支持Alex、VGG或者GoogleNet等,但是如果有需要,只用500行代码就能实现。那位前DSSTNE核心开发员还透露,DSSTNE现在还不明确支持RNN,但它支持分享加权。而虽然CuDNN 5使用几百行代码就能支持LSTM,但他认为CuDNN中的LSTM是一个黑盒子(Black Box),所以不能扩展到多重GPU。那位程序员还表示,亚马逊并不完美,但这家公司让他们从头开始搭建了这一平台,然后现在对外开源。据这位不愿意透露姓名的程序员表示,加入亚马逊之前,谷歌把他从Nvidia挖去(这是他难以拒绝的几个offer之一),但2011年却把他分配到搜索团队,不让其再涉及GPU的工作,完全没有考虑到他是Nvidia CUDA团队的创始成员之一,因此他认为谷歌完全没有认识到GPU的作用。在谷歌他没有待太久,如果他还留在亚马逊,他认为亚马逊会让他从事开源编码相关工作。这位选择匿名的程序员表示,在DSSTNE这个项目中自己是唯一的GPU编码员,在接受了又一份难以拒绝的offer后,他在4个月前离开了亚马逊。在他离开时,DSSENE的工作人员不到10人,并且其中大部分都已经到别处进行深度学习引擎开发去了。在hackernews网站写下这些文字的时候,那位不愿意透露姓名的程序员表示,他正在等飞机,在接下来的几天中将持续跟进这件事。最后,他写了一点剧透:DSSTNE的每一个GPU,处理的都是近乎完美伸缩的,具有1000个以上隐藏单元的隐藏层以及高效的自由稀疏输入层,因为激活和加权梯度计算有特定的稀疏核心;此外,虽然基于JavaScript轻量级的数据交换格式(JavaScript Object Notiation)在2014年获得认可,但DSSTNE需要一个类似TensorFlow图像输入才能达到100%的兼容。消息来源参考:1、2、
同步到新浪微博
关注产品和创新的科技媒体
「新智元」深度锁定人工智能及机器人产业链,关注产业前沿资讯,聚集学术和产业领袖,共同建构智能 + 产业的新纪元。
当月热门文章
¥0(免费上门 手机快修)
本栏目由提供
为了您的账户安全,请
您的邮箱还未验证,完成可获20积分哟!
您的账号已经绑定,现在您可以以方便用邮箱登录}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信