Facebook开源深度学习框架Torchnet与谷歌TensorFlow有何不同

点击联系发帖人 时间：2016-09-02 05:52

主题信息（必填）
主题描述（最多限制在50个字符）
申请人信息（必填）
申请信息已提交审核，请注意查收邮件，我们会尽快给您反馈。
如有疑问，请联系
傻丫头和高科技产物小心翼翼的初恋
如今的编程是一场程序员和上帝的竞赛，程序员要开发出更大更好、傻瓜都会用到软件。而上帝在努力创造出更大更傻的傻瓜。目前为止，上帝是赢的。个人网站：。个人QQ群：、
CSDN &《程序员》编辑/记者，我的邮箱
一只文艺范的软件攻城狮，Keep Learn，Always.昆明JAVA培训中心
美国上市公司 · 亿元级外企Java培训企业
课程咨询 :186
&&&&&&Facebook开源深度学习框架Torchnet
Facebook开源深度学习框架Torchnet
今天，在新发布的一篇学术报告中，Facebook 详细介绍了新的人工智能开源软件 Torchnet，用于简化深度学习。
深度学习是当下一种时髦的学习方式，涉及到培训人工神经网络处理大量的数据，如图片，然后让神经网络做出新数据的预测。与其建立一个全新的深度学习框架，
Facebook 选择的是在 Torch 上编译一个开源库，Facebook 先前也曾致力于此。
Facebook开源深度学习框架Torchnet，加快A.I研究步伐
“这使得它很容易实现完全隐藏 I/O(输入 / 输出)成本功能，而如果你想创建一个实用的大型深度学习系统，你就很需要这项功能的。” Facebook
人工智能研究所(FAIR)的一名科学家 Laurens van der Maaten 在一次采访中这样说道，“我们并不是要让 Torch
运作的更快或者更慢或者其他怎样，这些都不是框架的重点所在。” van der Maaten 还表示，Torchnet 是用 Lua 脚本语言写成，能够在标准的
x86 芯片或图形处理单元(GPUs)上运行，也可以让程序员重用某些代码。这样一来就能够降低工作量，同时也可以降低出现 bug 的几率。
Facebook 并不是唯一一家为 Torch 编译工具的公司，Twitter 也这样做过，可以肯定的是，同 van der Maaten 聊过的一些
Twitter 的员工似乎也对 Torchnet 感兴趣。亚马逊、谷歌和微软也在近几个月发布了全新的深度学习框架，Facebook
之前一直致力于开发原生开源项目，如 React Native 和 Presto，所以现在 Facebook 做出一些改变看上去还是挺有意思的。
van der Maaten 说道：“这种方法同 Theano 框架的 Blocks and Fuel 库有点相似。”
在这份报告中，van der Maaten 写道：Torchnet 可能并不会一直局限在 Torch 上使用，Torchnet
是抽象的，可以轻松应用到其他框架中，例如 Caffe 还有谷歌的 TensorFlow 框架。
在六、七个月前，Facebook 发布了 Torchnet 的第一版本。van der Maaten
说道：“现在有许多团队在不同应用中使用这一版本。” 他没有说具体是 Facebook 的哪些工作依赖于
Torchnet，但它可以被应用到图像识别和自然语言处理等方面，这样一来便可以在一些事情上派上用场，例如找到相关的 Instagram 图片来为 News
Feed 选择最佳 Facebook 帖子。Facebook 希望它的内容能够比网络上的其他内容都更具吸引力，这样既可以留住 “回头客”
又能够吸引新用户，所以这是很重要的东西。
最新开班日期 &|
Java--零基础全日制班
开班日期：9月29日
Java--零基础业余班
开班日期：9月29日
Java--周末提升班
开班日期：9月29日
Java--零基础周末班
开班日期：9月29日
达内新闻 &|
达内国际公司(TARENA INTERNATIONAL,INC.) 版权所有京ICP证号-56Facebook开源深度学习框架Torchnet，加快A.I研究步伐
　　今天，在新发布的一篇学术报告中，Facebook 详细介绍了新的人工智能开源软件 Torchnet，用于简化深度学习。
　　深度学习是当下一种时髦的学习方式，涉及到培训人工神经网络处理大量的数据，如图片，然后让神经网络做出新数据的预测。与其建立一个全新的深度学习框架， Facebook 选择的是在 Torch 上编译一个开源库，Facebook 先前也曾致力于此。
　　&这使得它很容易实现完全隐藏 I/O（输入 / 输出）成本功能，而如果你想创建一个实用的大型深度学习系统，你就很需要这项功能的。& Facebook 人工智能研究所（FAIR）的一名科学家 Laurens van der Maaten 在一次采访中这样说道，&我们并不是要让 Torch 运作的更快或者更慢或者其他怎样，这些都不是框架的重点所在。& van der Maaten 还表示，Torchnet 是用 Lua 脚本语言写成，能够在标准的 x86 芯片或图形处理单元（GPUs）上运行，也可以让程序员重用某些代码。这样一来就能够降低工作量，同时也可以降低出现 bug 的几率。
　　Facebook 并不是唯一一家为 Torch 编译工具的公司，Twitter 也这样做过，可以肯定的是，同 van der Maaten 聊过的一些 Twitter 的员工似乎也对 Torchnet 感兴趣。亚马逊、谷歌和微软也在近几个月发布了全新的深度学习框架，Facebook 之前一直致力于开发原生开源项目，如 React Native 和 Presto，所以现在 Facebook 做出一些改变看上去还是挺有意思的。
　　van der Maaten 说道：&这种方法同 Theano 框架的 Blocks and Fuel 库有点相似。&
　　在这份报告中，van der Maaten 写道：Torchnet 可能并不会一直局限在 Torch 上使用，Torchnet 是抽象的，可以轻松应用到其他框架中，例如 Caffe 还有谷歌的 TensorFlow 框架。
　　在六、七个月前，Facebook 发布了 Torchnet 的第一版本。van der Maaten 说道：&现在有许多团队在不同应用中使用这一版本。& 他没有说具体是 Facebook 的哪些工作依赖于 Torchnet，但它可以被应用到图像识别和自然语言处理等方面，这样一来便可以在一些事情上派上用场，例如找到相关的 Instagram 图片来为 News Feed 选择最佳 Facebook 帖子。Facebook 希望它的内容能够比网络上的其他内容都更具吸引力，这样既可以留住 &回头客& 又能够吸引新用户，所以这是很重要的东西。
(window.slotbydup=window.slotbydup || []).push({
id: '2467140',
container: s,
size: '1000,90',
display: 'inlay-fix'
(window.slotbydup=window.slotbydup || []).push({
id: '2467141',
container: s,
size: '1000,90',
display: 'inlay-fix'
(window.slotbydup=window.slotbydup || []).push({
id: '2467142',
container: s,
size: '1000,90',
display: 'inlay-fix'
(window.slotbydup=window.slotbydup || []).push({
id: '2467143',
container: s,
size: '1000,90',
display: 'inlay-fix'
(window.slotbydup=window.slotbydup || []).push({
id: '2467148',
container: s,
size: '1000,90',
display: 'inlay-fix'966,690 八月独立访问用户
语言 & 开发
架构 & 设计
文化 & 方法
您目前处于：
大数据与机器学习周报第13期：Facebook 开源深度学习框架 Torchnet
大数据与机器学习周报第13期：Facebook 开源深度学习框架 Torchnet
被首富的“一个亿”刷屏？不如定个小目标，先把握住的优惠吧！
Author Contacted
相关厂商内容
相关赞助商
QCon上海~22日，上海&宝华万豪酒店，！
告诉我们您的想法
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
赞助商链接
架构 & 设计
文化 & 方法
<及所有内容，版权所有 ©
C4Media Inc.
服务器由提供, 我们最信赖的ISP伙伴。
北京创新网媒广告有限公司
京ICP备号-7
注意：如果要修改您的邮箱，我们将会发送确认邮件到您原来的邮箱。
使用现有的公司名称
修改公司名称为：
公司性质：
使用现有的公司性质
修改公司性质为:
使用现有的公司规模
修改公司规模为：
使用现在的国家
使用现在的省份
Subscribe to our newsletter?
Subscribe to our industry email notices?您正在使用IE低版浏览器，为了您的雷锋网账号安全和更好的产品体验，强烈建议使用更快更安全的浏览器
继谷歌、Facebook之后，亚马逊开源的深度学习工具又能带来什么？
按：继Facebook、Google之后，亚马逊也宣布开源其深度学习工具，Open AI成为主流？本文由新智元翻译自GitHub、Hacker News，介绍了亚马逊DSSTNE的深度学习工具到底是什么，以及和其他开源工具相比有何不同？另外，今年夏天，雷锋网(搜索“雷锋网”公众号关注)将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会”，并发布“人工智能&机器人Top25创新企业榜”榜单。如果你也是人工智能、机器人领域的相关公司，想经过层层晒选最终入选榜单，可联系：。亚马逊也被吹上“flow”的风口：继Facebook公开其深度学习训练平台FBLearner Flow细节后，亚马逊昨日下午突然宣布开源其深度学习和机器学习工具DSSTNE，并表示与相比其他深度学习工具，DSSTNE尤其擅于训练稀疏数据。近年来，谷歌，FB和OpenAI先后搭建平台，亚马逊也宣布工具开源，人工智能系统未来开源趋势已成，国内公司何时跟上国际潮流？日下午，亚马逊在GitHub网站将其深度学习和机器学习工具DSSTNE开源（译注：DSSTNE与英语“destiny”谐音）。亚马逊方面称，与其他开源工具相比，DSSTNE尤其擅长训练稀疏数据。新智元第一时间搜集信息，并获得内部核心开发人员对这款工具的详解。向来在开源上不那么积极的亚马逊有了新动作。难道最近在科技巨头间掀起了一股“开源”的浪潮？我们能否期待接下来苹果也会把它家的深度学习来个开源？玩笑说到这里，下面我们就一起来看看，亚马逊这个DSSTNE深度学习工具到底有什么用处。| DSSTNE是什么？根据GitHub网站消息，DSSTNE是英文“Deep Scalable Sparse Tensor Network Engine”的简写，即“深度可伸缩的稀疏张量网络工具”。亚马逊相关研究团队对DSSTNE的描述是&“一个使用GPU训练和部署深度的开源工具”。亚马逊的工程师最初创建DSSTNE是用于解决在亚马逊平台上需要处理的深度学习难题，建立的目标是解决现实中深度学习应用的产品部署问题，在试验灵活性以外，还强调速度和规模。团队希望把深度学习的潜力从语音、语言理解和物体识别领域扩展到搜索和推荐等其他领域，激发更多创意。每一天，有上亿人在亚马逊购物。亚马逊希望DSSTNE能帮助消费者从众多的商品中发现想找的东西。而想要做到好的推荐，就需要神经网络。即便是简单的3层自动编码器，加上一个有上亿节点的输入层（每一个节点代表一件商品），以及一个包含1000节点的隐藏网络，还有一个能反映输入层的输出层，所需要学习的参数就可以达到10亿以上。利用目前的硬件，这是很难实现的。即使把神经网络的大小局限在单一商品目录和身处美国的用户，也几乎要触及当下GPU的能力上限了。举例来说，一个3层的自动编码加权矩阵，加上输入时的800万个界定，以及输出层和隐藏层的256个节点，运行一次简单的计算就需要消耗8G的内存。使用开放资源软件以及上千万用户的消费数据来训练这样的网络，用市场上最快的GPU也得花上数周才能得到结果。亚马逊意识到，如果不能写出软件，然后在多个GPU中分配这些计算的话，他们是不会有大的进步的。DSSTNE有一系列的特征：多GPU伸缩：训练和预测扩展到使用多GPUs，在每一层平行模型拓展计算和存储。多层：模式平行伸缩，让更大型的网络成为可能。稀疏数据：在稀疏数据集中，DSSTNE经过了优化，可以有更快速的表现。特殊的GPU核心程序在GPU中运行稀疏计算。| DSSTNE与其他深度学习工具有何不同之处？在一些数据稀疏（几乎所有的数值都为零）的任务中，DSSTNE的表现要远优于当下的一些开放资源深度学习工具。DSSTNE是从无到有的一个工具，用于训练数据稀疏条件下的模型，其他的数工具，比如Caffe，Tensorflow，Theano和Torch都拥有大型的功能集以及网络支持。DSSTNE在气质上跟Caffe很像，强调产品应用的表现。在涉及稀疏数据的问题中，DSSTNE比其他仍和深度学习工具都要快（2.1x compared to Tensorflow in 1 g2.8xlarge），其中就包括推荐难题和许多自然语言理解（NLU）任务。单个服务器内，多GPU运行的情况，DSSTNE的表现也比其他的数据库表现要好。DSSTNE能够在所有可用的GPU中自动分配计算任务，加速所有的计算过程，并能建立更大的模型。从实际上来看，这意味着它能建立起推荐系统，把上千万种商品囊括到模型中，而不是上万种，或者能处理包含大量词汇的自然语言理解任务。对于这种等级的难题，其他的工具可能会需要转化到CPU来计算稀疏数据，这会将效果降低一级。另外，DSSTNE的网络定义语言会比Caffe的简单得多，只需要33行代码来表示通用的AlexNet图像识别模型，而Caffe语言要求超过300行代码。但是，DSSTNE还不支持图像识别所需要的卷积层，在一些自然语言理解和语音识别任务所需要的复发层中，支持也很有限。| 该怎么用DSSTNE训练神经网络模型？亚马逊在GitHub网站上给出了使用DSSTNE训练神经网络模型的实例，包含３个基本步骤：转换数据、训练、预测。1. 转换数据：下载数据后，把数据转换到NetCDF格式。然后在指定数据集中尝试运行一个自动编码器。1.1 生成输入数据集：1.2 生成输出数据：2. 训练：3层神经网络的隐藏层有128个节点3. 预测：总结| 内部人员神吐槽亚马逊开源DSSTNE的消息发布后不久，一位前DSSTNE核心开发成员就在hackernews网站上透露，DSSTNE创建于2年前，专用于在亚马逊商品目录中进行产品推荐。他表示：当时Tensorflow还没诞生，只有Theano和Torch；DSSTNE通过稀疏数据和多GPU跨神经网络进行优化，跟Theano和Torch都不一样；现在DSSENE还不支持Alex、VGG或者GoogleNet等，但是如果有需要，只用500行代码就能实现。那位前DSSTNE核心开发员还透露，DSSTNE现在还不明确支持RNN，但它支持分享加权。而虽然CuDNN 5使用几百行代码就能支持LSTM，但他认为CuDNN中的LSTM是一个黑盒子（Black Box），所以不能扩展到多重GPU。那位程序员还表示，亚马逊并不完美，但这家公司让他们从头开始搭建了这一平台，然后现在对外开源。据这位不愿意透露姓名的程序员表示，加入亚马逊之前，谷歌把他从Nvidia挖去（这是他难以拒绝的几个offer之一），但2011年却把他分配到搜索团队，不让其再涉及GPU的工作，完全没有考虑到他是Nvidia CUDA团队的创始成员之一，因此他认为谷歌完全没有认识到GPU的作用。在谷歌他没有待太久，如果他还留在亚马逊，他认为亚马逊会让他从事开源编码相关工作。这位选择匿名的程序员表示，在DSSTNE这个项目中自己是唯一的GPU编码员，在接受了又一份难以拒绝的offer后，他在4个月前离开了亚马逊。在他离开时，DSSENE的工作人员不到10人，并且其中大部分都已经到别处进行深度学习引擎开发去了。在hackernews网站写下这些文字的时候，那位不愿意透露姓名的程序员表示，他正在等飞机，在接下来的几天中将持续跟进这件事。最后，他写了一点剧透：DSSTNE的每一个GPU，处理的都是近乎完美伸缩的，具有1000个以上隐藏单元的隐藏层以及高效的自由稀疏输入层，因为激活和加权梯度计算有特定的稀疏核心；此外，虽然基于JavaScript轻量级的数据交换格式（JavaScript Object Notiation）在2014年获得认可，但DSSTNE需要一个类似TensorFlow图像输入才能达到100%的兼容。消息来源参考：1、2、
同步到新浪微博
关注产品和创新的科技媒体
「新智元」深度锁定人工智能及机器人产业链，关注产业前沿资讯，聚集学术和产业领袖，共同建构智能 + 产业的新纪元。
当月热门文章
￥0（免费上门手机快修）
本栏目由提供
为了您的账户安全，请
您的邮箱还未验证,完成可获20积分哟！
您的账号已经绑定，现在您可以以方便用邮箱登录}

我爱游戏网

Facebook开源深度学习框架Torchnet与谷歌TensorFlow有何不同

我要回帖

更多推荐