登录以解锁更多InfoQ新功能
获取更新并接收通知
给您喜爱的内容点赞
关注您喜爱的编辑与同行
966,690 十月 独立访问用户
语言 & 开发
架构 & 设计
文化 & 方法
您目前处于:
京东大数据R语言应用
京东大数据R语言应用
0&他的粉丝
:Facebook、Snapchat、Tumblr等背后的核心技术
京东商城目前拥有遍及全国超过6000万注册用户,近万家供应商,在线销售家电、数码通讯、电脑、家居百货、服装服饰、母婴、图书、食品等12大类数万个品牌百万种优质商品,日订单处理量超过50万单,网站日均PV超过1亿。在如此庞大、复杂的业务逻辑下,京东商城生产了海量的结构化和非结构化数据,例如用户级别的购买、浏览、搜索、评论数据,以及商品、商户、供应链等数据信息。京东商城网站智能和商业化团队通过对自身业务、数据的理解和摸索,逐步形成、搭建了一整套基于开源R语言的数据挖掘框架,在此框架下支撑业务部门及产品部门的数据需求,试图精准化匹配京东商城用户和商品,优化供应链流程、提高用户满意度和忠诚度。本文将从京东商城的复杂的数据环境讲起,介绍在以R语言和Hadoop为核心的数据挖掘的技术框架,并简要分享一些使用R语言线上应用的案例。
刘思喆,京东商城个性化推荐组负责人,微博: @刘思喆,个人主页:http://bjt.name。现就职于京东商城网站智能和商业化部推荐团队,主要负责用户行为,商品特征建模等内容。8年来,一直追求为服务企业提供高效、完备的数据解决方案,尤其在统计分析、预测分析、数据可视化、机器学习、文本挖掘、社交网络等领域。
在加入京东商城前,供职于亚信联创BOC、神州数码思特奇DSS,主要为电信运营商提供数据挖掘及业务咨询等顾问服务。
10年R语言使用经验,R语言企业级应用的践行者,中国R语言会议、数据科学沙龙联合发起人,中国最大的统计社区-统计之都常务理事,06年至今一直担任R语言版版主。
2005年毕业于中国人民大学统计学院,《153分钟学会R》的作者,《R in a nutshell》译者。
QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、杭州、旧金山召开。自2007年3月份首次举办以来,已经有包括传统制造、金融、电信、互联网、航空航天等领域的近万名架构师、项目经理、团队领导者和高级开发人员参加过QCon大会。
语言 & 开发
64 他的粉丝
架构 & 设计
224 他的粉丝
63 他的粉丝
133 他的粉丝
8 他的粉丝
24 他的粉丝
0 他的粉丝
0 他的粉丝
相关厂商内容
相关赞助商
告诉我们您的想法
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
Re: 视频质量
京东谈推荐技术很搞笑
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
赞助商链接
架构 & 设计
文化 & 方法
<及所有内容,版权所有 ©
C4Media Inc.
服务器由 提供, 我们最信赖的ISP伙伴。
北京创新网媒广告有限公司
京ICP备号-7
找回密码....
InfoQ账号使用的E-mail
关注你最喜爱的话题和作者
快速浏览网站内你所感兴趣话题的精选内容。
内容自由定制
选择想要阅读的主题和喜爱的作者定制自己的新闻源。
设置通知机制以获取内容更新对您而言是否重要
注意:如果要修改您的邮箱,我们将会发送确认邮件到您原来的邮箱。
使用现有的公司名称
修改公司名称为:
公司性质:
使用现有的公司性质
修改公司性质为:
使用现有的公司规模
修改公司规模为:
使用现在的国家
使用现在的省份
Subscribe to our newsletter?
Subscribe to our industry email notices?
我们发现您在使用ad blocker。
我们理解您使用ad blocker的初衷,但为了保证InfoQ能够继续以免费方式为您服务,我们需要您的支持。InfoQ绝不会在未经您许可的情况下将您的数据提供给第三方。我们仅将其用于向读者发送相关广告内容。请您将InfoQ添加至白名单,感谢您的理解与支持。Docker安装RStudio
来源:博客园
在我前一篇文章中已讲述了,本文则讲述如何在docker中安装rstudio! 1.Docker的使用 1.1查看指定machine的IP 打开Docker Quickstart Terminal,查看docker名为default的machine的IP: docker-machine ip default 1.2连接到machine ssh连接到default machine中: docker-machine ssh default 1.3容器和镜像操作 加载名为hello-world的容器: docker run hello-world 查看已有的所有容器 : docker ps –a 可以看到只有一个container名为 hello-world 删除容器: docker rm NAMES 拉取镜像:从官网搜索下载镜像 或者点击Explore: 停止所有的container,这样才能够删除其中的images: docker stop $(docker ps -a -q) 如果想要删除所有container的话再加一个指令: docker rm $(docker ps -a -q) 查看当前有些什么images: docker images 删除images,通过image的id来指定删除谁 docker rmi &image id& 删除全部image: docker rmi $(docker images –q) 删除untagged images,也就是那些id为&None&的image docker rmi $(docker images | grep "^&none&" | awk "{print $3}") 2.安装RStudio 2.1搜索rstudio 此处使用本地安装,因为有阿里云的加速,所以比直接下载要快,首先,搜索rstudio docker search rstudio 2.2拉取rstudio镜像
然后根据作者选择安装的rstudio,rocker是rstudio的官方账号,rstudio-daily是不稳定版,opencpu也是部署R的一个选择,此处选择rocker版本: docker pull rocker/rstudio 然后就是漫长的等待!!!!!! 然后你可以在文件中看到下载好的镜像: 其大小为: 2.3运行镜像登录RStudio 然后,运行下面的程序,将镜像开启: sudo
docker run –d –p 8787:8787 rocker/rstudio 可以通过上面讲到的命令查看是否镜像已经加载: docker ps –a 现在,镜像已经加载,打开浏览器,输入: 192.168.99.100:8787 则出现登录界面: 用户名和密码均为:rstudio 3.在RStudio中安装包 3.1给RStudio换个源 3.2安装ggplot2包 此处同Linux中安装过程: install.packages('plyr') install.packages('digest') install.packages('gtable') install.packages('reshape2') install.packages('scales') install.packages('proto') install.packages('ggplot2') 3.3安装devtools包 安装devtools包之前,最好先安装一下curl和httr包: install.packages('curl') install.packages('httr') install.packages('devtools') 3.4安装rCharts包 require(devtools) install_github('ramnathv/rCharts') 3.5安装recharts包 require(devtools) install_github('taiyun/recharts') 3.6重新开启RStudio容器 重启docker-machine: docker-machine start 显示所有可用容器: docker ps -a 此处,发现由于前面的操作,加载了3个rstudio容器,显然,有两个是不需要的,可以根据container ID删除之: docker rm 65c docker rm fd17e6a2e4ee 然后,启动剩下的容器: docker start d2f3bb733ebb 参考:雪晴数据网老师:陈堰平 转载请注明链接:
免责声明:本站部分内容、图片、文字、视频等来自于互联网,仅供大家学习与交流。相关内容如涉嫌侵犯您的知识产权或其他合法权益,请向本站发送有效通知,我们会及时处理。反馈邮箱&&&&。
学生服务号
在线咨询,奖学金返现,名师点评,等你来互动}