linux云计算运维对运维人员有哪些挑战呢?

一名合格的云计算运维工程师需要越过的坑儿
发表于 15:15|
摘要:在八月的尾巴,AWS中文技术社区为小伙伴们策划两场活动,一场在线培训和一场线下沙龙。下面是活动的精彩预告,感兴趣的童鞋赶紧来报名!
自AWS中文技术社区上线以来,为AWS用户及AWS技术爱好者们提供了一个很好的交流平台,策划了多场在线培训和线下沙龙活动,连接线上线下更好地帮助社区成员了解和学习亚马逊AWS云技术,与众多的AWS爱好者结识交流。
在八月的尾巴,AWS中文技术社区又为小伙伴们策划一场在线培训和一场线下沙龙。如果你想成为一个优秀的云计算运维工程师,那就不要错过我们的在线培训——《云计算运维的那些坑儿》,教会你如何绕过运维过程中不必要的坑儿;如果你想快速开发一个移动APP,那就不要错过我们的线下沙龙——《移动APP如何借力云平台》,教会您更好的借助工具开发移动APP。下面是活动的精彩预告,然后再带大家回顾一下八月初的两场活动。
活动预告:
8月28日在线培训:云计算运维的那些坑儿
活动时间:2014年8月28日 20:50-22:00
报名地址:
主讲嘉宾:赵鹏(北京引众思源科技有限公司 CEO)
主题介绍:本次培训主题主要根据我们的经验,以AWS云计算平台为例,介绍欧美公司在使用云计算平台时,都有 哪些运维需求,都遇到了哪些问题,又做了哪些工作来解决问题的,以及最后达到的效果,帮助国内云计算用户在使用云计算平台时绕过不必要的坑!
8月30日线下沙龙:移动APP如何借力云平台?
活动时间:2014年8月30日 13:30-16:45
报名连接:
分享主题1:构建基于云的移动应用: building cloud-backed mobile applications
主讲嘉宾: 孙素梅 Amazon AWS China 解决方案架构师
主题介绍: 最彻底的和有改革意义的发明是那些能够帮助他人释放创造力去追求属于自己的梦想的发明,而Amazon AWS可能正是移动应用开发领域最重要的一件事情,他帮助整个一代的mobile
app开发人员去释放创造力,去创新,去更好更快的构建伟大的移动应用。本主题会介绍开发人员借助AWS,是如何更快更好的构建基于云的移动应用。
分享主题2: OnePush – 雅虎下一代消息推送平台
主讲嘉宾:申林 雅虎北京软件研发中心 资深研发经理
主题介绍:在移动应用爆炸增长的今天,移动设备的消息推送功能已经成为提高用户活跃度的主要方式。本议题以雅虎消息推送平台OnePush为例,介绍如何构建大规模消息推送平台为移动应用开发者提供可靠、高效、易于使用的消息推送服务。OnePush作为雅虎下一代消息推送平台,在系统架构设计中以高稳定性,高可扩展性和消息推送即时性为设计目标,同时提供多种推送功能,支持所有雅虎移动产品为上亿移动用户发送即时精准的通知消息。
那些不可错过的精彩:
8月9日线下沙龙:如何让数据发声?
8月9日,由CSDN主办的主题为“大数据如何发声”的线下沙龙在北京举办。会议邀请到亚马逊AWS中国云解决方案架构师王毅、北京永洪科技渠道总监王桐以及腾讯云信鸽推送服务后台研发负责人曾伟纪和京东数据部副总监刘尚堃等数位嘉宾,以自己的实践经验阐述了实际应用场景中如何才能正确处理、分析数据,让数据发声从而发挥数据最大的价值。超过了100多位的与会者在酷夏高温下从四面八方赶来参会,足以验证云计算和大数据的强大魅力。
8月13日在线培训:如何利用云平台构建容错的APP
8月13日,亚马逊AWS中国云解决方案架构师王毅在主题为“如何利用云平台构建容错的APP”的在线培训中,为我们讲述了如何在系统架构的时候充分利用云平台的各种特点,从而了解如何在AWS这样的云平台进行架构设计的技巧及相关资讯。
再早之前的精彩:
如果您希望听到哪位AWS专家或是AWS哪家用户,分享哪方面的主题,欢迎自荐或推荐,由我们来联系和策划活动。
如您需要了解AWS最新资讯或是技术文档可访问;如您有更多的疑问请在提出,稍后会有专家进行答疑。&
订阅“AWS中文技术社区”微信公众号,实时掌握AWS技术及产品消息!
AWS中文技术社区为广大开发者提供了一个Amazon Web Service技术交流平台,推送AWS最新资讯、技术视频、技术文档、精彩技术博文等相关精彩内容,更有AWS社区专家与您直接沟通交流!快加入AWS中文技术社区,更快更好的了解AWS云计算技术。
& & & & & & & & & &
& & & & & & & & & & &
& & & & & & & & & & &
& & & & & & & & & & &
& & & & & & & & & & &
(整理/李雪 责编/王玉平)&
推荐阅读相关主题:
CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
相关热门文章温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!&&|&&
LOFTER精选
网易考拉推荐
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
阅读(1008)|
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
历史上的今天
loftPermalink:'',
id:'fks_',
blogTitle:'高级云计算运维工程师',
blogAbstract:'外资企业 全球第二大手机生产商、全球营收最大的电子企业 北京核心研发中心
高级云计算运维工程师&
1.&&& 设计、部署和维护跨地域的多个数据中心,包含数以百计的服务器和硬件设备。规划跨地域的网络拓扑架构和高性能的存储架构
2.&&& 针对大负载和高并发的云计算系统,设计部署方案,并实际环境中部署。能够有效支撑跨地域的负载均衡系统和DNS系统
3.&&& 管理、运维云计算系统,监控主机和服务状态,发现问题后能迅速解决问题或找到替代方法。分析系统的性能瓶颈并给出解决方案。
4.&&& 与开发团队紧密合作,及时升级部署的云计算系统,按照需要打补丁,确保系统的安全稳定',
blogTag:'',
blogUrl:'blog/static/',
isPublished:1,
istop:false,
modifyTime:0,
publishTime:4,
permalink:'blog/static/',
commentCount:0,
mainCommentCount:0,
recommendCount:0,
bsrk:-100,
publisherId:0,
recomBlogHome:false,
currentRecomBlog:false,
attachmentsFileIds:[],
groupInfo:{},
friendstatus:'none',
followstatus:'unFollow',
pubSucc:'',
visitorProvince:'',
visitorCity:'',
visitorNewUser:false,
postAddInfo:{},
mset:'000',
remindgoodnightblog:false,
isBlackVisitor:false,
isShowYodaoAd:false,
hostIntro:'女',
hmcon:'0',
selfRecomBlogCount:'0',
lofter_single:''
{list a as x}
{if x.moveFrom=='wap'}
{elseif x.moveFrom=='iphone'}
{elseif x.moveFrom=='android'}
{elseif x.moveFrom=='mobile'}
${a.selfIntro|escape}{if great260}${suplement}{/if}
{list a as x}
推荐过这篇日志的人:
{list a as x}
{if !!b&&b.length>0}
他们还推荐了:
{list b as y}
转载记录:
{list d as x}
{list a as x}
{list a as x}
{list a as x}
{list a as x}
{if x_index>4}{break}{/if}
${fn2(x.publishTime,'yyyy-MM-dd HH:mm:ss')}
{list a as x}
{if !!(blogDetail.preBlogPermalink)}
{if !!(blogDetail.nextBlogPermalink)}
{list a as x}
{if defined('newslist')&&newslist.length>0}
{list newslist as x}
{if x_index>7}{break}{/if}
{list a as x}
{var first_option =}
{list x.voteDetailList as voteToOption}
{if voteToOption==1}
{if first_option==false},{/if}&&“${b[voteToOption_index]}”&&
{if (x.role!="-1") },“我是${c[x.role]}”&&{/if}
&&&&&&&&${fn1(x.voteTime)}
{if x.userName==''}{/if}
网易公司版权所有&&
{list x.l as y}
{if defined('wl')}
{list wl as x}{/list}中国领先的IT技术网站
51CTO旗下网站
说说云计算时代,运维人员会踩到哪些坑?
到了云计算时代,不少人说IT人要下岗了,是否真会如此呢?云计算的出现是否会使得整体行业对运维的需求萎缩了呢?
作者:来源:运维派| 10:39
近期在ChinaUnix论坛有一场讨论,标题是&&云计算时代:运维人员会踩到哪些坑?
整个讨论过程非常活跃,大概有50个答复,运维派这就给大家整理了一些讨论的优质内容分享给大家。
在云计算领域,运维人员就是这样的存在,小到一条短信,大到一次网上交易,只要和IT相关的业务就需要这些运维人员,没有他们在背后的支持,生活是会出大乱子的。
可是到了云计算时代,不少人说IT人要下岗了,是否真会如此呢?云计算的出现是否会使得整体行业对运维的需求萎缩了呢?
面对传统的几十台服务器时,运维人员还能手动处理一些问题,但是当机器发展到1000台、甚至是10000多台时,自动化运维必须得派上用场了。企业根据业务来分配和释放资源,运维人员不仅需要一个强大的控制系统来控制对网络流量、CPU利用率、进程、内存等等节点,还需要一个资源管理系统来管理这些资源的生命状态,还有权限管理,就像AWS的IAM一样。
话题讨论:
1.云计算时代,运维人员是否会面临着失业的风险?
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都&池化了&,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
3.对云计算而言,一大堆机器和设备放在一起,安全成为了一大挑战。有哪些监控工具可以实现对资源的管理,对网络流量、CPU利用率、进程、内存等状态监控呢?
4.在使用云服务,比如阿里云、腾讯云等,磁盘用到一定时候就会不稳定,很莫名其妙,磁盘I/O会变慢,到底是什么原因?您是否遇到过类似的经历?当时是如何解决的?
5.考虑到安全性问题,大多数企业都会选择混合云,选择IBM的云,稳定但贵,您比较看好哪些云服务提供商?为什么?
下面就来看看运维的小伙伴们都是怎么回答的?
网友stukirito的回答:
1.云计算时代,运维人员是否会面临着失业的风险?
以上说的是整体的国内运维趋势 如今云计算时代 对运维保障的要求自然更上一个台阶 失业不失业完全取决于自己.
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都&池化了&,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
既然使用到了虚拟化技术 那这个是具体问题具体分析。
3.对云计算而言,一大堆机器和设备放在一起,安全成为了一大挑战。有哪些监控工具可以实现对资源的管理,对网络流量、CPU利用率、进程、内存等状态监控呢?
可监控的软件多的去了 不过我相信目前大多数企业开始使用开源软件的多 譬如 catic、nagios、zabbix等都可以
关键在于这些监控软件如何适应你现有环境 那取决于运维对企业业务的熟悉度 对服务器环境的熟悉度等 才能因地制宜的去部署构建相关的监控环境
并根据相关反馈给的数据进行分析判断
4.在使用云服务,比如阿里云、腾讯云等,磁盘用到一定时候就会不稳定,很莫名其妙,磁盘I/O会变慢,到底是什么原因?您是否遇到过类似的经历?当时是如何解决的?
如果是托管类的直接找云服务商去看 如果是私有云就要慢慢找原因了
5.考虑到安全性问题,大多数企业都会选择混合云,选择IBM的云,稳定但贵,您比较看好哪些云服务提供商?为什么?
这个比较难说 目前大多数企业选择混合云 就是担心云服务提供商提供的服务会有中断 所以看企业自身需求做选择吧
网友stay_sun的回答:
1.云计算时代,运维人员是否会面临着失业的风险?
在it圈里技术的革新总是很快的,当你跟不上技术的发展的时候。你永远面临着淘汰。原来的vb,daifei,等等。传统的运维注定被淘汰。自动化运维会持续发展
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都&池化了&,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
新的数据中心虽然池化了,但是他对应的还是物理主机。检查的难度更大。但是对于单点的故障解决就简单多了。我觉得,云的运维最有难度的是平台的故障。很不好解决
3.对云计算而言,一大堆机器和设备放在一起,安全成为了一大挑战。有哪些监控工具可以实现对资源的管理,对网络流量、CPU利用率、进程、内存等状态监控呢?
最好的方法是调用系统的命令来收集你需要的数据。完成相应的问题。达到资源的最大化。
4.在使用云服务,比如阿里云、腾讯云等,磁盘用到一定时候就会不稳定,很莫名其妙,磁盘I/O会变慢,到底是什么原因?您是否遇到过类似的经历?当时是如何解决的?
运用这种平台云服务器,及本可以保证使用。偶尔这种问题,也是没有办法的。毕竟他是寄宿在实体机上面,多个主机总会有资源的冲突。找供应商。解决问题吧。没有办法的
5.考虑到安全性问题,大多数企业都会选择混合云,选择IBM的云,稳定但贵,您比较看好哪些云服务提供商?为什么?
我还是考虑自建云平台。作为互联网公司。这个东西使用太贵了
网友pure_lotus的回答:
1.云计算时代,运维人员是否会面临着失业的风险?
不会,云平台也需要有人运维,云计算时代产生的云平台运维新岗位比普遍运维更重要,工资还高了。但对于一般性的非IT企业的某些基础架构类IT运维人员,是存在失业的风险,需要加紧转型。
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都&池化了&,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
资源都虚拟池后后,故障定位和排除明显是痛点,很容易牵一发而动全身;另外自动化运维管理本身的可靠性要求也更高;还有运维是如何满足客户的安全审计要求也是难题。
3.对云计算而言,一大堆机器和设备放在一起,安全成为了一大挑战。有哪些监控工具可以实现对资源的管理,对网络流量、CPU利用率、进程、内存等状态监控呢?
多吧,一般在开源基础上做订制开发,而且要分层级,平台层和应用层要开分开。
4.在使用云服务,比如阿里云、腾讯云等,磁盘用到一定时候就会不稳定,很莫名其妙,磁盘I/O会变慢,到底是什么原因?您是否遇到过类似的经历?当时是如何解决的?
原因不明,猜测可能当时云服务厂商由于资源达到临界点,在调整后台部署或者做整体性的升级维护,造成临时性的IO瓶颈。
解决办法就是打电话或者等,有钱也可以选择远程冗员的硬盘空间备份,临时切换到备份空间来操作。
5.考虑到安全性问题,大多数企业都会选择混合云,选择IBM的云,稳定但贵,您比较看好哪些云服务提供商?为什么?
国内嘛,估计以后微软云和阿里云前景更好一些。主要是平衡成本和服务质量,微软自有软硬件产品比较多,使用顾客拥有成本比较低;阿里的中小客户基数大。
网友xuexiaogang的回答:
1.云计算时代,运维人员是否会面临着失业的风险?
如果有自动化运维的,那么运维人员的要求更加高,而且压力也越来越大,技能还要提升。如果没有自动化运维,那么运维人员不仅不会失业,而且人员还要不断增加。
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都&池化了&,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
全面监控难度大,而且问题排查不容易。很多是虚拟化来完成的,内部出现问题不好查也不好定位。
4.在使用云服务,比如阿里云、腾讯云等,磁盘用到一定时候就会不稳定,很莫名其妙,磁盘I/O会变慢,到底是什么原因?您是否遇到过类似的经历?当时是如何解决的?
扇区,块等都会产生碎片或者逻辑故障等。需要的是经常的维护和检查。空间回收和坏块的处理尤为重要。
5.考虑到安全性问题,大多数企业都会选择混合云,选择IBM的云,稳定但贵,您比较看好哪些云服务提供商?为什么?
百度云、360云、新浪云还有七牛等都是不错的云存储供应商。在很多技术交流上都和他们接触过并且使用过。感觉还可以。
网友&淡定与洒脱&的回答:
1.云计算时代,运维人员是否会面临着失业的风险?
还奉行老思路吃老本的大龄运维,其实已经相当危险了,存在感将不断下降,手工作坊式的低技术含量运维将越来越out。建议年轻入行的运维,一定要多学点开发技术,光会用几个开源工具,养不起老婆孩子的。
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都&池化了&,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
如果是公有云,那完全没脾气,只有选一个服务好的厂家了。如果是私有云,自己可以把原理性的东西研究清楚,提高troubleshooting能力。
3.对云计算而言,一大堆机器和设备放在一起,安全成为了一大挑战。有哪些监控工具可以实现对资源的管理,对网络流量、CPU利用率、进程、内存等状态监控呢?
saltStack、puppet、nagios、cacti、zabbix。。。现在有一堆开源监控和配置管理工具了,但问题是,如果只是会用这些工具,运维的价值何在?作为一个有理想的运维,应该搞点自己的小工具,成为这些工具的补充。
4.在使用云服务,比如阿里云、腾讯云等,磁盘用到一定时候就会不稳定,很莫名其妙,磁盘I/O会变慢,到底是什么原因?您是否遇到过类似的经历?当时是如何解决的?
有冗余,不用怕,往往重启后就恢复了。具体原因,还得问厂家。
5.考虑到安全性问题,大多数企业都会选择混合云,选择IBM的云,稳定但贵,您比较看好哪些云服务提供商?为什么?
看企业老板是什么思路,有的不差钱,有的很差钱。贵的一般都好一些。
网友forgaoqiang的回答:
1.云计算时代,运维人员是否会面临着失业的风险?
这个是肯定滴,现在的趋势就和农民种地类似,整体的岗位数量在下降,每个人管理的&田地&(服务器等IT资源)在增加。小型企业的运维人员需求(哪怕是兼职的网管)也在减少,小公司会把大部分的IT运维迁移到一些公有云上,管理简单,成本也可以接受。中型企业可能也会用公有云和部分自己的服务器,至于大型公司,基本上都在维护自己的私有云,几乎不会使用其它公司的服务。
所以整体来说,工作岗位数量在下降,但是对于运维人员的技能要求却在上涨,运维开始成为高大上的职业,只有真正具有高技能的运维人员不会面临失业,而是面临涨工资。
2.传统的数据中心里,设备是真实存在的,管理起来相对简单,而虚拟化技术将这些资源都&池化了&,一旦故障发生,需要检查排除,云时代下您觉得在运维管理方面存在哪些痛点困扰呢?
个人感觉云时代的时候更像是一个统计学的结论,只要集群整体运行正常就算是正常了,对于&池&中的某条&鱼&(硬件设备)死了,可以短暂的不用去理会,定期替换维修即可。云时代下大家都是看着各种&仪表盘&来进行管理,很少关心底层的硬件,经过层层抽象导致的结果就是排查难度上升,需要一层一层的去检查,最终故障很有可能发生在最下一层的物理层次上。
3.对云计算而言,一大堆机器和设备放在一起,安全成为了一大挑战。有哪些监控工具可以实现对资源的管理,对网络流量、CPU利用率、进程、内存等状态监控呢?
工具非常多,很多商业化的工具、开源的管理工具等等,比较经典的仍然是 Zabix、Cacti
等开源监控程序,同事Puppet等管理工具也具有监控功能,这些工具都是开源的,能够根据自己的需要进行定制,很多支持插件模式,可以使用很多其它人已经开发好的插件完成一些个性化的需求,完整整个运维的监控工作。
4.在使用云服务,比如阿里云、腾讯云等,磁盘用到一定时候就会不稳定,很莫名其妙,磁盘I/O会变慢,到底是什么原因?您是否遇到过类似的经历?当时是如何解决的?
是的,这个情况的确有遇到,很多时候是因为自己的业务系统出问题了,整体来说感觉阿里云还是比较稳定和公正的,磁盘和CPU资源限制的比较准确,作为
IaaS的基础设施,它们除了对硬件性能进行限制之外,剩下的都是客户的OS操作系统在处理自己的业务。对于I/O变慢的情况,好多都是自己的程序过度使用磁盘I/O造成的。
5.考虑到安全性问题,大多数企业都会选择混合云,选择IBM的云,稳定但贵,您比较看好哪些云服务提供商?为什么?
现在国内有多种云服务提供商,有些针对性的提供对 消息语音队列,有些是针对存储,有些则能够提供
平台托管,有些就是提供IaaS级别的,目前公司主要采用的服务是阿里云的,也考虑过腾讯云,看上去目前阿里是技术上做的最好的,SAE、BAE等平台不太适合我们的业务。对于消息队列还是比较看好
语音云 这家提供商。至于基础设施类的,个人感觉还是vmware或者xenserver的比较靠谱,但是费用高昂,中小型公司不会采用。
对于中大型企业应该会采用商用的私有云服务,但是对于阿里、腾讯、百度,它们应该是完全自主的云管理系统。【编辑推荐】【责任编辑: TEL:(010)】
大家都在看猜你喜欢
聚焦热点访谈原创原创
24H热文一周话题本月最赞
讲师:275人学习过
讲师:1542人学习过
讲师:1505人学习过
精选博文论坛热帖下载排行
公钥基础设施PKI(Public Key Infrastructure)是利用公钥概念和加密技术为网上通信提供的符合标准的一整套安全基础平台。公钥基础设施能为...
订阅51CTO邮刊百度拇指医生
&&&普通咨询
您的网络环境存在异常,
请输入验证码
验证码输入错误,请重新输入}

我要回帖

更多关于 云计算运维的那些坑儿 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信