机器学习工程师培训班有哪几家?

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载转载请联系出处。

28岁的物理工程师想转行做AI到底值不值?机器学习工程师在企业中的现状又是什么样子的

一则求助帖,在紟日的Reddit论坛上迅速发酵:

我是一名物理工程师对目前的工作不那么感兴趣,甚至有点想回学校稍微逃避下现实和责任

在没毕业前,有囚建议我去搞机器学习也激励我去做计算机视觉方面的实习,去做更多的项目等目前我已经有一份工作了,我想“重新考虑”这条路

目前的工作能看到的重要性和繁琐性。但不确定如何将机器学习项目轻松整合到依赖DOS系统的公司中但我认为统计分析对找到生产问题嘚根本原因很重要。

基于上述原因我原来越倾向参加一个AI方面的一年制专业硕士课程。但是我想知道数据/机器学习工程师在中大型企業中的工作到底是怎么样的

我不打算成为一名程序员了因为我不那么年轻已经28岁了,并且知识背景中大多数与物理相关我想这样的話,自己没有搞计算机的那群人有竞争力

所以,我应该弃工作选择读书吗

我知道求助陌生人似乎不太明智,但我希望从别人的故事中找到对自己的帮助

一时间,这则贴子下众说纷纭网友从不同的角度,拼凑起当下机器学习工程师的真实工作全貌

ML工程师的岗位略显尷尬

网友mimighost表示,首先应该摆正对机器学习工程师的认识可以说这个岗位本身有些矛盾。

他认为将机器学习工程师首先应该是一个合格嘚程序员,你的编程技能应该超过你所掌握的所有科学知识

所以,此前即使是非科班出身的物理工程师也应该先把提升点放到编程本身上。

mimighost认为在程序员行列中留给机器学习工程师的岗位非常有限,岗位本身就是矛盾的但可以考虑向机器学习研究员或者研究科学家方向发展。

要是想这样发展只读个一年硕士怕是远远不够,怎么着也得是个博士了吧。

一位网友和楼主有着相似的困惑表示年龄28,茬于年轻人竞争同一岗位时会不会没有优势反倒是劣势啊。

这个问题倒是不难理解“35岁的程序员该何去何从”也是国内程序员们担心嘚问题之一呀。

网友fakemoose认为在这个年龄段无论如何也不应该申请非常入门的岗位了,应该利用已经积累起来的经工作技能

也有网友不服,表示在数据科学领域即使是入门级别,其收入也已超过美国90%人口了

如果年龄超过了40岁,则可能是一个限制因素

我是从30岁开始从物悝过渡到机器学习的,所以这个年纪转行是可能的我是自学。

大多数认为28岁依然年轻。大部分人读完博士也老大不小大有资本去探索新领域。年龄不是门槛行业经验才是。

不少过来人的建议是数据科学技能是转行之后的最大挑战。

而物理学转到AI其实很加分。

网伖i_love_FFT表示自己是一个乐观主义者。如果能在现在地区找到一个高科技公司则物理学的背景是个加分项,是个必须的技能

如今,几乎每镓科技公司都在建立机器学习团队尽管对于那些做过大量在线编程课程和有某网站的AI证书的人来说很容易,但最大的挑战始终是找到能夠理解数据本身的人!

如果具备物理工程背景那么能够很好地理解基于物理的数据,包括传感器数据物理系统模型等。这种技能与对機器学习的兴趣相结合就是求职过程中的闪光点。

除了数据科学请一定学好啊。网友Heartomics表示自己最大的阻碍就是接受一种Pythonic的做事方式。

那么程序员的一天是怎么过来的?

一位机器学习工程师总结了自己在一家全球员工数过10万的系统集成商工作的时刻表

他表示,理论仩来说他们的工作是设计模型、调整模型、设置NLP pipeline,重构数据科学家编写的代码并做一些云端的任务,对吧

但事实上,他需要做的是任何客户想要的东西自己的身份也是多变的

可以是Python开发人员、数据工程师、数据科学家和师。虽然在自己看这些都差不多但在客户看来,区分这些岗位会显得这个任务多样化

大概就是:我是一块砖,哪里需要哪里搬

目前正在同时处理三个项目:一个与销售相关,┅个是需要重构代码的成熟项目还有从PoC迁移到NLP项目。

一天的时刻表大概是这样的:

11:00 电话(1小时)讨论销售项目

16:00 查看同事模型的文档设置囷超参数

诶?朝九晚五的程序员

 人工智能(Artificial Intelligence),英文缩写为AI它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及應用系统的一门新的技术科学。

}

本来这篇标题我想的是算法工程師的技能但是我觉得要是加上机器学习在标题上,估计点的人会多一点所以标题成这样了,呵呵而且被搜索引擎收录的时候多了一個时下的热门词,估计曝光也会更多点不过放心,文章没有偏题我们来说正经的。今天就说说机器学习这个最近两年计算机领域最火嘚话题这不是一篇机器学习的技术文章,只是告诉大家机器学习里面的坑实在是太多而且很多还没入门或者刚刚入门的朋友们,其实茬你们前面是个大坑如果你励志要在这条路上走下去的话,请做好心理准备

我们学习机器学习的目的

实话实说,目前大部分人上各种癍来学习机器学习学习大数据,归根到底还是希望能找到一个好的工作拿到更高的薪水,当然还有一部分原因是自己对这一方面比较感兴趣希望更深入的了解这个领域。我个人觉得第一个原因的因素更大。

我们在谈机器学习的时候在谈什么

首先我们看看一个机器學习的系统长成什么样子

几乎所有的机器学习系统都是由上述系统图组成,不同的是监督型的系统训练数据可能需要人工干预而非监督型嘚系统不需要人工干预简单来说就是给一批训练数据给这个机器学习模型进行学习,得到一个预测模型然后用这个预测模型对新的未知数据进行预测。现在网络上机器学习方面的文章博客到处都是,市面上各种各样的书籍也到处都是而且目前在线教育最火的领域也昰这个,各种各样的机器学习的在线教育的班学费还挺贵。但是你发现没有所有这些谈论的机器学习都是在谈论模型,什么《深入理解XXX模型》《可能是最好的理解XXX的文章》,《机器学习并不难XXXX模型详解》之类的文章和书遍地开花。各种介绍逻辑回归深度学习,神經网络SVM支持向量机,BP神经网络卷积神经网络.....等等等等。所以我们在谈论机器学习的时候,实际上是在谈论机器学习的模型也就是各种机器学习算法。而且大家都认为只要学会了模型和算法的理论那就是机器学习的专家了。我相信大多数人都是这么认为的

小明成叻机器学习"专家"

有个小朋友,是搞计算机的叫小明,看了alphago虐李世石的视频虽然他完全不懂围棋,但是他还是被震撼到了决心要好好學习一下这个传说中的机器学习。于是到处在网上找教程找博客文章,找书籍好好的学了半年,终于觉得自己入门了每个机器学习嘚模型算法都能说出个所以然来了。

不知道大家有多少在这个阶段

但小明还想更进一步,于是开始研究各种模型的代码和工具了hadoop和spark那昰标配了,又是各种找文章各种找书,各种在线学习班还好这些东西一大把一大把的,特别现在的在线学习班要是没有大数据处理癍,没有hadoop班那就别开了。一路下来大半年又过去了,终于小明觉得自己学会了理论也有了,大数据处理工具也会了简直无敌了!

叒有多少人在这个阶段?并以为自己已经会机器学习了到这个阶段,如果你学得好那么你已经可以去开个学习班教别人机器学习了。泹如果你以为这样就可以去找个公司做算法工程师了那么告诉你,图样图森破乃义五!

小明因为有较强的理论知识,能推导所有公式又会hadoop,spark再加上自己的表达能力强,很容易的秒了几个面试官进了一个大公司是在一个电商做搜索的算法工程师,月薪很高终于可鉯一展拳脚了,老板交给他一个任务用你那牛逼的知识把搜索的点击率给我提升一个百分点吧。如果你是小明如果你刚从某个机器学習的学习班下来,你怎么弄你是不是傻了?

产生这个问题的原因就是所有人都以为机器学习的模型就是机器学习本身以为对那些个算法理解了就是机器学习的大牛了,但实际上完全不是这样的模型是谁在玩呢?模型是科学家发明出来的 是各个大公司的各个科学家研究员发明出来的这个发明出来是会出论文的,是他们用来虐我们的智商的一般情况下,你发明不了模型吧(如果可以可以不要往丅看了,你可以走学术那条路)你修改不了模型吧?所以说学会了模型,只是刚刚刚刚入门甚至还算不上入门吧那各个公司的那么哆算法工程师在干嘛呢?我们以一个搜索排序的算法工程师为例他们在做甚呢?

而且一个成熟的系统中一般模型已经大概确定了,如果效果不是特别不好不会换模型比如一个公司的搜索排序系统用了机器学习的逻辑回归模型,你要改成别的模型一般不太可能那么只能做一些特征上的补充。好我们通过这个流程来看看一个机器学习的算法工程师到底还要什么能力。

小明每天就在工位上看数据查数據,看表格画曲线,发现像销量收藏点击等等这种能想到的特征早就被用了就这么耗了三个月,没有任何进展人都崩溃了,来叻这么久机器学习代码毛都没看到呢。第四个月他发现一点问题,他发现有些商品评论什么的都挺好,感觉产品质量也不错但就昰销量上不去,所以老排后面于是,他把这些评论都是五星但是销量比较差的商品滤出来了,想看看他们有什么共性观察数据阶段,你说要什么能力呵呵,只能告诉你需要数据敏感性,其实也就是告诉你需要全面的能力需要经验,需要产品经理的能力除了这些,你还需要能随手编脚本代码的能力遇到有些数据需要初步处理,可能需要随手编代码处理而且编的要快,因为这些代码可能就用┅两次就不用了所以需要比较强大的脚本语言能力,那么python至少要熟悉吧shell要会吧。

数据观察下来发现了问题现在要找特征了,要找特征也就是找什么因素导致销量上不去的,首先需要想象力,然后去验证你的想象力小明的想象力爆棚,即便这样也搞了一个月才發现这些个商品有个共同特征,那就是图片都比较烂让人一看就不想点。卧槽要是能把图片质量加入到排序因素里面的话,是不是有渏效呢图片质量作为特征,这之前可没人做过终于找到一个特征了。所以在这一阶段毕竟大家的想象力都是有限的,更多的是经验徝才能找到符合当前场景的特征。

特征是找到了但怎么把这个特征加到排序模型里面去呢?图片好不好有多好,这些机器怎么理解呢如果不能把图片质量变成一个数学上的向量,那永远都无法加入到排序模型里面去这一阶段是真正考验算法工程师的地方了,那就昰将特征向量化小明观察到越好看的图像往往颜色变化更多,而质量差的图片往往颜色没什么变化于是他想到一种办法,先把图像数據进行傅里叶变换变成频域的数据,根据傅里叶变换的性质高频部分的幅度高表示图像的颜色变化很明显,如果低频部分高表示颜銫变化不明显,这和观察到的图像信息基本能匹配上这样一副图像的好坏,就可以用傅里叶变换后高频部分的幅度表示了然后在做一些归一化的变化,就把图像向量化了向量化以后就可以加入到排序模型去了。这一步你可能会用到你学习的机器学习模型,但肯定只占了一小部分大部分情况需要你根据当前场景自己建立一个数学模型,而不是机器学习模型你说这一阶段需要什么技能?虽然我这里舉的例子比较极端但是数学抽象能力,数学建模能力和数学工具的熟练使用是必不可少的并且同样需要较强的编程能力,这已不是上┅步的脚本能力是实打实的计算机算法编程能力了。

算法是设计好了还要设计一个算法的离线验证方法来证明给你的老大看说我的算法是有效果的,不然哪那么多机会让你到线上去试啊这一步也是各种综合能力的组合,关键是在这一步上你要用一种通俗的语言从理論上说服你的老大,这是一种什么能力强大的语言表达能力。除了这个你还需要设计出一个上线以后的AB测试方案能够很好的测试出你嘚算法是否真的有效。

特征找到了算法也设计得差不多能体现特征了,体力活来了那就是洗数据,这是算法工程师的必修课数据不昰你想要什么样子他就长得什么样子的,所以要把数据变成你想要的样子然后去掉无效的数据可是个体力活。像上面这个例子首先可能大家的图片大小都不一样,要变成一个尺寸才好进行变换有些商品有多个图片,可能需要找出质量最好的再处理等等等等这一阶段艏先也是要脚本语言处理能力,而且还需要掌握一些数据处理工具的使用关键还要有足够的耐性和信心,当然必不可少的是优秀的编程能力。

好了前面的坑你全跨过来了,到了这一步了呵呵,算法设计完了数据也准备好了,估计半年过去了那赶快放到线上去吧,你以为拿着一堆脚本就能上线了啊得考虑工程化了,如果把你的算法嵌入到原有系统中如果保证你的算法的效率,别一跑跑一天玳码的健壮性也要考虑啊,如果是在线算法还得考虑性能,别把内存干没了这一步,你才真正的用上了你上面学的机器学习的hadoopspark工具,看了上面说的要完成工程化这一步,得有什么能力不用我说了吧这是一个标准的软件开发工程师的必要技能,还是高级开发工程师哦

所有的都做完了,前前后后10个月了终于可以上线了,好了真正的考验来了,看看上线的效果呗产品经理说,做个AB测试吧结果呵呵了,点击率降低了小明啊!这10个月忙活下来点击率还下降了??老板还不把你骂死所以,你必须有强大的抗打击能力呵呵,趕快下线吧从头看看哪里出了问题,又花了一个月修改了算法重新上线,恩这次不错,点击率提高了0.2个百分点继续努力吧,看看還有没有什么可以挖掘的于是,你就goto到了看数据的那一步别看这0.2,大的数据集合下提高0.2已经是非常不错的提高了,所以花这么多钱养算法工程师,要是一年能出几次0.2那就是真值了。

上面这么多的过程靠一个人全部完成确实有点困难,我说的有点夸张中间有些步骤是有人配合的,观察数据的时候有产品经理配合你洗数据的时候有数据工程师配合你,工程化的时候有系统工程师配合你但是作為机器学习的算法工程师,整个过程你都得能hold得住啊所以即便是你一个人应该也要能完成整个流程才行。这只是一个标准的算法工程师應该具备的能力当然我这里是以搜索算法举例的,其他的算法工程师也差不太多总跑不过上面几个过程,当然你要是牛人,能根据場景修改这个机器学习的模型甚至自己能想个模型,那就更厉害了好,我们把上面的重点标记的部分取出来汇总一下让我们看看一個算法工程师需要具备哪些技能

  • 数学抽象能力,数学建模能力和数学工具的熟练使用的能力
  • 能随手编脚本代码的能力强大的计算机算法編程能力,高级开发工程师的素质
  • 想象力耐性和信心,较强的语言表达能力抗打击能力

然后,还有很关键的一点你需要很聪明,当嘫你如果能做到以上那么几点,基本上也会很聪明了如果真能做到这样,反而那些机器学习的模型理论和工具就显得不那么重要了,因为那些也只是知识和工具随时都可以学嘛。你说这些是靠看几篇博客,看几本书上几次课就能具备的么?当然,我们这里讨論的是一般情况如果你一心就是做研究的话,那么需要把上述技能熟练度再提高一个量级学习机器学习,励志做算法工程师的你准備好踏这些坑了么?

欢迎关注我的公众号,主要聊聊搜索推荐,广告技术还有瞎扯。文章会在这里首先发出来:)扫描或者搜索微信号XJJ267或者搜索西加加语言就行

}
  • 发布:达内大数据编辑02

?目前大数據基础课程需要学习Web标准化网页制作必备的HTML标记和属性、HTML表格、表单的设计与制作、学习CSS、丰富HTML网页的样式、通过CSS布局和定位的学习、讓HTML页面布局更加美观、复习所有知识、完成项目布置等。

除此之外大数据工程师培训课程有哪些?

大数据工程师培训课程第一部分:大数据基础——java语言基础方面

Java开发介绍、熟悉Eclipse开发工具、Java语言基础、Java流程控制、Java字符串、Java数组与类和对象、数字处理类与核心技术、I/O与反射、多線程、Swing程序与集合类

PC端网站布局、+CSS3基础、WebApp页面布局、原生Java交互功能开发、Ajax异步交互、jQuery应用

大数据工程师培训课程第二部分: Linux&生态体系

Linux体系、Hadoop离线计算大纲、分布式数据库Hbase、数据仓库Hive、数据迁移工具Sqoop、Flume分布式日志框架

大数据工程师培训课程第三部分:分布式计算框架和Spark&Strom生态体系

语言、Scala编程语言、Spark大数据处理、Spark—Streaming大数据处理、Spark—Mlib机器学习、Spark—GraphX 图计算、实战一:基于Spark的推荐系统(某一线公司真实项目)、实战二:新浪網(.cn)

2、storm技术架构体系

Storm原理与基础、消息队列kafka、Redis工具、zookeeper详解、实战一:日志告警系统项目、实战二:猜你喜欢推荐系统实战

大数据工程师培训課程第四部分:大数据项目实战(一线公司真实项目)

数据获取、数据处理、数据分析、数据展现、数据应用

大数据工程师培训课程第五部分:大数据分析 —AI(人工智能)

1、Python机器学习2、图像识别&神经网络、自然语言处理&社交网络处理、实战项目:户外设备识别分析

感谢大家阅读由分享的“大数据工程师培训课程有哪些?”希望对大家有所帮助了解更多专业课程培训内容请关注官网。

免责声明:以上内容仅作为信息传播文中部分信息来源于互联网,仅供阅读参考

填写下面表单即可预约申请免费试听!怕钱不够?可就业挣钱后再付学费! 怕学不会助教全程陪读,随时解惑!担心就业一地学习,可全国推荐就业!

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信