华科电气的研究生毕业想进机器学习 强化学习 数据挖掘或者数据挖掘行业,难度有多大

查看: 10614|回复: 11
机器学习,数据挖掘在研究生阶段大概要学些什么?
论坛徽章:0
机器学习,数据挖掘在研究生阶段大概要学些什么?能给一个梗概或者方向么? 最好可以列出主要的课程或者相关资源,谢谢
论坛徽章:0
这个方面数学要求较高。
建议,概率论统计学,代数好好学学,以及探讨各种优化问题。是数学,你都读读吧,没有坏处的。基础是数学,这是真的,没有扎实的基本功,这方面的东西看起来会很费劲。
给你推荐一个系列的课程?只推荐个机器学习的课程吧,其他很多相关的学科大多都要用到机器学习的思想。
stanford的机器学习课程,很有名了。
斯坦福大学公开课 :机器学习课程
Coursera.org
以及这方面的笔记
Coursera公开课笔记: 斯坦福大学机器学习第一课“引言(Introduction)”
JerryLead的很牛翻译过来的笔记(全套,可以研读下)
Machine Learning
一些博客推荐
Free Mind(pluskid写的一系列很厉害)
Free Mind
机器学习 - 标签(leftnoeasy)
Rachel Zhang的专栏
/page/2/
Tutorials by Avi Kak
Statistical Data Mining Tutorials
这本书很有名,忘了说
Pattern Recognition and Machine Learning/Christopher M. Bishop-图书
与这方面相关的其他课程
模式识别
数据挖掘
机器视觉
自然语言
推荐系统
神经网络
概率图论
人工智能等等
有相通的内容,很多都在用机器学习的方法,都可以看看。。。
随便搜索就知道,这方面大多都是在搞统计学习方法之类。。。
所以,就一句话,数学在这个方向很重要。
论坛徽章:0
研究生阶段都是跟着导师做课题,从中抽出来一个题目做。即使不是这样,论文的题目也会非常具体到一个很细小的问题,所涉及的方法也不会很多。
课程看学校安排了,如果学校安排课程也是一门大课,讲述各种方法,不过这样光说不练是掌握不了的。研究生阶段有的是时间,找你想学的方法自己动手实现一下才好。
我觉得课程和书都是带你入门的,结合题目细致研究一个领域才是正道。
手机上写的,比较简略。
论坛徽章:0
想学所有的知识永远也学不完, 最重要的是专一。 与其翻阅不同的教材,我觉得还不如去尝试去解决实际问题,在这个过程当中根据需要适当的补充知识(假设你已经大概了解了机器学习的领域) 去kaggle尝试一下实际的问题吧, 之后你自己就会有方向感了,& &/competitions
论坛徽章:0
给你推荐我们用的课本,把其中一本仔细读完都会有很大的收获。
Kevin P. Murphy Machine Learning: a Probabilistic Perspective, the MIT Press (2012)
David Barber Bayesian Reasoning and Machine Learning, Cambridge University Press (2012)
Christopher M. Bishop Pattern Recognition and Machine Learning. Springer (2006)
David J.C. MacKay Information Theory, Inference, and Learning Algorithms, Cambridge University Press (2003)
第二和第四本在作者主页有 pdf 版本,个人比较喜欢 MacKay 的书,不过比较老了。
论坛徽章:0
The Open Source Data Science Masters by datasciencemasters
看到一个不错的网站,是一个Stanford的CS学生维护的,上面列出了这个方向相关的课程和相应的资源,我觉得很不错。
论坛徽章:0
楼主问的其实是两个相关(很多人分不清)但其实差不少的领域。现在排名第一的 @安岩 在推荐阅读上回答非常详尽,就不在这个方面多废话了,只是简单按照自己的经验说一下这两个的区别和联系:
机器学习的终极目标是让计算机完成一些被我们认为是“智能”的工作,一开始的研究是从逻辑学方向入手的,之后几十年一直是统计机器学习的天下(说是“统计”,但其实更多是概率方向的知识),而近几年沉睡很久的神经网络也在得到更多甚至说是狂热的重视(神经网络可以认为是统计模型,但相比传统统计机器学习(statistical/probabilistic)而言,它更多时候更接近一个确定性(deterministic)模型)。
另一方面,数据挖掘更侧重于实际应用,而且也和统计学(注意,这和概率有很大的区别)的关联更加显著。传统的应用包括购物篮分析(常购买商品、常共同购买商品),和比较新的一些社交网络、UGC分析(User Generated Contents, 用户生成的内容)等等。
一个简单的数据挖掘和机器学习的区分就是,数据挖掘并不那么关心算法的细节,而相对更重视结果的解释及其统计意义;而相反,机器学习似乎更在乎算法的设计、优化,在分类、聚类、或者一些既定问题上的效果,而较少关心统计意义方面的考量。具体来说,一个数据挖掘专家可能会用线性回归甚至关联分析,这些被机器学习学者认为是上世纪初产物的模型完成一些非常有趣的实际工作,并得到确定的统计意义(比如95%置信区间、某个事件是否具有“突发”统计意义等),也就是说这些结果最终还是服务于人,需要人去理解;而机器学习学者会尽量设计模型来自动别难过完成相对“智能、复杂”的任务,比如图像识别、语音识别、自然语言理解等,提高算法在这些问题上的准确性,但通常会被统计学家吐槽很多模型的效果提升其实统计意义不明。
最后简单总结一些两者分别(有些其实界限不是很清晰了,我只是列在了被研究得更多的那边)和公共的搜索词:
数据挖掘(不熟,轻拍):Data Analysis, (Social) Network Analysis, UGC Analysis, Market Segmentation, Recommendation/Ads Systems
机器学习:Computer Vision, Speech Recognition, Natural Language Processing/Understanding, Pattern Recognition, Statistical Learning Theory (Convergence, Error Analysis), Probabilistic Graphical Models, Neural Networks
公共:Linear Algebra, Parallelization/Large-Scale/Distributed Computation, Optimization, Probability/Statistics
论坛徽章:0
我以为平时自学下就足够了,想不到还有研究生。压力山大。
论坛徽章:0
我来补发一张“机器学习那些事的图片”,楼上传的那个不清晰。
A few useful things to know about machine learning.jpg_免费高速下载
论坛徽章:0
数学专业 一定要学这个吗 走统计方向
itpub.net All Right Reserved. 北京皓辰网域网络信息技术有限公司版权所有    
 北京市公安局海淀分局网监中心备案编号: 广播电视节目制作经营许可证:编号(京)字第1149号做机器学习/数据挖掘的应届硕士生怎么找到合适的工作
  本人985(前十名)硕士一枚,本科毕业于某中等211大学,有2份机器学习实习经历,不过都是小公司的,研究生阶段实验室的课题是space physics理论研究。现在开始找工作,想问一下目前这个方向去哪些单位出路比较好啊?是纯互联网行业还是去金融那边做做数学模型什么的?  之前实习的单位一个是小的投资公司,类似量化吧;一个是互联网行业,做验证码识别的。。。  。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
14-09-09 &}

我要回帖

更多关于 机器学习和数据挖掘 周志华 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信