之前有爱学习的小伙伴在后台问小编能不能推荐一些数据挖掘方面的学习资源,俺可是都记在心里了呢
小编根据自己的学习经验,并同多位过来人交流,整理了以下的书单、视频学习资源,希望能对各位有所帮助
书单 《统计学习方法》 作者:李航 清华大学出版社 推荐理由: 这本书着重于数学推导,能让我们深入地了解数据挖掘领域的一些算法,为啃经典名著打下基础
购买地址 : http://item.jd.com/10975302.html 《模式分类》 作者:Richard O. Duda 机械工业出版社 推荐理由: 这本《模式分类》是很多高校的数据挖掘导论课程的教科书,重在理论的学习
如果不通读这本书,你会发现在研究很多问题的时候,甚至一些相对简单的问题(比如贝叶斯在高斯假设下为什么退化成线性分类器)你都要重新复习
购买地址 : http://item.jd.com/10057422.html 《集体智慧编程》 作者:TOBY SEGARAN 电子工业出版社 推荐理由 : 本书讲述了数据挖掘里面的很多实用的算法,而且从实际的例子入手,辅以python的代码,让你很快的就能理解到这种算法能够应用在哪个实际问题上,并且还能自己上手写写代码
但是缺点是不够深入,数学推导较少,而且不够全面,内容不够详实
购买地址 : http://item.jd.com/1505666918.html 数据挖掘:实用机器学习工具与技术 作者:Ian H.Witten 机械工业出版社 推荐理由: 相对上一本书要稍微难一点,但是也不难理解,本书作者就是著名的Weka的编写者
整本书的思想脉络也是尽可能的由易到难,从简单的模型入手扩展到现实生活中实际的算法问题,最难能可贵的是书的最后还稍微讲了下如何使用weka,这样大家就能在学习算法之余能够用weka做做小实验,有更加直观的认识
购买地址 : http://item.jd.com/11458406.html 《机器学习》 作者:米歇尔 (Mitchell T.M.) 机械工业出版社 推荐理由: 这本书可以看作是对于十多年前的机器学习的一个综述,作者简单明了的讲述了很多流行的算法,并且对于各个算法的适用点和特点都有详细的解说,轻快地在一本薄薄的小书里给了大家一个机器学习之旅
购买地址 : https://www.amazon.cn/ 《数据挖掘导论》 作者:Pang-Ning Tan,Michael Steinbach 范明 范宏建 译 人民邮电出版社 推荐理由 : 本书把算法按照它们实现的功能和目的,分成比如回归、分类、聚类等等,然后讲可以实现聚类的算法有哪些,可以实现回归的有哪些,这种方式对于构建一个大概的机器学习体系还是有好处的,但是深度不够
购买地址 : http://item.jd.com/10380545.html 视频学习资源 在看书的过程中,可能还有很多地方不是很清楚,这时候如果有视频教程的辅助,那肯定是事半功倍的,学习过程中也不容易分心
课程名称:Machine Learning 作者:Andrew Ng(吴恩达) 视频网址: http://openclassroom.stanford.edu/MainFolder/CoursePage.php?course=MachineLearning 中文网址: http://deeplearning.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B 【 已经有中英双语字幕,在公众号iCloudUnion后台回复“机器学习”可获取视频资源 】 这是一份很完整的课程,可以先进性系统性地学习,之后再针对性地去看一些公开课,斯坦福大学、麻省理工学院等都有很多免费的高质量的公开课
但是我也给大家一个不成熟的小建议,一定要先建立好自己的学习系统,有了整体的知识体系以后再去针对性地学习,切记不可东一榔头西一棒槌地找一些很高大上的资料,那样到最后学习效果反而不佳
Coursera上也有吴恩达的课程,但是播放效果并不是很理想,有时候视频略卡
网址: https://www.coursera.org/learn/machine-learning/lecture/RKFpn/welcome 对于吴恩达的课程,知乎上有专栏分享了听课笔记,大家也可以参考一下
网址:https://zhuanlan.zhihu.com/mlearn 网站 CSDN : 了解行业最新资讯和进展,并有众多的优秀博客可学习,也可在论坛里与高手交流
网址: http://www.csdn.net/?ref=toolbar 专栏:Augusdi的专栏 网址:http://blog.csdn.net/augusdi/article/details/20238157 知乎 : 知乎上有很多关于数据挖掘和机器学习方面的讨论,闲暇之余可以浏览一下,也可以在回答问题中检验自己的学习深度
之所以不想跟大家推荐太多,是因为逛网站论坛什么的并不能构成学习的主体通道,只是给大家提供一些了解他人思想的渠道而已
代表人物 点击图片可查看详细介绍 Andrew Ng(吴恩达) Yann LeCun Geoffrey Hinton …… 更多更详细的人物介绍可关注公众号iCloudUnion,在大数据精英栏目查看
写在最后 想要在这个领域有所建树,代码是要写好的、工具是要用熟的、数学基础是必须的、论文是一定要看的…… 相关会议:KDD,ICML,NIPS,IJCAI,AAAI,WWW,SIGIR,ICDM等
相关期刊:TKDD,TKDE,JMLR,PAMI等
在看书看论文的基础上适当参加一些公开课,稍微看一些优秀的博客和专栏,并在项目中实施,遇到问题及时纠正,这样才能在这个领域拥有发言权
以上资源亲测实用,请大胆获取
加油,21世纪最性感的人! 下期再见 -iCloudUnion-