四年前我一次听说数据挖掘这个词,三年前我学习了数据挖掘理
论知识,两年前我做了几个与数据挖掘有关的项目,一年前我成为一
名数据挖掘工程师,今天我把数据挖掘入门资料整理了一下,希望能
够对新人有帮助。
推荐粗读《Head First Python》一书,该书浅显易懂,有 C 语
言基础的人只需一天就能读完,并能够使用 python 进行简单编程。
“Head First”系列的数都很适合初学者,我还读过《Head First
设计模式》和《Head First Statistics》,感觉都不错。不过后两
本,我读得比较细也比较慢,毕竟当时是首次接触设计模式和统计学
相关知识,书中很多东西对我而言都是全新的。而当我读《Head First
Python》时,我已经掌握了 C、C++、java 等多种编程语言,所以再
看 python 就觉得比较简单了。学任何一种编程语言,一定要动手练
习。python 的集成开发环境有很多,我个人比较青睐 PyCharm。
用 python 做数据挖掘的人一般都会用到 pandas 数据分析包。推
荐阅读《pandas:powerful Python data analysis toolkit》文档,
其中《10 Minutes to pandas》这一节能让你轻松上手 pandas。读
了这一节你会知道怎么用一句话得到数据的一些基本统计量(每一列
特征的均值、标准差、最大最小值、四分位点等),怎么简单地实现
多条件的过滤,怎么将两张表按 key 连接,怎么将数据可视化。除了
这篇文档,我还想推荐一本书《利用 Python 进行数据分析》,这本
评论0
最新资源