《利用Python进行数据分析》内容简介:学习NumPy(NumericalPython)的基础和高级知识;
从pandas库的数据分析工具开始利用高性能工具对数据进行加载、清理、转换、合并以及重塑;
利用matpIotlib创建散点图以及静态或交互式的可视化结果;
利用pandas的groupby功能对数据集进行切片、切块和汇总操作;
处理各种各样的时间序列数据。
IPython基础49
内省51
使用命令历史60
与操作系统交互63
软件开发工具66
IPythonHTMLNotebook75
利用IPython提高代码开发效率的几点提示77
高级IPython功能79
致谢81
第4章NumPy基础:数组和矢量计算82
NumPy的ndarray:一种多维数组对象83
通用函数:快速的元素级数组函数98
利用数组进行数据处理100
用于数组的文件输入输出107
线性代数109
随机数生成111
范例:随机漫步112
第5章pandas入门115
pandas的数据结构介绍116
基本功能126
汇总和计算描述统计142
处理缺失数据148
层次化索引153
其他有关pandas的话题158
第6章数据加载、存储与文件格式162
读写文本格式的数据162
二进制数据格式179
使用HTML和WebAPI181
使用数据库182
第7章数据规整化:清理、转换、合并、重塑186
合并数据集186
重塑和轴向旋转200
数据转换204
字符串操作217
示例:USDA食品数据库224
第8章绘图和可视化231
matplotlibAPI入门231
pandas中的绘图函数244
绘制地图:图形化显示海地地震危机数据254
Python图形化工具生态系统260
第9章数据聚合与分组运算263
GroupBy技术264
数据聚合271
分组级运算和转换276
透视表和交叉表288
示例:2012联邦选举委员会数据库291
第10章时间序列302
日期和时间数据类型及工具303
时间序列基础307
日期的范围、频率以及移动311
时区处理317
时期及其算术运算322
重采样及频率转换327
时间序列绘图334
移动窗口函数337
性能和内存使用方面的注意事项342
第11章金融和经济数据应用344
数据规整化方面的话题344
分组变换和分析355
更多示例应用361
第12章NumPy高级应用368
ndarray对象的内部机理368
高级数组操作370
广播378
ufunc高级应用383
结构化和记录式数组386
更多有关排序的话题388
NumPy的matrix类393
高级数组输入输出395
性能建议397