入门
1.Series
2.DataFrame
3.pandas io 操作
4.indexing & Selecting
5.reindx(对列,行)
6.Nan
7.多级index
8.map和replace
进阶
1.Series,DataFrame简单计算(加减乘max,min,describe)
2.Series,DataFrame排序
3.DataFrame重命名
4.DataFrame的merge
5.Concatenate和Combine(结合,填补)
6.用apply处理数据
7.Series,DataFrame中用duplicated去重
8.时间序列简单操作
9.时间序列的采样和画图
10.数据分箱技术Binning
11.数据分组技术Groupby
12.数据聚合技术Aggregation
13.透视表
14.分组和透视功能实战
对索引值进行排序
唯一值
显示具体的唯一值
显示列唯一值个数
缺失值
1.移除重复值
- 查看数据属性
- 常用方法
- 轴的使用
axis:
0值表示沿着某一列或行标签索引值
向下执行方法
1值表示沿着某一行或列标签横向执行对应的方法 - 增加删除列的操作
- 缺失值和文本字符串的处理
- 缺失值
- 文本数据(字符串处理)
- 设置索引和索引提取数据(loc、iloc)
- set_index()设置多重索引
- sort_index 将索引进行排序
- 切片(slicers)对多重索引操作
slice表达的是范围,有几重索引就写几个条件,用冒号代表去全部的列
第一重索引取值范围0-1000
第二重索引取值为给定值
第三重索引没给限定条件
- reset_index还原索引
iloc是按照位置索引,loc是按照名称索引
- 数据的查询、修改、分组计算
1.查询
2.修改
3.分组计算
- 分组查看每组大小
- 单个统计量
- 多个统计量
- 对所有列球多个统计量
- 不同列球不同统计量