python数据分析第8天数据规整化:清理,转换,合并,重塑

xiaoxiao2021-02-28  43

合并数据集

pandas可以通过内置方式进行合并

pandas.merge  根据键不同  将DataFrame中的行连接起来

pandas.concat沿着 一条轴将多个对象堆叠到一起

实例方法  combine_first 可以将重复数据编接在一起

数据库风格的DataFrame合并

使用pd.merge函数, 使用on参数指定键

默认情况下,取交集。通过 how 设置 取并集

合并  索引会被丢弃

索引上的合并

传入left_index=True  或者   right_index=True     说明索引应该被用作连接键

对于层次化索引需要指明用做合并键的多个列

还支持join

轴向连接

默认情况下,concat 函数 在axis=0  上工作,产生一个Series    axis=1  产生DataFrame

合并重叠数据

可以使用np.where       相当于一种矢量化的if-else

对于DataFrame    combine_first 也会做同样的事情,可以看做打补丁

重塑和轴向旋转

????

将长格式  旋转 为 宽格式

对ldata 进行转换

前面两个参数 用作行和列索引的列名,最后一个参数则是用于填充DataFrame的数据列的列名

忽略最后一个参数,就会得到有层次化

数据转换

移除重复数据

duplicated方法返回一个布尔型Series,表示各行是否是重复行

而drop_duplicated  方法  移除重复行

利用函数或映射进行数据转换

替换值

转载请注明原文地址: https://www.6miu.com/read-2450263.html

最新回复(0)