Python数据分析与展示(6)——Pandas数据特征分析

xiaoxiao2021-02-28  126

最近在中国大学mooc网学习Python数据分析与展示相关知识,记入下来,以供参考。

Pandas数据特征分析

数据的排序

.sort_index()方法在指定轴上根据索引进行排序,默认升序 .sort_index(axis=0, ascending=True)

.sort_values()方法在指定轴上根据数值进行排序,默认升序 Series.sort_values(axis=0, ascending=True) DataFrame.sort_values(by, axis=0, ascending=True) by : axis轴上的某个索引或索引列表

数据的基本统计分析

适用于Series和DataFrame类型

方法说明.sum()计算数据的总和,按0轴计算,下同.count()非NaN值的数量.mean() .median()计算数据的算术平均值、算术中位数.var() .std()计算数据的方差、标准差.min() .max()计算数据的最小值、最大值.describe()针对0轴(各列)的统计汇总

适用于Series类型

方法说明.argmin() .argmax()计算数据最大值、最小值所在位置的索引位置(自动索引).idxmin() .idxmax()计算数据最大值、最小值所在位置的索引(自定义索引)

数据的累积统计分析

适用于Series和DataFrame类型,累计计算

方法说明.cumsum()依次给出前1、2、…、n个数的和.cumprod()依次给出前1、2、…、n个数的积.cummax()依次给出前1、2、…、n个数的最大值.cummin()依次给出前1、2、…、n个数的最小值

适用于Series和DataFrame类型,滚动计算(窗口计算)

方法说明.rolling(w).sum()依次计算相邻w个元素的和.rolling(w).mean()依次计算相邻w个元素的算术平均值.rolling(w).var()依次计算相邻w个元素的方差.rolling(w).std()依次计算相邻w个元素的标准差.rolling(w).min() .max()依次计算相邻w个元素的最小值和最大值

数据的相关分析

适用于Series和DataFrame类型

方法说明.cov()计算协方差矩阵.corr()计算相关系数矩阵, Pearson、Spearman、Kendall等系数
转载请注明原文地址: https://www.6miu.com/read-35026.html

最新回复(0)