series和dataframe的科学计算

xiaoxiao2021-02-28  43

series相加


series相加就是将对应index位置的values相加。

NaN和任何数做任何运算结果都为NaN。

dataframe加法


将dataframe想象成一个坐标系: dataframe加法就是将相同坐标的值相加。

NaN和任何数做任何运算结果都为NaN。

dataframe内置的方法


按列或列求和sum

这里的一个特例是在按列求和过程中将自动忽略NaN

按行求和只需要指定axis=1即可:

按列或行求最大\最小值,max\min

dataframe信息describe

具体的输出如下: count:本列的元素个数 mean:本列的平均数 std:标准差 min:最小值 25%:第一个四分卫数 50%:中位数 75%:第三个四分卫数 max:最大值

series和dataframe的排序


series排序

按照values排序

1、在排序后index也会随之进行调整 2、其中,在不指定参数的时候(即ascending=True)的时候,默认是一个升序排列。ascending=False表示降序排列

按照index排序

dataframe排序

按照column排序

这里指定了按A列进行升序排序。

降序排序也可以指定参数:ascending=False

按照index排序

降序:

dataframe的merge操作


merge的功能可以将多个dataframe进行连接。

merge的规则

以两个dataframe为例:merge的时候会先判断两个dataframe是否拥有相同的column,如果没有的话则无法merge。

merge的原则就是按相同的column进行连接,像下边这样:

之所以输出是一个空的dataframe,是因为相同的cloumn(key)中没有相同的values,所以merge就不能连接。

例如修改df2中的key列中的一个value为X,则将会将两个dataframe中key都为X的列连接在一起:

merge其他参数

on

on参数用于指定按哪一列进行merge,默认是None:

on=’key’即表示按照key这一列进行merge,on指定的merge的列必须是两个datafarme都有的列。

如果指定了data_set_1,那么将报错,因为data_set_1只是df1中才有的:

how

how参数指定了进行merge的方法,默认how=’inner’,表示按照两边都有的column进行merge。

how还可以指定的值比如:

left/right:表示按照左边/右边的dataframe进行merge,这样将保留指定位置dataframe的所有数据,而另一边则按照指定的这一边进行补全,空的部分为NaN

指定了left,即保留了df1的所有行和列数据,df2根据df1的行进行补全。

outer:这个参数相当于right和left的结合,即保留两边dataframe的所有行列,然后在补全空白。

转载请注明原文地址: https://www.6miu.com/read-2620226.html

最新回复(0)