形式
用list和tuple等数据结构表示数组
一维数组 list=[1,2,3,4]二维数组 list = [[1,2,3],[4,5,6],[7,8,9]]array模块
通过安装array模块,利用array函数创建数组。array.array(“B”,range(5))提供append,insert和read等方法ndarray是N维数组
Numpy中基本的数据结构所有元素是同一种类型别名为array利用节省内存和提高CPU计算时间ndarray数组属性
维度(dimensions)称为轴(axis),轴的个数称为(rank)基本属性 - ndarray.ndim(秩) - ndarray.shape(维度) - ndarray.size(元素总个数) - ndarray.dtype(元素类型) - ndarray.itemsize(元素字节大小)ndarray的创建方法:
arangearraycopyemptyempty_likeeyefromfilefromfunctionidentitylinspacelogspacemgridogridonesones_likerzeroszeros_like >>>import numpy as np >>>aArray = np.array([1,2,3]) >>>aArray array([1,2,3]) >>>bArray = np.array([(1,2,3),(4,5,6)]) >>>bArray array([[1,2,3], [4,5,6]]) >>>np.arange(1,5,0.5) array([1.,1.5,2.,2.5,3.,3.5,4.,4.5]) >>>np.random.random((2,2)) array([[0.7977704,0.1468679],[0.95838379,0.86106278]]) >>>np.linspace(1,2,10,endpoint=False) array([1,1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9])ndarray的运算方法:
summeanstdvarminmaxargminargmaxcumsumcumprodndarray的ufunc函数: ufunc(universal function)是一种能对数组的每个元素进行操作的函数。NumPy内置的许多ufunc函数都是在C语言级别实现的,计算速度非常快
addallanyarangeapply_along_axisargmaxargminargsortaveragebincountceilclipconjcorrcoefcovcrosscumprodcumsumdiffdotexpfloorSeries - 基本特征 - 类似一维数组的对象 - 由数据和索引组成
from pandas import Series >>> aSer = pd.Series([1,2.0,'a']) >>>aSer 0 1 1 2 2 a dtype:int64 Series的name属性 重要功能 - Series对象本身及其索引均有一个name属性 - Series的name属性与其他重要功能关系密切Dataframe
基本特征 - 一个表格型的数据结构 - 含有一组有序的列(类似于index) - 大致可看成共享一个index的Series集合