1. 程式人生 > >numpy和pandas的常用操作

numpy和pandas的常用操作

一、numpy:

1、np.zero
np.zeros(5)   1行5列      結果:array([ 0.,  0.,  0.,  0.,  0.])
np.zeros((2, 1))  2行1列   結果:array([[ 0.], [ 0.]])
2、矩陣乘法
np.dot
np.multiply

二、pandas

1、 讀取csv檔案
引數:
names,自定義列名
keep_default_na=False,沒有資料的條目就會被識別為’null’,而不是Nan(用Nan後面的資料處理中如果進行了比較操作會報錯,就需要設定一下這個屬性)

pdData = pd.read_csv(path, header=None, names=['Exam 1', 'Exam 2', 'Admitted'])

2、判斷是否為空

如果列為Nan的形式:
ss=data[data['Date_received'].notnull()]#返回不為空的
ss=data[data['Date_received'].isnull()]#返回為空的
如果列為'null'的形式(讀取csv時加入了keep_default_na=False屬性)
ss=data[data['Date_received']!='null']#返回不為空的
ss=data[data['Date_received']=='null']#返回為空的

3、插入一列
pdData.insert(0, ‘Ones’, 1) #在第0列插入1,列名為’Ones’