1. 程式人生 > >python資料處理庫numpy、pandas陣列操作

python資料處理庫numpy、pandas陣列操作

1.numpy

1.1陣列行列

import numpy as np
data_np=np.array(data)
data_col=data_np[:,2:]
data_row=data_np[]

1.2陣列拼接

  • 按列拼接
data_cat_col=np.concatenate((data_left, data_right), axis=1
  • 按行拼接1
data_cat_row=np.concatenate((data_top, data_button), axis=0
  • 按行拼接2
data_cat_row=np.row_stack((data_top, data_button
))

2.pandas

2.1陣列行列

import pandas as pd
data=pd.DataFrame(data)
//#列:取陣列中最後一列之前的資料到新陣列中
data_col=data[data.columns[:-1]]
//#行:取陣列中的前3行到新陣列中
data_row=data.iloc[:3,]

2.2資料拼接

  • 按列拼接

  • 按行拼接1

data_out=data_out.append(data_in)

3.資料按行隨機化

from sklearn.utils import shuffle
data_row_random=shuffle(data_in)