1. 程式人生 > >Python data science thd numpy basic

Python data science thd numpy basic

Numpy最重要的一個特

(ndarray)點是其N維陣列物件,該物件是一個快速而靈活地大資料集容器

建立ndarray建立陣列最簡單的方法就是使用array函式,它接收一切陣列性的物件,然後產生一個新的含有傳入陣列的NumPy物件

data=[2,3,4]

arr1=np.array(data)

np.zeros(10),np.ones(10) ,np.empty(10) 可以建立一個沒有任何具體值得陣列

np.zeros((3,6)) ,np.empty((2,3,2)) empty返回的都是未初始化的垃圾值

arange是Python內建函式range的陣列版

np.arrange(15)

輸出是array([15個數值])

NumPy的資料型別都是float64浮點數(幾乎)

ndarray的資料型別的指定:

np.array([1,2,3],dtype=np.int32)dtype的命名方式相同:一個型別名,後面跟一個表示各元素長的數字

arr1.astype(np.float64)可以改變其方式

跟列表最重要的區別是,陣列切片是原始資料的檢視,這意味著資料不會被複制,檢視上的任意修改都會直接反應到原陣列上

arr1=np.arange(10)
arr1[5:8]=12

如果你需要將陣列複製,你需要顯式的將陣列copy出來,進行復制操作

arr1[5:8].copy()

可以利用以逗號隔開的索引列表來選取每個元素arr1[2,3]

只有冒號表示選取整個軸,arr[:,:1] arr[:2,1:]=0,對切片的賦值操作也會擴散到整個選區

mask=(name=='Bob') | (name=='Will') 布林型索引選取陣列,

花式索引:(就是可以根據索引將陣列選區出來)

花式索引總是將新陣列複製到一個新的儲存單元;arr.T轉置