Numpy入門——Python資料分析mooc筆記

阿新 • • 發佈：2019-01-07

資料

一個數據，表達一個含義
一組資料，表達一個或多個含義

列表和陣列

列表：資料型別可以不同
陣列：資料型別相同

Python已有列表型別，為什麼需要一個數組物件(型別)？

陣列物件可以去掉元素間運算所需的迴圈，使一維向量更像單個數據
設定專門的陣列物件，經過優化，可以提升這類應用的運算速度
陣列物件採用相同的資料型別，有助於節省運算和儲存空間

比較Python內建列表型別和陣列物件型別

計算A2+B3，其中A和B是一維陣列

Python內建列表型別

def pySum():
    a = [0,1,2,3,4]
    b = [5,6,7,8 
,9]
    c = []
    for i in range(len(a)):
        c.append(a[i]**2+b[i]**3)
    return c
print(pySum())

numpy陣列

import numpy as np
def npSum():
    a = np.array([0,1,2,3,4])
    b = np.array([5,6,7,8,9])
    c = a**2 + b**3
    return c
print(npSum())

N維陣列物件：ndarray

np.array()生成一個ndarray陣列，輸出成[]

形式，元素由空格分隔
軸(axis): 儲存資料的維度；秩(rank)：軸的數量

In [1]: import numpy as np

In [2]: a = np.array([[0,1,2,3],[4,5,6,7]])

In [3]: a
Out[3]:
array([[0, 1, 2, 3],
       [4, 5, 6, 7]])

In [4]: a.ndim
Out[4]: 2

In [5]: a.shape
Out[5]: (2, 4)

In [6]: a.size
Out[6]: 8

In [7]: a.dtype
Out[7]: dtype('int32')

In [8 
]: a.itemsize
Out[8]: 4

In [9]: b = np.array([[0,1,2,3,4],[5,6,7]])
# ndarray陣列可以由非同質物件構成

In [10]: b
Out[10]: array([[0, 1, 2, 3, 4], [5, 6, 7]], dtype=object)
# 非同質ndarray元素為物件型別

In [11]: b.ndim
Out[11]: 1

In [12]: b.shape
Out[12]: (2,)

In [13]: b.size
Out[13]: 2
# 非同質ndarray物件無法有效發揮NumPy優勢，儘量避免使用

In [14]: b.dtype
Out[14]: dtype('O')

In [15]: b.itemsize
Out[15]: 8

屬性	說明
`.ndim`	秩，即軸的數量或維度的數量
`.shape`	ndarray物件的尺度，對於矩陣，n行m列
`.size`	ndarray物件元素的個數，相當於.shape中n*m的值
`.dtype`	ndarray物件的元素型別（bool，intc，intp，int8，int16，int32，int64）
`.itemsize`	ndarray物件中每個元素的大小，以位元組為單位

ndarray陣列的建立方法

從Python中的列表、元組等型別建立ndarray陣列
x = np.array(list/tuple, dtype=np.float32)
當np.array()不指定dtype時，NumPy將根據資料情況關聯一個dtype型別

使用NumPy中函式建立ndarray陣列，如：arange, ones, zeros等

函式	說明
`np.arange(n)`	類似range()函式，返回ndarray型別，元素從0到n‐1
`np.ones(shape)`	根據shape生成一個全1陣列，shape是元組型別
`np.zeros(shape)`	根據shape生成一個全0陣列，shape是元組型別
`np.full(shape,val)`	根據shape生成一個數組，每個元素值都是val
`np.eye(n)`	建立一個正方的n*n單位矩陣，對角線為1，其餘為0
`np.ones_like(a)`	根據陣列a的形狀生成一個全1陣列
`np.zeros_like(a)`	根據陣列a的形狀生成一個全0陣列
`np.full_like(a,val)`	根據陣列a的形狀生成一個數組，每個元素值都是val

使用NumPy中其他函式建立ndarray陣列

函式	說明
`np.linspace()`	根據起止資料等間距地填充資料，形成陣列
`np.concatenate()`	將兩個或多個數組合併成一個新的陣列

In [2]: a = np.linspace(1,10,4)

In [3]: a
Out[3]: array([  1.,   4.,   7.,  10.])

In [4]: b = np.linspace(1,10,4,endpoint=False)

In [5]: b
Out[5]: array([ 1.  ,  3.25,  5.5 ,  7.75])
py
In [6]: c = np.concatenate((a,b))

In [7]: c
Out[7]: array([  1.  ,   4.  ,   7.  ,  10.  ,   1.  ,   3.25,   5.5 ,   7.75])

ndarray陣列的變換

對於建立後的ndarray陣列，可以對其進行維度變換和元素型別變換
1. 維度變換

| 方法                   | 說明                           |
| -------------------- | ---------------------------- |
| `.reshape(shape)`    | 不改變陣列元素，返回一個shape形狀的陣列，原陣列不變 |
| `.resize(shape)`     | 與.reshape()功能一致，但修改原陣列       |
| `.swapaxes(ax1,ax2)` | 將陣列n個維度中兩個維度進行調換             |
| `.flatten()`         | 對陣列進行降維，返回摺疊後的一維陣列，原陣列不變     |

```shell
In [8]: d = np.ones((2,3,4),dtype=np.int32)

In [9]: d.reshape((3,8))
Out[9]:
array([[1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1]])

In [10]: d
Out[10]:
array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]])

In [11]: d.resize((3,8))

In [12]: d
Out[12]:
array([[1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1]])

In [13]: d.flatten()
Out[13]:
array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1])

In [14]: d
Out[14]:
array([[1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1]])
```

型別變換
new_a = a.astype(new_type)
astype()方法一定會建立新的陣列（原始資料的一個拷貝），即使兩個型別一致

In [2]: e = np.ones((2,3,4),dtype=np.int)

In [3]: e
Out[3]:
array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]])

In [4]: e.astype(np.float)
Out[4]:
array([[[ 1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.]],

       [[ 1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.]]])

陣列向列表的轉換
ls = a.tolist()

In [2]: a = np.full((2,3,4),25,dtype=np.int32)

In [3]: a
Out[3]:
array([[[25, 25, 25, 25],
        [25, 25, 25, 25],
        [25, 25, 25, 25]],

       [[25, 25, 25, 25],
        [25, 25, 25, 25],
        [25, 25, 25, 25]]])

In [4]: a.tolist()
Out[4]:
[[[25, 25, 25, 25], [25, 25, 25, 25], [25, 25, 25, 25]],
[[25, 25, 25, 25], [25, 25, 25, 25], [25, 25, 25, 25]]]

ndarray陣列的操作

索引：獲取陣列中特定元素位置的過程
切片：獲取陣列元素子集的過程
- 一維陣列的索引和切片：與Python的列表類似
每個維度切片方法與一維陣列相同
每個維度可以使用步長跳躍切片

```
In [2]: a = np.array([9,8,7,6,5])

In [3]: a[2]
Out[3]: 7

In [4]: a[1:4:2]
Out[4]: array([8, 6])
```

多維陣列的切片

In [5]: b = np.arange(24).reshape((2,3,4))

In [6]: b
Out[6]:
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

In [7]: b[1,2,3]
Out[7]: 23

In [8]: b[-1,-2,-3]
Out[8]: 17

ndarray陣列的運算

陣列與標量之間的運算作用於陣列的每一個元素
NumPy一元函式
對ndarray中的資料執行元素級運算的函式

函式	說明
`np.abs(x)`、`np.fabs(x)`	計算陣列各元素的絕對值
`np.sqrt(x)`	計算陣列各元素的平方根
`np.square(x)`	計算陣列各元素的平方
`np.log(x)`、 `np.log10(x)`、`np.log2(x)`	計算陣列各元素的自然對數、10底對數和2底對數
`np.ceil(x)`、`np.floor(x)`	計算陣列各元素的ceiling值或 floor值
`np.rint(x)`	計算陣列各元素的四捨五入值
`np.modf(x)`	將陣列各元素的小數和整數部分以兩個獨立陣列形式返回
`np.cos(x)`、`np.cosh(x)`、 `np.sin(x)`、`np.sinh(x)`、 `np.tan(x)`、`np.tanh(x)`	計算陣列各元素的普通型和雙曲型三角函式
`np.exp(x)`	計算陣列各元素的指數值
`np.sign(x)`	計算陣列各元素的符號值，1(+), 0, ‐1(‐)

- NumPy二元函式

| 函式                                       | 說明                     |
| ---------------------------------------- | ---------------------- |
| `+`、`‐`、`*`、`/`、`**`                     | 兩個陣列各元素進行對應運算          |
| `np.maximum(x,y)`、`np.fmax()`<br>`np.minimum(x,y)`、`np.fmin()` | 元素級的最大值/最小值計算          |
| `np.mod(x,y)`                            | 元素級的模運算                |
| `np.copysign(x,y)`                       | 將陣列y中各元素值的符號賦值給陣列x對應元素 |
| `>`、`<`、`>=`、`<=`、`==`、`!=`              | 算術比較，產生布爾型陣列           |

Numpy入門——Python資料分析mooc筆記

資料一個數據，表達一個含義一組資料，表達一個或多個含義列表和陣列列表：資料型別可以不同陣列：資料型別相同 Python已有列表型別，為什麼需要一個數組物件(型別)？陣列物件可以去掉元素間運算所需的迴圈，使一維向量更像單個數據

Python資料分析學習筆記（1）numpy模組基礎入門

numpy模組可以進行高效的資料處理，並提供了陣列的支援，很多模組都依賴他，比如pandas、scipy、matplotlib等，因此這個模組是基礎。（1）匯入： import numpy （2）建立一維和二維陣列： #建立一維陣列 x=numpy.

學習Python資料分析隨手筆記【三】numpy陣列的函式ix_()

今天我去圖書館借了一本Python DataAnalysis的書那今天來說一個關於numpy庫的內容。當然課本給出的是著名的lena圖片。不過在pycharm上執行的時候發現它報錯了。隨即就去查看了scipy的檔案搜尋了半天。原來在新版本的scipy中已經將lena移除，不

入門Python資料分析最好的實戰專案

北京二手房房價分析與預測目的：本篇給大家介紹一個數據分析的初級專案，目的是通過專案瞭解如何使用Python進行簡單的資料分析。資料來源：博主通過爬蟲採集的鏈家全網北京二手房資料（後臺回覆二手房便可獲取）。

Python資料分析學習筆記（6）資料規約實戰--以主成分分析PCA為例

一、相關理論： 1、資料規約：產生更小且保持資料完整性的新資料集。意義在於降低無效、錯誤資料；降低儲存成本；少量且具有代表性的資料大幅加快，主要分為以下兩類： ①屬性規約：屬性合併或刪除無關維，目標是尋找最小子集使子集概率分佈儘可能與原來相同。常用方法：（

入門Python資料分析最好的實戰專案（二）建模篇

作者：xiaoyu 微信公眾號：Python資料科學知乎：python資料分析上一篇和大家分享了一個入門資料分析的一個小專案北京二手房房價分析，連結如下：資料分析實戰—北京二手房房價分析文章在sf釋出之後看到有不少感興趣的朋友給我點了贊，感謝

入門Python資料分析最好的實戰專案（一）分析篇

作者：xiaoyu 微信公眾號：Python資料科學知乎：python資料分析非經作者允許，禁止任何商業轉載。目的：本篇給大家介紹一個數據分析的初級專案，目的是通過專案瞭解如何使用Python進行簡單的資料分析。資料來源：博主通過爬蟲採集的鏈家全網北京二手

Python資料分析學習筆記——DataFrame(還在更新中)

pandas的官方文件 1.DataFrame DataFrame是一個表格型的資料結構，它含有一組有序的列，每列可以是不同的值型別（數值、字串、布林值等）。DataFrame既有行索引也有列索引，它可以被看做由Series組成的字典（共用同一個索引）。 DataFrame可以通過類

python資料分析學習筆記七

第七章訊號處理與時間序列（需要統計學知識） 1 statsmodels 子庫示例程式碼如下 import pkgutil as pu import pydoc import statsmodels as sm # statmodels版本號 print("statm

Python資料分析讀書筆記

其實就是nltk使用說明書 >>> import nltk >>> nltk.download() >>> from nltk.book import * text1.concordance(“monst

《python資料分析讀書筆記》--- 資料探索(一)

前言當收集到初步的樣本資料集後，需要對資料從數據質量分析和資料特徵分析兩個方面進行探索分析，其中，資料質量分析要求我們先檢測資料的是否存在缺失值和異常值；而資料特徵分析要求我們在資料探勘建模前，通過頻率分佈分析，對比分析，帕斯托分析，週期性分析，相關性分析等

python 資料分析學習筆記（第三章）

boxplot 箱形圖 catering_sale = '../data/catering_sale.xls' #餐飲資料 data = pd.read_excel(catering_sa

7個實戰案例、24個學習視訊、12G乾貨資料...今天帶你免費入門Python資料分析！...

相信許多做資料的都有這樣的經歷：你花了大半天整合了一張資料表，卻因為其他部門的錯誤，導致表格結構

python資料分析學習筆記九

第九章分析文字資料和社交媒體 1 安裝nltk 略 2 濾除停用字姓名和數字示例程式碼如下: import nltk # 載入英語停用字語料 sw = set(nltk.corpus.stopwords.words('english')) print('Sto

零基礎入門Python資料分析，只需要看懂這一張圖，附下載連結！

摘要在做資料分析的過程中，經常會想資料分析到底是什麼？為什麼要做資料資料分析？資料分析到底該怎麼做？等這些問題。對於這些問題，一

《Python資料分析與展示》學習筆記（一）numpy入門

一.資料分析的基礎 Python在資料科學領域有一套成熟的工具鏈，numpy就是整個工具鏈的基礎構件，就像數位電路中的與非門，是其他複雜電路的基礎。 numpy在數學中對應的理論就是線性代數，n

Cris 的 Python 資料分析筆記 04：NumPy 矩陣的複製，排序，拓展

04. 矩陣的複製，排序，拓展文章目錄 04. 矩陣的複製，排序，拓展 1. NumPy 的引用問題 2. 淺複製 3 深複製 4. 索引求最值 5. title 擴充

Cris 的 Python 資料分析筆記 03：NumPy 矩陣運算和常用函式（重點）

03. 矩陣運算和常用函式（重點）文章目錄 03. 矩陣運算和常用函式（重點） 1. numpy 矩陣判斷和計算 1.1 與運算 1.2 或運算 1.3 或運算作為矩陣索引賦值

Cris 的 Python 資料分析筆記 02：NumPy 資料定位

02. NumPy 資料定位文章目錄 02. NumPy 資料定位 1. numpy 快速判斷每個元素 2. numpy 判斷並返回對應的元素 1. numpy 快速判斷每個元素 i

Cris 的 Python 資料分析筆記 01：NumPy 基本知識

01. NumPy基本知識文章目錄 01. NumPy基本知識 1. numpy 的第一個函式 genfromtxt 2. numpy 的第二個函式 array 3. numpy 的第三個函式 shape

Numpy入門——Python資料分析mooc筆記

資料

列表和陣列

Python已有列表型別，為什麼需要一個數組物件(型別)？

比較Python內建列表型別和陣列物件型別

N維陣列物件：ndarray

ndarray陣列的建立方法

ndarray陣列的變換

ndarray陣列的操作

ndarray陣列的運算

相關推薦