Python學習筆記-資料分析-Numpy01

阿新 • • 發佈：2018-12-15

Numpy是Python開源的科學計算工具包，主要的特點如下：

強大的N維陣列物件：ndarray
對陣列結構資料進行運算（不用遍歷迴圈）
隨機數、線性代數、傅立葉變換等多種功能

說明：

1、本人的筆記均在win10（64）環境下的Jupyter- Notebook中直接編寫，如有需要可以直接拷貝程式碼。

2、註釋中除了有關於程式碼的解釋，還有本人在學習中的一些拙見。

3、本人程式碼註釋均寫在程式碼上方。

一、 Numpy陣列ndarray

# 注意與list打印出來的區別，list用逗號分隔元素。array沒有分隔。

# 引入numpy這個包，並改名為np
import numpy as np

# 用.array建立np的陣列，型別是numpy.ndarray
# .array()是個方法，所以後面的小括號是必須的。
# 小括號裡是要生成的陣列的內容，可以用小括號()也可以用中括號[]
ar = np.array((1,2,3,4,5))
ar1 = np.array([1,2,3,4,5])
print(ar, type(ar))
print(ar1,type(ar1))

執行結果如下：

[1 2 3 4 5] <class 'numpy.ndarray'>
[1 2 3 4 5] <class 'numpy.ndarray'>

# 二三維陣列
# 二維陣列是由兩個一維陣列組成的。
# 三維陣列是由兩個二維陣列組成的。
# 剛開始可能對各種括號有些亂，我是這樣區分的。
# 以[[1,2,3,4,5,],[6,7,8,9,10]]為例子：
# 最外層[]跟一維陣列的理解一樣；內層[1,2,3,4,5,]是第一個一維陣列；內層[6,7,8,9,10]是第二個一維陣列
# 中間的,號是區分這兩個陣列
ar2 = np.array([[1,2,3,4,5,],[6,7,8,9,10]])
ar3 = np.array(([1,2,3,4,5],[6,7,8,9,10]))
print(ar2)
print('----------------------------')
print(ar3)
print('----------------------------')

執行結果如下：

[[ 1  2  3  4  5]
 [ 6  7  8  9 10]]
----------------------------
[[ 1  2  3  4  5]
 [ 6  7  8  9 10]]
----------------------------

# 三維陣列
# 注意，由於元素中有字元，所以整個陣列的元素都會變成字元。
ar4 = np.array([[(['a','b','c','d','e'],[1,2,3,4,5])],[(['a','b','c','d','e'],[6,7,8,9,10])]])
print(ar4,type(ar4))在這裡插入程式碼片

執行結果如下：

[[[['a' 'b' 'c' 'd' 'e']
   ['1' '2' '3' '4' '5']]]

 [[['a' 'b' 'c' 'd' 'e']
   ['6' '7' '8' '9' '10']]]] <class 'numpy.ndarray'>

二、陣列生成

1、range()和arange()

# 對於array生成陣列的說明，.array()括號裡可以是列表、元祖、陣列、生成器等等
# 通過range()生成一個0-9的list,並通過array轉換成陣列。
ar_r = np.array(range(10))
print(ar_r,type(ar_r))
# 通過Numpy自己的arange直接生成陣列。
ar_ar = np.arange(10)
print(ar_ar,type(ar_ar))

# 如果arange()括號裡面的數帶小數點的話，例如5.0就變成浮點型了。
ar_r1 = np.arange(5.0)
print(ar_r1,type(ar_r1))
# 跟range()一樣，可以通過最後一個引數來控制步長。
print(np.arange(0,10,2))

執行結果如下：

[0 1 2 3 4 5 6 7 8 9] <class 'numpy.ndarray'>
[0 1 2 3 4 5 6 7 8 9] <class 'numpy.ndarray'>
[0. 1. 2. 3. 4.] <class 'numpy.ndarray'>
[0 2 4 6 8]

# 通過列表直接生成陣列時，前後兩個列表如果元素個數不同的話，會導致的整個陣列維度變化。
ar5 = np.array([[1,2,3,4,5,],[6,7,8,9,10,'a','b']])
ar5_1 = np.array([[1,2,3,4,5,],[6,7,8,9,10,]])
print('這是ar5：',ar5)
print('----------------------------')
print('這是ar5_1:',ar5_1)
print('----------------------------')
print('注意陣列維度--->',ar5.ndim)
print('注意陣列維度--->',ar5_1.ndim)

執行結果如下：

這是ar5： [list([1, 2, 3, 4, 5]) list([6, 7, 8, 9, 10, 'a', 'b'])]
----------------------------
這是ar5_1: [[ 1  2  3  4  5]
 [ 6  7  8  9 10]]
----------------------------
注意陣列維度---> 1
注意陣列維度---> 2

2、.linspace()

# .linspace()有五個常用引數（開始，結束，個數，是否包含最後一個數，顯示步長），如果最後一個引數不指定就包括“開始”和“結束”這兩個值。
# 注意
# 1、由於包括開始和結束，所以在進行間隔分段的時候經常出現帶小數的，而且小數的位數很多。
# 2、想避開很多小數位的話，可以調整分隔數
# 3、如果步長引數retstep = True的話，那麼生成的就是元祖了。

# 從1開始到15，共分12份
print(np.linspace(1,15,num = 12))
print('-----------------------------')

# 從1開始到15，共分11份
print(np.linspace(1,15,num = 11))
print('-----------------------------')

# 從1開始到15，共分10份,但不包含最後一個數15 retstep
print(np.linspace(1,15,num = 10,endpoint = False))
print('-----------------------------')

#從1開始到15，共分10份,顯示步長
s = np.linspace(1,15,num = 10,retstep = True)
print(s)
print('注意是元祖--->',type(s))
print('-----------------------------')

# 通過下標訪問的話，第一個是陣列本身，第二個是步長
print('陣列-->',s[0])
print('-----------------------------')
print('步長-->',s[1])

執行結果如下：

[ 1.          2.27272727  3.54545455  4.81818182  6.09090909  7.36363636
  8.63636364  9.90909091 11.18181818 12.45454545 13.72727273 15.        ]
-----------------------------
[ 1.   2.4  3.8  5.2  6.6  8.   9.4 10.8 12.2 13.6 15. ]
-----------------------------
[ 1.   2.4  3.8  5.2  6.6  8.   9.4 10.8 12.2 13.6]
-----------------------------
(array([ 1.        ,  2.55555556,  4.11111111,  5.66666667,  7.22222222,
        8.77777778, 10.33333333, 11.88888889, 13.44444444, 15.        ]), 1.5555555555555556)
注意是元祖---> <class 'tuple'>
-----------------------------
陣列--> [ 1.          2.55555556  4.11111111  5.66666667  7.22222222  8.77777778
 10.33333333 11.88888889 13.44444444 15.        ]
-----------------------------
步長--> 1.5555555555555556

3、zeros()和ones()

# .zeros()生成元素全部為0的陣列，zeros(shape, dtype=float, order='C')
# .ones()生成元素全部為1的陣列，ones(shape, dtype=None, order='C')

# 生成10個元素為0的陣列
print('10個元素為0的陣列：','\n',np.zeros(10))
# 生成10個元素為1的陣列
print('10個元素為1的陣列：','\n',np.ones(10))

# 生成2行5列的二維全0陣列
# 注意括號裡的寫發，引數第一個是shape也就是形狀，
print('2行5列二維陣列--->','\n',np.zeros((2,5)))
print('3行5列二維陣列--->','\n',np.zeros((3,5)))

s1 = np.zeros((2,3,5))
print('三維陣列--->','\n',s1)
print('幾維陣列？？-->',s1.ndim)
# ones()同樣是
print('2行5列二維陣列--->','\n',np.ones((2,5)))
print('3行5列二維陣列--->','\n',np.ones((3,5)))
s2 = np.ones((2,3,5))
print('三維陣列--->','\n',s2)
print('幾維陣列？？-->',s2.ndim)

執行結果如下：

10個元素為0的陣列： 
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
10個元素為1的陣列： 
 [1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]
2行5列二維陣列---> 
 [[0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]]
3行5列二維陣列---> 
 [[0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]]
三維陣列---> 
 [[[0. 0. 0. 0. 0.]
  [0. 0. 0. 0. 0.]
  [0. 0. 0. 0. 0.]]

 [[0. 0. 0. 0. 0.]
  [0. 0. 0. 0. 0.]
  [0. 0. 0. 0. 0.]]]
幾維陣列？？--> 3
2行5列二維陣列---> 
 [[1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]]
3行5列二維陣列---> 
 [[1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]]
三維陣列---> 
 [[[1. 1. 1. 1. 1.]
  [1. 1. 1. 1. 1.]
  [1. 1. 1. 1. 1.]]

 [[1. 1. 1. 1. 1.]
  [1. 1. 1. 1. 1.]
  [1. 1. 1. 1. 1.]]]
幾維陣列？？--> 3

4、zeros_like()、/ones_like()和eye()

# .zeros_like()生成一個和引數形狀相同的全0陣列。
# .ones_like()生成一個和引數形狀相同的全1陣列。
print('前面定義的一個二維陣列：','\n',ar2)
print('生成一個和ar2形狀相同的全0陣列：','\n',np.zeros_like(ar2))
print('生成一個和ar2形狀相同的全1陣列：','\n',np.ones_like(ar2))


# eye()生成一個正方的N×N的矩陣陣列，其中對角線值為1，其他的為0
print('生成一個4×4的矩陣：','\n',np.eye(4))

執行結果如下：

前面定義的一個二維陣列： 
 [[ 1  2  3  4  5]
 [ 6  7  8  9 10]]
生成一個和ar2形狀相同的全0陣列： 
 [[0 0 0 0 0]
 [0 0 0 0 0]]
生成一個和ar2形狀相同的全1陣列： 
 [[1 1 1 1 1]
 [1 1 1 1 1]]
生成一個4×4的矩陣： 
 [[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]
 [0. 0. 0. 1.]]

5、ndim()和shape()

# ndarray.ndim 檢視陣列的維度，也就是看是幾維陣列
# 檢視之前定義的ar、ar2和ar4是幾維陣列
print('ar的維度',ar.ndim)
print('ar2的維度',ar2.ndim)
print('ar4的維度',ar4.ndim)

# ndarray.shape 檢視陣列的形狀或者說是尺寸，就是幾行幾列 如n行m列（n，m）

# ar是0行列5列

print(ar.shape)
print('-----------------------------')
# ar2是2行5列
print(ar2.shape)
print('-----------------------------')

# 看一個特別的例子
ar6 = np.array([[1],[2]])
print(ar6,'\n',ar6.shape)

執行結果如下：

ar的維度 1
ar2的維度 2
ar4的維度 4
(5,)
-----------------------------
(2, 5)
-----------------------------
[[1]
 [2]] 
 (2, 1)

6、size()、dtype()、itemsize()和data()

# ndarray.size 檢視陣列中元素的總個數
print(ar.size)
print('-----------------------------')
print(ar2.size)
print('-----------------------------')
print(ar4.size)
print('-----------------------------')

執行結果如下：

5
-----------------------------
10
-----------------------------
20
-----------------------------

# ndarray.dtype 檢視陣列中元素的型別。
# 另外NumPy提供它自己的型別。numpy.int32，numpy.int16和numpy.float64是一些例子。
# 注意與.type的區別

print(type(ar2),'\n',ar2.dtype)

執行結果如下：

<class 'numpy.ndarray'> 
 int32

# ndarray.itemsize 檢視陣列中每個元素的位元組大小
print(ar2.itemsize)

執行結果如下：

# ndarray.data 檢視陣列中元素的緩衝區。
# 一般很少會用到這個，用的比較多的是用索引來範圍各個元素。
print(ar3.data)

執行結果如下：

<memory at 0x000002782F10F1F8>

Python學習筆記-資料分析-Numpy01

Numpy是Python開源的科學計算工具包，主要的特點如下：強大的N維陣列物件：ndarray 對陣列結構資料進行運算（不用遍歷迴圈）隨機數、線性代數、傅立葉變換等多種功能說明：

Python學習筆記-資料分析-Numpy02-通用函式

Numpy通用函式一、陣列形狀— —.T/.reshape()和.resize()** 1、numpy.T ：轉置，例如原shape為(3,4)/(2,3,4)，轉置結果為(4,3)/(4,3,2)

Python學習筆記-資料分析-Numpy04-隨機數

Numpy隨機數 1、隨機數是資料分析中很重要的一個輔助工具。裡面包含正太分佈、均勻分佈等等很多型別。通過隨機數可以生成我們想要的符合某個特性的資料，以便我們學習新的工具包或者測試某個演算法。 2、這裡

Python學習筆記-資料分析-Numpy05-資料的輸入輸出

Numpy資料的輸入輸出 import numpy as np import os # 先設定一下工作路徑 # 在寫路徑的時候，如果直接拷貝路徑過來的話會所“\”的斜槓，我個人習慣前面加上r，防止對字串

Python學習筆記——資料分析之Matplotlib繪圖

目錄 Matplotlib 是一個 Python 的 2D繪相簿，通過 Matplotlib，開發者可以僅需要幾行程式碼，便可以生成繪圖，直方圖，功率譜，條形圖，錯誤圖，散點圖等。用於創建出版質

python學習-文字資料分析1(主題提取+詞向量化)

原文地址： http://blog.sina.com.cn/s/blog_727a704c0102vn44.html 使用Python 進行簡單文字類資料分析，包括： 1. 分詞 2. 生成語料庫，tfidf加權 3. lda主題提取模型 4. 詞向量化word2vec

Python--學習筆記2 常用庫 <利用Python進行資料分析>

numpy 科學計算包：多維陣列物件；數學運算函式；隨機數；傅立葉變換可以作為演算法之間傳遞資料的容器。 pandas 快速處理結構化資料和函式。 dataframe，面向列的二維表結構，含有行標和列標。 matplotliba &nb

python學習筆記02 --------------基礎資料型別

python的基本資料型別： 1.基本資料 1.1. 數字型別 1.1.1 整數 int int() #將括號內內容轉化為整數型別。 1.1.2 浮點數 float 1.1.3 複數 complex

Python學習筆記(一) 資料型別

資料型別本來以為資料型別是最最簡單的知識，可是發現網上說法比較亂，我就用java的思維去理解吧。╮(╯▽╰)╭ 一.基本資料型別 1.Numbers（數字）整數浮點數複數 2.String（字串）字串可以單引號如‘abc’或者雙引號

python學習筆記一：基本資料型別

1、python的一切都是物件，物件是包含屬性和方法的一個整體。 2、資料型別的組成：身份（記憶體地址，通過id方法可看它的唯一識別符號）；型別（通過type方法檢視）；值（資料項） 3、常用基本資料型別 int 整型 bool 布林

python學習筆記——（2）pandas中的資料型別

在用python進行資料處理的時候，自帶的五種資料型別使用起來顯然是有侷限性的，python之強大在於各種包，在資料處理中用的最多的就是pandas和numpy。本文章主要介紹pandas的資料結構。 pandas有兩種資料結構

Python學習筆記——（1）標準資料型別

最近一直在用python做一些實驗，都是一邊百度一邊寫程式碼，最後程式碼是寫完了，可是回過頭一想，感覺知識很零碎。沒有構成體系，所以決定寫個系列部落格，把一些基礎知識梳理記錄下來，主要是幫助自己加深理解，構建起系統的知識體系，從資料型別開始吧。版本為python3.6

【python學習筆記】36：抓取去哪兒網的旅遊產品資料

學習《Python3爬蟲、資料清洗與視覺化實戰》時自己的一些實踐。書上這章開篇就說了儘量找JSON格式的資料，比較方便解析（在python裡直接轉換成字典），去哪兒網PC端返回的不是JSON資料，這裡抓取的是它的移動端的資料。如果是就散落在網頁上，我覺得就像上篇學習的那

【python學習筆記】41：認識Pandas中的資料變形

學習《Python3爬蟲、資料清洗與視覺化實戰》時自己的一些實踐。 Pandas資料變形關於stack()和unstack()見這裡和這裡。 import pandas as pd import numpy as np # 讀取杭州天氣檔案 df = pd.read

【python學習筆記】45：認識Matplotlib和pyecharts資料視覺化

學習《Python3爬蟲、資料清洗與視覺化實戰》時自己的一些實踐。 Matplotlib資料視覺化資料準備 import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv("E:/Data/p

【python學習筆記】44：Series.apply()列資料批量處理,Series.str.extract()正則匹配

學習《Python3爬蟲、資料清洗與視覺化實戰》時自己的一些實踐。 Series.apply()列資料批量處理先將該列取出，形成Series物件，再呼叫apply()方法傳入用於處理的函式，這個過程就像map()一樣。 import pandas as pd # 各

【python學習筆記】43：Pandas時序資料處理

學習《Python3爬蟲、資料清洗與視覺化實戰》時自己的一些實踐。 Python中時間的一些常用操作 import time # 從格林威治時間到現在,單位秒 print('系統時間戳:', time.time()) print('本地時間按格式轉成str:', tim

【python學習筆記】42：Pandas資料缺失值/異常值/重複值處理

學習《Python3爬蟲、資料清洗與視覺化實戰》時自己的一些實踐。缺失值處理 Pandas資料物件中的缺失值表示為NaN。 import pandas as pd # 讀取杭州天氣檔案 df = pd.read_csv("E:/Data/practice/hz_we

python學習筆記程式執行過程基本資料型別

python一切皆物件。列表的元素可以修改，元組的不能修改。 # python2.7 name = 'The world is like a mirror: when you frown at it, it frowns at y

Python 學習筆記之——用 sklearn 對資料進行預處理

1. 標準化標準化是為了讓資料服從一個零均值和單位方差的標準正態分佈。也即針對一個均值為 m e

Python學習筆記-資料分析-Numpy01

Numpy是Python開源的科學計算工具包，主要的特點如下：

強大的N維陣列物件：ndarray

對陣列結構資料進行運算（不用遍歷迴圈）

隨機數、線性代數、傅立葉變換等多種功能

說明：

1、本人的筆記均在win10（64）環境下的Jupyter- Notebook中直接編寫，如有需要可以直接拷貝程式碼。

2、註釋中除了有關於程式碼的解釋，還有本人在學習中的一些拙見。

3、本人程式碼註釋均寫在程式碼上方。

一、 Numpy陣列ndarray

二、陣列生成

相關推薦