NumPy Essentials 帶註釋原始碼四、NumPy 核心和模組

阿新 • • 發佈：2019-02-06

# 來源：NumPy Essentials ch4

步長


# 步長是每個維度相鄰兩個元素的偏移差值
import numpy as np

x = np.arange(8, dtype = np.int8)
x
# array([0, 1, 2, 3, 4, 5, 6, 7])
# x 是一維陣列，步長為 1，因為 int8 佔一個位元組
x.strides
# (1,)
# data 屬性可以觀察原始資料
str(x.data)
# '\x00\x01\x02\x03\x04\x05\x06\x07'

# 將 x 轉換為 2x4 的二維陣列
x.shape = 2, 4 
x
'''
array([[0, 1, 2, 3], 
       [4, 5, 6, 7]], dtype=int8) 
''' 

# 第二維的步長是 1，等於型別大小
# 第一維的步長是 4，等於第二位步長乘以第二維的長度
x.strides
# (4, 1)
# 原始資料還是不變
str(x.data) 
# '\x00\x01\x02\x03\x04\x05\x06\x07' 

# 轉換為 1x4x2 的三位陣列
x.shape = 1,4,2
# 第三維的步長是 1，等於型別大小
# 第二維的步長是 2，等於第三維步長乘以第三維的長度
# 第一維的步長是 8，等於第二維步長乘以第二維的長度
x.strides 
# (8, 2, 1)
str(x.data)
# '\x00\x01\x02\x03\x04\x05\x06\x07' 

'''
對於連續陣列（flags 中為連續）：
strides[ndim - 1] = itemsize
strides[i] = strides[i + 1] * shape[i + 1]

def calc_strides(shape, itemsize):
    ndim = len(shape)
    strides = [0] * ndim
    strides[-1] = itemsize
    for i in xrange(ndim - 2, -1, -1):
        strides[i] = strides[i + 1] * shape[i + 1]
    return strides
''' 


# 再來看看不連續陣列
# 這裡 x 是連續的，y 是不連續的
x = np.ones((10000,)) 
y = np.ones((10000 * 100, ))[::100] 
# 它們的形狀一樣，都是 10000 大小的一維陣列
x.shape, y.shape 
# ((10000,), (10000,))
# 值也一樣 
x == y 
# array([ True,  True,  True, ...,  True,  True, True], dtype=bool) 

# 檢視它們的標識
x.flags 
'''
C_CONTIGUOUS : True 
F_CONTIGUOUS : True 
OWNDATA : True 
WRITEABLE : True 
ALIGNED : True 
UPDATEIFCOPY : False 

由於 x 是一維陣列，所以行和列都連續
''' 

y.flags 
'''
C_CONTIGUOUS : False 
F_CONTIGUOUS : False 
OWNDATA : False 
WRITEABLE : True 
ALIGNED : True 
UPDATEIFCOPY : False 

y 是由切片產生的，所以行和列都不連續
並且沒有自己的資料
'''

# 它們的步長是不一樣的
# 某個維度在切片時提供了步長
# 陣列的步長也會乘這個數
x.strides, y.strides 
# ((8,), (800,)) 

'''
不連續陣列由於不是快取友好的
訪問也較慢

%timeit x.sum() 
100000 loops, best of 3: 13.8 µs per loop 
%timeit y.sum() 
10000 loops, best of 3: 25.9 µs per loop

結構化陣列

# 結構化陣列也叫作記錄陣列
# 它的元素是一條記錄

# 要建立這種陣列，我們需要使用陣列來表示資料，每個元素是一個元組，表示記錄
# 然後我們需要指定型別，使用陣列來表示，每個元素是個二元組
# 欄位用二元組表示，第一項是名稱，第二項是型別
x = np.array([(1, 0.5, 'NumPy'), (10, -0.5, 'Essential')], 
      dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', 'S10')]) 

# 位置下標得到的是元組（記錄）
x[0] 
# (1, 0.5, 'NumPy') 
# 還可以通過欄位名稱訪問
# 得到的是欄位值的陣列
x['f2'] 
# array(['NumPy', 'Essential'], dtype='|S10') 

# 欄位值的資料還是檢視
# 修改它會修改原始陣列
y = x['f0'] 
y 
# array([ 1, 10]) 
y[:] = y * 10 
y 
# array([ 10, 100]) 
y[:] = y + 0.5 
y 
# array([ 10, 100]) 
x 
'''
array([(10, 0.5, 'NumPy'), (100, -0.5, 'Essential')], 
    dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', 'S10')]) 
'''

# 欄位的每個元素也可以是陣列
z = np.ones((2,), dtype = ('3i4, (2,3)f4')) 
z 
'''
array([([1, 1, 1], [[1.0, 1.0, 1.0], [1.0, 1.0, 1.0]]), 
       ([1, 1, 1], [[1.0, 1.0, 1.0], [1.0, 1.0, 1.0]])], 
      dtype=[('f0', '<i4', (3,)), ('f1', '<f4', (2, 3))]) 
'''

# 我們也可以給欄位型別重新命名
x.dtype.names 
# ('f0', 'f1', 'f2') 
x.dtype.names = ('id', 'value', 'note') 
x 
''' 
array([(10, 0.5, 'NumPy'), (100, -0.5, 'Essential')], 
      dtype=[('id', '<i4'), ('value', '<f4'), ('note', 'S10')]) 
'''

# 也可以使用字典來表示型別
# names 鍵是名稱列表，formats 鍵是型別列表
dict_ex = np.zeros((2,), dtype = {'names':['id', 'value'], 'formats':['i4', '2f4']}) 
dict_ex 
'''
array([(0, [0.0, 0.0]), (0, [0.0, 0.0])], 
      dtype=[('id', '<i4'), ('value', '<f4', (2,))]) 
'''

# 屬性索引也支援多值
x[['id', 'note']]
'''
array([(10, 'NumPy'), (100, 'Essential')], 
      dtype=[('id', '<i4'), ('note', 'S10')]) 
'''

日期時間

# datetime64 可以使用字串來構造
x = np.datetime64('2015-04-01') 
y = np.datetime64('2015-04') 
x.dtype, y.dtype 
# (dtype('<M8[D]'), dtype('<M8[M]'))

# 我們也可以指定最小單位
# 缺失的值會使用 1 來填充
y = np.datetime64('2015-04', 'D') 
y, y.dtype 
# (numpy.datetime64('2015-04-01'), dtype('<M8[D]')) 
# 我們可以使用 arange 來生成日期陣列
x = np.arange('2015-01', '2015-04', dtype = 'datetime64[M]') 
x 
# array(['2015-01', '2015-02', '2015-03'], dtype='datetime64[M]') 

# 但是隻包含日期單位時，不能指定時間單位
y = np.datetime64('2015-04-01', 's') 
# TypeError: Cannot parse "2015-04-01" as unit 's' using casting rule 'same_kind' 

# datetime64 相減會生成 timedelta64
x 
# array(['2015-01', '2015-02', '2015-03'], dtype='datetime64[M]') 
y = np.datetime64('2015-01-01') 
x - y
# array([ 0, 31, 59], dtype='timedelta64[D]') 

# 我們也可以將 datetime64 與 timedelta64 相加
# 這表示 2015 年 1 月 1 日加上 12 個月是 2016 年 1 月 1 日
np.datetime64('2015') + np.timedelta64(12, 'M') 
# numpy.datetime64('2016-01') 
# 或者 timedelta64 之間的運算
# 這表示一週是 7 天
np.timedelta64(1, 'W') / np.timedelta64(1, 'D') 
# 7.0 

x 
# array(['2015-01', '2015-02', '2015-03'], dtype='datetime64[M]') 
# tolist 將 NumPy 陣列轉換成 Python 列表
# 如果陣列是 datetime64 型別
# 每個元素會轉為原生的 datetime.data
x.tolist() 
'''
[datetime.date(2015, 1, 1), 
 datetime.date(2015, 2, 1), 
 datetime.date(2015, 3, 1)] 
'''

# datetime64 的 item 方法會返回等價的 datetime.date 物件
[element.item() for element in x]
'''
[datetime.date(2015, 1, 1), 
 datetime.date(2015, 2, 1), 
 datetime.date(2015, 3, 1)] 
'''

NumPy 檔案 IO


# 首先建立記錄陣列
id = np.arange(1000) 
value = np.random.random(1000) 
day = np.random.random_integers(0, 365, 1000) * np.timedelta64(1,'D') 
date = np.datetime64('2014-01-01') + day 
# np.core.records.fromarrays 從欄位陣列建立記錄陣列
rec_array = np.core.records.fromarrays([id, value, date], names='id, value, date', formats='i4, f4, a10') 
rec_array[:5] 
'''
rec.array([(0, 0.07019801437854767, '2014-07-10'), 
       (1, 0.4863224923610687, '2014-12-03'), 
       (2, 0.9525277614593506, '2014-03-11'), 
       (3, 0.39706873893737793, '2014-01-02'), 
       (4, 0.8536589741706848, '2014-09-14')], 
      dtype=[('id', '<i4'), ('value', '<f4'), ('date', 'S10')]) 
'''

# savetxt 以純文字形式儲存陣列
# 將格式指定為逗號分隔，所以它是 CSV
np.savetxt('./record.csv', rec_array, fmt='%i,%.4f,%s') 

# 我們需要將其讀進來
# 並指定型別和分隔符
# 使用 np.loadtxt 也可以
read_array = np.genfromtxt('./record.csv', dtype='i4,f4,a10', delimiter=',', skip_header=0) 
read_array[:5] 
'''
array([(0, 0.07020000368356705, '2014-07-10'), 
       (1, 0.486299991607666, '2014-12-03'), 
       (2, 0.9524999856948853, '2014-03-11'), 
       (3, 0.3971000015735626, '2014-01-02'), 
       (4, 0.8536999821662903, '2014-09-14')], 
      dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', 'S10')]) 
'''

# 為欄位重新命名
read_array.dtype.names = ('id', 'value', 'date')

# 獲取 value 欄位是否大於 0.75
mask = read_array['value'] >= 0.75 
from numpy.lib.recfunctions import append_fields 
# append_fields 新增新的欄位
# 引數依次是源陣列、新欄位名稱、資料和型別
read_array = append_fields(read_array, 'mask', data=mask, dtypes='i1') 
read_array[:5] 
'''
masked_array(data = [(0, 0.07020000368356705, '2014-07-10', 0) 
 (1, 0.486299991607666, '2014-12-03', 0)
 
 (2, 0.9524999856948853, '2014-03-11', 1) 
 (3, 0.3971000015735626, '2014-01-02', 0) 
dtype = [('id', '<i4'), ('value', '<f4'), ('date', 'S10'), ('mask','i1')]) 
'''

NumPy Essentials 帶註釋原始碼四、NumPy 核心和模組

# 來源：NumPy Essentials ch4 步長 # 步長是每個維度相鄰兩個元素的偏移差值 import numpy as np x = np.arange(8, dtype = np.i

NumPy Essentials 帶註釋原始碼六、NumPy 中的傅立葉分析

# 來源：NumPy Essentials ch6 繪圖函式 import matplotlib.pyplot as plt import numpy as np def show(ori_fun

NumPy Cookbook 帶註釋原始碼五、NumPy 音訊和影象處理

# 來源：NumPy Cookbook 2e Ch5 將影象載入進記憶體 import numpy as np import matplotlib.pyplot as plt # 首先生成一個 5

四、Kafka 核心原始碼剖析

一、Kafka消費者原始碼介紹 1.分割槽消費模式原始碼介紹分割槽消費模式直接由客戶端(任何高階語言編寫)使用Kafka提供的協議向伺服器傳送RPC請求獲取資料，伺服器接受到客戶端的RPC請求後，將資料構造成RPC響應，返回給客戶端，客戶端解析相應的RPC響應獲取資料。Kafka支援的協議眾多，使用

zookeeper原始碼 — 四、session建立

目錄 session建立的主要過程客戶端發起連線服務端建立session session建立的主要過程用一張圖來說明session建立過程中client和server的互動主要流程服務端啟動，客戶端啟動客戶端發起socket連線服務端accept socket連線，socket連線建立

二十四、管道符和作業控制、shell變量、環境變量配置文件

管道符和作業控制 shell變量環境變量配置文件二十四、管道符和作業控制、shell變量、環境變量配置文件一、管道符和作業控制管道符：| 表示把前面文件輸出的內容傳遞給後面的命令。|grep：過濾，指定關鍵詞的命令。|grep ’aaa‘。作業控制Ctrl+z：暫停一個任務

終於有人把雲端計算極速賽車原始碼出售、大資料和人工智慧講明白了！

今天跟大家講講極速賽車原始碼出售QQ2952777280【話仙原始碼論壇】hxforum.com雲端計算、大資料和人工智慧。這三個詞現在非常火，並且它們之間好像互相有關係。一般談雲端計算的時候會提到大資料、談人工智慧的時候會提大資料、談人工智慧的時候會提雲端計算……感覺三者之間相輔相成又不可分割。但如

原始碼包、rpm包和yum包的區別

1.區別原始碼包是開源的，比RPM包安裝更自由，但是它安裝更慢，更容易報錯；RPM包是經過編譯的，不能看到原始碼，但是它安裝更快，報錯更容易解決，只有依賴性問題。 RPM包不需要指定安裝位置，它會安裝到系統預設位置；而原始碼包是人為手工設定的，下面我們就來看看到底位置有

spring容器啟動之我見(四、獲取容器和獲取容器中的bean)

1.我們經常會發現在我們的service中有註解而在dao上沒有註解看圖因為我們在spring容器初始化bean的時候，是把service當做一個bean ，而dao並不是一個bean，這是個人理解，如果有錯誤，歡迎大家指出。 2. 那我們總結一下那些算是spri

[Swift通天遁地]四、網絡和線程-(2)通過BlockOperation實現線程的隊列

resources ati tar 顯示數據存儲 cgrect cnblogs try color 本文將演示線程隊列的使用，使用線程隊列可以依次執行一系列的任務。在項目導航區，打開視圖控制器的代碼文件【ViewController.swift】現在開始編寫代碼，

[Swift通天遁地]四、網絡和線程-(4)使用Alamofire實現網絡請求

value 查看 .com per create 項目文件 warning spa print 本文將演示如何使用第三方庫實現網絡請求服務。首先確保在項目中已經安裝了所需的第三方庫。點擊【Podfile】,查看安裝配置文件。 1 source ‘https:/

Pandas四、Grouping(分組)和Sorting(排序)

讀入要測試的檔案。 import pandas as pd reviews = pd.read_csv("winemag-data-130k-v2.csv", index_col=0) reviews.head() 檢視部分資料： 1、找出資料集中最常見的。統計每個分組中指定列的

[Swift通天遁地]四、網絡和線程-(11)將服務器返回的JSON映射為實例對象

add ide location set 寫代碼 pod 點擊 Language man 本文將演示使用第三方類庫中，將服務器返回的JSON映射為實例對象。首先確保在項目中已經安裝了所需的第三方庫。點擊【Podfile】,查看安裝配置文件。 1 platfor

[Swift通天遁地]四、網絡和線程-(15)程序內購功能

resource war setup 安裝第三方標識符 trie any demo 應該本文將演示使用開源類庫往項目中添加內購功能。內購功能需要在真機上進行測試。內購是蘋果市場上的一種常見的盈利模式。首先確保在項目中已經安裝了所需的第三方庫。點擊【Podfi

原始碼安裝、yum安裝和rpm安裝的區別

1、yum安裝可以看成是從網路線上安裝的一種方式，只需要yum install 軟體名，系統就自動根據yum源配置檔案中的映象位置去下載安裝包了，並可以自動分析所需的軟體依賴關係，自動安裝所需的依賴軟體包。此方式適合初學者，簡單方便，不用考慮依賴關係。但有些軟體並不能通過yu

寫給人類的機器學習四、神經網路和深度學習

四、神經網路和深度學習使用深度學習，我們仍然是習得一個函式f，將輸入X對映為輸出Y，並使測試資料上的損失最小，就像我們之前那樣。回憶一下，在 2.1 節監督學習中，我們的初始“問題陳述”： Y = f(X) + ϵ 訓練：機器從帶標籤的

Storm學習記錄（四、併發機制和通訊機制）

一、併發機制 Worker – 程序：一個Topology拓撲會包含一個或多個Worker（每個Worker程序只能從屬於一個特定的Topology）這些Worker程序會並行跑在叢集中不同的伺服器上，即一個Topology拓撲其實是由並行執行在Storm叢集中多臺伺服器上的程序所組成

Java基礎之IO流（位元組流、字元流、記憶體流、帶快取的流、序列化和反序列化）

File類：File類提供了對檔案的操作，可以通過字串或URI來構建一個File類物件。通過物件，可以實現檔案的建立（createNewFile）、刪除（delete）、獲得檔名（getName）、獲得父目錄物件（getParentFile）、獲得父目錄名稱（

JDBC學習（四、DAO思想和重構設計上）

一、DAO設計思想什麼是DAO:主要就包括CRUD(增刪改查操作) DAO(Data Access Object)是一個數據訪問介面，資料訪問：顧名思義就是與資料庫打交道。夾在業務邏輯與資料庫資源中間。在核心J2EE模式中是這樣介紹DAO模式的：為了建立一個健壯

四、c++定義和宣告設定預設引數

#include<iostream> using namespace std; int f(int a=4,int b=4); int main() { cout<<f(3,3)<<endl; return 0; } int

NumPy Essentials 帶註釋原始碼 四、NumPy 核心和模組

步長

結構化陣列

日期時間

NumPy 檔案 IO

相關推薦

NumPy Essentials 帶註釋原始碼四、NumPy 核心和模組