你真的懂TensorFlow嗎？Tensor是神馬？為什麼還會Flow?

阿新 • • 發佈：2018-12-29

本文的ipynb 格式見CSDN下載。

0維張量/標量
標量是一個數字
1維張量/向量
1維張量稱為“向量”。
2維張量
2維張量稱為矩陣
3維張量
公用資料儲存在張量
時間序列資料
股價
文字資料
圖片
彩色圖片
5D張量
結論

實際上，你可以使用一個數字的張量，我們稱為0維張量，也就是一個只有0維的張量。
它僅僅只是帶有一個數字的水桶。想象水桶裡只有一滴水，那就是一個0維張量。

import numpy as 
 np
x = np.array(5)
print(x)

1維張量/向量,1維張量稱為“向量”

x = np.array([1,2,3,4])
print(x)

#通過NumPy’s ndim函式，檢視張量具有多個座標軸。
x.ndim

2維張量

x = np.array([[5,10,15,30,25],[20,30,65,70,90],[7,80,95,20,30]])
print(x)
x.ndim

3維張量

一個3維張量是一個數字構成的立方體


y = np.array([[[5,10,15,30,25],
               [20,30,65,70,90],
               [7,80,95,20,30]] 
,
               [[3,0,5,0,45],
               [12,-2,6,7,90],
               [34,3436,4364,3434,566]],
               [[17,13,25,30,15],
               [23,36,9,7,80],
               [1,-7,-5,22,3]]])
print(y)
y.ndim

3維=時間序列

4維=影象

5維=視訊

一個影象可以用三個欄位表示：

(width, height, color_depth) = 3D
(sample_size, width, height, color_depth) = 4 
D

時間序列資料

用3D張量來模擬時間序列會非常有效！

醫學掃描——我們可以將腦電波（EEG）訊號編碼成3D張量，因為它可以由這三個引數來描述：

(time, frequency, channel)

這種轉化看起來就像這樣：
如果我們有多個病人的腦電波掃描圖，那就形成了一個4D張量：

 (sample_size, time, frequency, channel)

紐交所開市時間從早上9:30到下午4:00，即6.5個小時，總共有6.5 x 60 = 390分鐘。
如此，我們可以將每分鐘內最高、最低和最終的股價存入一個2D張量（390,3）。如果我們追蹤一週（五天）的交易，我們將得到這麼一個3D張量：

(week_of_data, minutes, high_low_price)

即：(5,390,3)
同理，如果我們觀測10只不同的股票，觀測一週，我們將得到一個4D張量
(10,5,390,3)
假設我們在觀測一個由25只股票組成的共同基金，其中的每隻股票由我們的4D張量來表示。那麼，這個共同基金可以有一個5D張量來表示：
(25,10,5,390,3)

文字資料

我們也可以用3D張量來儲存文字資料，我們來看看推特的例子。

首先，推特有140個字的限制。其次，推特使用UTF-8編碼標準，這種編碼標準能表示百萬種字元，
但實際上我們只對前128個字元感興趣，因為他們與ASCII碼相同。所以，一篇推特文可以包裝成一個2D向量：
（140,128）
如果我們下載了一百萬篇川普哥的推文（印象中他一週就能推這麼多），我們就會用3D張量來存：

(number_of_tweets_captured, tweet, character)

這意味著，我們的川普推文集合看起來會是這樣：
(1000000,140,128)

圖片

4D張量很適合用來存諸如JPEG這樣的圖片檔案。之前我們提到過，一張圖片有三個引數：高度、寬度和顏色深度。
一張圖片是3D張量，一個圖片集則是4D，第四維是樣本大小。

MNIST圖片是黑白的，這意味著它們可以用2D張量來編碼，但我們習慣於將所有的圖片用3D張量來編碼，多出來的第三個維度代表了圖片的顏色深度。
MNIST資料集有60,000張圖片，它們都是28 x 28畫素，它們的顏色深度為1，即只有灰度。
TensorFlow這樣儲存圖片資料：

(sample_size, height, width, color_depth)

於是我們可以認為，MNIST資料集的4D張量是這樣的：
(60000,28,28,1)

彩色圖片

彩色圖片有不同的顏色深度，這取決於它們的色彩（注：跟解析度沒有關係）編碼。
一張典型的JPG圖片使用RGB編碼，於是它的顏色深度為3，分別代表紅、綠、藍。
這是一張我美麗無邊的貓咪（Dove）的照片，750 x750畫素，這意味著我們能用一個3D張量來表示它：
(750,750,3)

然後，如果我們有一大堆不同型別的貓咪圖片（雖然都沒有Dove美），
也許是100,000張吧，不是DOVE它的，750 x750畫素的。我們可以在Keras中用4D張量來這樣定義：
(10000,750,750,3)

5D張量

5D張量可以用來儲存視訊資料。TensorFlow中，視訊資料將如此編碼：

（sample_size, frames, width, height, color_depth)

如果我們考察一段5分鐘（300秒），1080pHD（1920 x 1080畫素），每秒15幀（總共4500幀），顏色深度為3的視訊，我們可以用4D張量來儲存它：
(4500,1920,1080,3)
當我們有多段視訊的時候，張量中的第五個維度將被使用。如果我們有10段這樣的視訊，我們將得到一個5D張量：
(10,4500,1920,1080,3)

這個5D張量中值的數量為：
10 x 4500 x 1920 x 1080 x 3 = 279,936,000,000
在Keras中，我們可以用一個叫dype的資料型別來儲存32bits或64bits的浮點數
我們5D張量中的每一個值都將用32 bit來儲存，現在，我們以TB為單位來進行轉換：
279,936,000,000 x 32 = 8,957,952,000,000bit = 1.119744T

參考文獻

你真的懂TensorFlow嗎？Tensor是神馬？為什麼還會Flow?

1維張量/向量,1維張量稱為“向量”

2維張量

3維張量

一個3維張量是一個數字構成的立方體

3維=時間序列

4維=影象

5維=視訊

一個影象可以用三個欄位表示：

時間序列資料

用3D張量來模擬時間序列會非常有效！

文字資料

圖片

彩色圖片

5D張量

5D張量可以用來儲存視訊資料。TensorFlow中，視訊資料將如此編碼：

你真的懂TensorFlow嗎？Tensor是神馬？為什麼還會Flow?

【Tensorflow】你真的懂TensorFlow嗎？Tensor是神馬？為什麼還會Flow？

大學生求職難，關卡在哪？你真正懂了嗎？

你真的懂JAVA嗎

你真的懂vlan嗎？要不進來試試？

分散式事務中的一致性和隔離性你真的懂了嗎

[轉帖]USB-C和Thunderbolt 3連線線你搞懂了嗎？---沒搞明白.

你真的懂隨機嗎——shuffle一個簡單實用的隨機演算法

#乾貨文：java多執行緒高階教程，這些你都懂了嗎？

【模型解讀】GoogLeNet中的inception結構，你看懂了嗎

對於社交化媒體營銷，你真的懂它嗎？

架構風格：你真的懂REST嗎？

校園網路安全CTF 第一題和你真瞭解我嗎？

只有懂這種程式語言人才能看懂這個笑話，你看懂了嗎？

什麼是I/O，你真的懂了嗎？

Tensor是神馬？為什麼還會Flow?

簡單的交叉熵損失函式，你真的懂了嗎？

【演算法】KMP經典演算法，你真的懂了嗎？

Markdown 你真的懂了嗎

函式宣告方式你真的懂函式嗎

你真的懂TensorFlow嗎？Tensor是神馬？為什麼還會Flow?

1維張量/向量,1維張量稱為“向量”

2維張量

3維張量

一個3維張量是一個數字構成的立方體

3維=時間序列

4維=影象

5維=視訊

一個影象可以用三個欄位表示：

時間序列資料

用3D張量來模擬時間序列會非常有效！

文字資料

圖片

彩色圖片

5D張量

5D張量可以用來儲存視訊資料。TensorFlow中，視訊資料將如此編碼：

相關推薦