深度學習原理與TensorFlow實踐1：以分類問題入門Tensorflow

阿新 • • 發佈：2018-12-20

一、問題描述

Titanic問題（具體問題可檢視Kaggle平臺）

根據已有資料預測每位乘客是否倖存。共包含12個欄位（或特徵）。

二、看做分類問題處理解決方案

1. 資料讀入及預處理（pandas、scikit-learn）

*pandas可以讀入各種型別的資料，讀入的資料為DataFrame型別的物件。

首先需要選擇要選取的特徵維資料，如果有大量的特徵維，需要只留下某幾個重要的特徵。常用方法有：

（1）根據閾值過濾掉方差小的變數

（2）通過計算變數與標籤的相關係數，留下相關性高的特徵

（3）根據決策樹或隨機森林，選擇重要程度高的特徵

（4）利用PCA等，對資料進行變換，選擇區分度最高的特徵組合。

import pandas as pd
data = pd.read_csv('train.csv')
data.info() # 類似資料庫中檢視資料概況的操作，從info的顯示情況看，能夠看到資料的缺失值情況。
# 資料的準備、預處理
# 對於原先是數值型的內容，先不做處理，對於原先是物件型（字元型）的內容，進行數值的轉換。
# （1）Sex 將male轉換為0，female轉換為1
data['Sex'] = data['Sex'].apply(lambda s: 1 if s == 'male' else 0)
# （2）Age 缺失部分賦值為0
data = data.fillna(0)
# 實際上，缺失部分的補充要視情況而定，可以有四種情況
"""
（1）丟棄整行資料——樣本資料量足夠
（2）丟棄整列資料——缺失非常嚴重
（3）填充預設值（相當於將全部缺失值作為一類處理）
（4）填充平均值（弱化缺失值的影響）
"""
dataset_X = data[['Sex', 'Age', 'Pclass', 'SibSp', 'Parch', 'Fare' ]]
dataset_X = dataset_X.as_matrix()
# 樣本的y需要轉換為one-hot表示
data['Deceased'] = data['Survived'].apply(lambda s : int (not s))
dataset_Y = data[['Deceased', 'Survived']]
dataset_Y = dataset_Y.as_matrix()
# 隨機打亂資料並按比例拆分，防止過擬合
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(dataset_X, dataset_Y, test_size = 0.2, random_state = 42) # random_state如果選擇相同的值，模型會得到一樣的結果。（是一個隨機的種子數）

2. 構建計算圖及訓練迭代過程

* 用作示例，使用最簡單的邏輯迴歸演算法進行分類。邏輯迴歸之前的博文中有講過，是wx+b的形式，之後進行一個softmax操作（其實就是一個標準化、歸一化的操作） W、b是要學習的引數。

# 用佔位符首先定義好x，y的形狀、儲存資料型別，None表示資料量可變
# 在佔位符中，可以加入name標籤，方便視覺化
# 在定義輸入x的形狀時，第一個維度一般是mini-batch維，從第二維才開始特徵維
x = tf.placeholder(tf.float32, shape = [None, 6])
y = tf.placeholder(tf.float32, shape = [None, 2])

# 使用變數定義引數
W = tf.Variable(tf.random_normal([6,2]), name = 'weights') # 剛開始隨機生成一組向量
b = tf.Variable(tf.zeros([2]), name = 'bias') # 預定義時b設為0

# 前向傳播計算圖
y_pred = tf.nn.softmax(tf.matmul(input, W) + bias)

# 優化目標 —— 此處選用交叉熵
cross_entropy = - tf.reduce_sum(y * tf.log(y_pred + 1e-10), reduction_indices = 1)# reduction _indices表示維度，為1表示最終的結果是一個1維的向量。 同時y_pred加入了一個小的誤差，當非常接近0或1時，避免因為輸出非法，無法計算梯度。
cost = tf.reduce_mean(cross_entropy) # 求所有樣本交叉熵的平均值
"""
誤差處理其實有三種辦法
（1）上例中，問題y_pred會超過1
（2）當y_pred接近0，就賦值為極小誤差值。y_pred始終控制在[10^-10, 1]（使用clip函式）
（3）當出現nan值，就將cost設定為0，不改變y_pred
"""

# 優化演算法（此處使用梯度下降演算法）不同優化演算法在不同問題上有不同的收斂態度，在面向不同的任務需要多嘗試選擇。演算法最大的引數為學習率，不同學習率也有影響。
train_op = tf.train.GradientDescentOptimizer(0.001).minimize(cost)


# 訓練迭代過程（採用session，它能管理上下文各種資源）
with tf.Session() as sess:
    tf.global_variables_initializer().run()
    # 迴圈迭代，迭代10次
    for epoch in range(10):
        total_loss = 0
        for i in range(len(X_train)):
            feed = {X : [X_train[i]], y_true : [y_train[i]]}
            _, loss = sess.run([train_op, cost], feed_dict = feed) # train_op是運算元（操作），cost是tensor，要返回值
            total_loss += loss
        print('Epoch: %04d, total loss = %.9f' % (epoch + 1, total_loss))
    print 'Training complete!'
    # 預測
    pred = sesss.run(y_pred, feed_dict = {X: X_val})
    correct = np.equal(np.argmax(pred, 1), np.argmax(y_val, 1))
    accuracy = np.mean(correct.astype(np.float32))
    print("Accuracy on validation set:%.9f" % accuracy)

3. 儲存和載入模型引數（tf.train.Saver和checkpoint機制）

v1 = tf.Variable(tf.zeros([200]))
saver = tf.train.Saver()  # 若不指定變數列表，saver只會預設處理宣告之前的變數。即v1會被處理，而v2不會。選擇性載入非常有用，可以只加載部分引數資料，例如如果要將圖片分類模型應用於一個不同領域，那麼只需要載入卷積層部分引數，在此基礎上重新訓練全連線層即可。
v2 = tf.Variable(tf.ones([100]))

with tf.Session() as sess1:
    # 模型定義、訓練

    # 變數儲存

save_path = saver.save(sess1, "model.ckpt")
"""
saver.save的儲存會生成四個檔案，
（1）.ckpt檔案 真實儲存變數及其取值
（2）.ckpt.meta 描述檔案
（3）.ckpt.index 村粗變數在checkpoint檔案中的位置縮影
（4）checkpoint，儲存最新存檔的檔案路徑
"""
with tf.Session as sess2:
    # 載入變數
    saver.restore(sess2,"model.ckpt")
    # 預測

# 除這樣一次性儲存模型外，為方便監控迭代情況，可以在迭代中儲存
with tf.Session() as sess:
    for step in range(max_step):
        #執行計算
        saver.save(sess, 'my-mode.ckpt', global_step = step)

"""
為防止上述情況造成的由於迭代次數過多，造成儲存空間耗盡，有幾種解決方式
（1）max_to_keep引數，只保留最後幾個版本
（2）keep_checkpoint_every_n_hours引數，每n個小時儲存一個版本
"""

# 載入checkpoint：
# （1）利用字首，直接載入
# （2）載入最新版本
ckpt = tf.train.get_checkpoint_state(ckpt_dir)
if ckpt and ckpt.model_checkpoint_path:
    saver.restore(sess, ckpt.model_checkpoint_path)

4. 預測

testdata = pd.read_csv('data/test.csv')
testdata = testdata.fillna(0)
testdata['Sex'] = testdata['Sex'].apply(lambda s: 1 if s == 'male')
X_test = testdata[['Sex', 'Age', 'Pclass', 'SibSp', 'Parch', 'Fare']]
with tf.Session() as sess:
    saver.restore(sess, 'model.ckpt')
    predictions = np.argmax(sess.run(y_pred, feed_dict = {X: X_test}))
    submission = pd.DataFrame({"PassengerId": testdata["PassengerId"], "Survived": p    redictions})
    submission.to_csv(titanic-submission.csv", index = false)

深度學習原理與TensorFlow實踐1：以分類問題入門Tensorflow

一、問題描述 Titanic問題（具體問題可檢視Kaggle平臺）根據已有資料預測每位乘客是否倖存。共包含12個欄位（或特徵）。二、看做分類問題處理解決方案 1. 資料讀入及預處理（pandas、scikit-learn） *pandas可以讀入各種型別的資料

分享《深度學習、優化與識別》PDF+《深度學習原理與TensorFlow實踐》PDF

.com log follow image http 51cto 分享 mage orf 下載：https://pan.baidu.com/s/1UNf3PmOtXCBCxx1eUprSzw 更多資料分享：http://blog.51cto.com/3215120 《深度學

分享《深度學習、優化與識別》PDF+《深度學習原理與TensorFlow實踐》PDF+焦李成

water http mage 深度 51cto proc orf ESS pwc 下載：https://pan.baidu.com/s/1xj7GymClcExjn48rPwCowQ 更多資料分享：http://blog.51cto.com/14087171 《深度學習、

Hands-on Machine Learning with Scikit-Learn and TensorFlow（中文版）和深度學習原理與TensorFlow實踐-學習筆記

監督學習：新增標籤。學習的目標是求出輸入與輸出之間的關係函式y=f(x)。樸素貝葉斯、邏輯迴歸和神經網路等都屬於監督學習的方法。監督學習主要解決兩類核心問題，即迴歸和分類。迴歸和分類的區別在於強調一個是連續的，一個是離散的。非監督學習：不新增標籤。學習目標是為了探索樣本資料之間是否

深度學習原理與實踐(開源圖書)-總目錄

深度學習原理與實踐(開源圖書)-總目錄 CSDN專欄: 深度學習原理與實踐(開源圖書) CSDN專欄: 機器學習原理與實踐(開源圖書) 深度學習理論的突破和深度學習硬體加速能力的突破，使AI在模式識別、無人駕駛、智力遊戲領域取得空前的成功。學術界和工業界全力以赴掀起

《深度學習：原理與應用實踐》中文版PDF

應用 href 書籍 nag tex 原理圖片 water images 下載：https://pan.baidu.com/s/1YljEeog_D0_RUHjV6hxGQg 《深度學習：原理與應用實踐》中文版PDF，帶目錄和書簽；經典書籍，講解詳細；如圖：《深度學

分享《深度學習：原理與應用實踐》+PDF+張重生

ofo 51cto 經典 mar src mage 詳細深度學習目錄下載：https://pan.baidu.com/s/1LmlYGbleDhkDAuqoZ2XjAQ更多資料分享：http://blog.51cto.com/14087171 《深度學習：原理與應用實

《TensorFlow：實戰Google深度學習框架》--5.2.1 MNIST手寫識別問題（程式已改進）

目錄 MNIST資料集介紹： TensorFlow完整訓練MNIST資料集（程式已改進）：本篇部落格涉及很多本書第4章的知識：啟用函式、指數衰減的學習率設定、正則化、滑動平均等知識。如有疑問請參考本部落格關於第4章記錄介紹。 MNIST資料集介紹： MNIST資料集是N

【讀書1】【2017】MATLAB與深度學習——單層神經網路的訓練：增量規則(3)

例如，epoch ＝ 10意味著神經網路對相同的資料集經過10次重複的訓練過程。 For instance, epoch = 10 means that theneural network goes through 10 repeated training pr

Redis 深度歷險：核心原理與應用實踐

小冊介紹Redis 是網際網路技術架構在儲存系統中使用最為廣泛的中介軟體，它也是中高階後端工程師

物理學家揭示深度學習原理：神經網路與宇宙本質驚人關聯

　　哈佛大學和 MIT 的物理研究者日前在 arXiv.org 發文，提出深度學習的成功不僅關乎數學，也離不開物理。他們在論文中指出，引數有限的神經網路之所以能夠分析有無數種可能的複雜問題，是因為宇宙中所有事物都能由一組性質簡單的函式表示。此外，宇宙具有層次結構，而神經

20180813視頻筆記深度學習基礎上篇（1）之必備基礎知識點深度學習基礎上篇（2）神經網絡模型視頻筆記：深度學習基礎上篇（3）神經網絡案例實戰和深度學習基礎下篇

計算概念人臉識別大量 png 技巧表現 lex github 深度學習基礎上篇（3）神經網絡案例實戰 https://www.bilibili.com/video/av27935126/?p=1 第一課:開發環境的配置 Anaconda的安裝庫的安裝 Windo

機器學習原理與實踐(開源圖書)-總目錄

機器學習原理與實踐(開源圖書)-總目錄 CSDN專欄: 機器學習原理與實踐(開源圖書) CSDN專欄: 深度學習原理與實踐(開源圖書) 現在我們有了足夠的基礎設施收集資料和處理資料的能力，諸如：物聯網、全球導航系統、網際網路、工業網際網路、電信網路、行動通訊網路、感

美團技術分享：美團深度學習系統的工程實踐

背景深度學習作為AI時代的核心技術，已經被應用於多個場景。在系統設計層面，由於其具有計算密集型的特性，所以與傳統的機器學習演算法在工程實踐過程中存在諸多的不同。本文將介紹美團平臺在應用深度學習技術的過程中，相關係統設計的一些經驗。本文將首先列舉部分深度學習演算法所需的計算量，然後再介紹為滿足這些計算量，

Win10深度學習環境配置（下篇）：TensorFlow + Keras + Matplotlib + OpenCV

好記性不如爛筆頭，純粹為自己的學習生活記錄點什麼！本次接上篇文章Win10深度學習環境配置（上篇），繼續記錄win10下深度學習環境配置過程，下篇記錄安裝TensorFlow+Keras TensorFlow 由於上篇介紹了pip安裝方法，所以win10系

吳恩達神經網路與深度學習——神經網路基礎習題1

python numpy 基礎 1.使用iPython Notebooks 2.使用numpy 函式 and numpy矩陣或向量操作 3.理解"broadcasting" 4.向量化程式碼用numpy建立一個基礎函式 sigmoid 函式 math庫

《TensorFlow實戰Google深度學習框架》——4.2.1 經典損失函式（交叉熵、均方差）

目錄 1、交叉熵 1、交叉熵交叉熵是分類問題中使用比較廣的一種損失函式，刻畫了兩個概率分佈之間的距離。給定兩個概率分佈p和q，通過q來表示p的交叉熵為：交叉熵刻畫的是兩個概率分佈之間的距離，然而神經網路的輸出卻不一定是一個概率分佈。Softmax迴歸就

【深度學習】Ubuntu 常用軟體安裝：Tensorflow + TeamViewer + Caffe + ... + Matlab

【UpdateTime：20180212】（原文由於寫了幾個敏感詞彙，被強制刪除了，特此重新整理一篇） 2017.05.25：根據實踐過程，整理了第一版。 2017.12.22：由於第一版涉及幾個敏感詞彙，博文被強制移到回收站，重新整理一篇。 2018.01.05：

機器學習演算法原理與程式設計實踐程式碼下載地址

@rover這個是C++模板 --胡滿超 stack<Postion> path__;這個裡面 ”<> “符號是什麼意思？我在C++語言裡面沒見過呢？初學者，大神勿噴。

深度學習原理與TensorFlow實踐1：以分類問題入門Tensorflow

相關推薦