【我的TensorFlow之路·3】迴歸度量與糖尿病預測

阿新 • • 發佈：2019-01-01

1 迴歸度量

繼房價預測後，匯入糖尿病資料集diabetes進行迴歸預測。這次觀察的超引數除了stddev和lr外還觀察了隱藏層神經元個數的影響，並應魏聰明的要求加入了公式化的評價指標，主要使用sklearn.metrics庫裡的迴歸度量函式。sklearn.metrics裡共有5個迴歸度量函式，以下為各個迴歸度量的維基百科解釋和sklearn中英文官方文件截圖：

1.1 解釋方差分數（explained_variance_score）

1.2 平均絕對誤差（mean_absolute_error）

1.3 均方誤差（mean_squared_error）

1.4 中間絕對誤差（median_absolute_error）

1.5 $R^{2}$ 係數

2 糖尿病預測

仍然使用sklearn裡自帶的資料集，訓練diabetes這個資料集的目標是預測一年後患糖尿病的可能性。資料集如下（共10個特徵，442條資料）：

程式碼如下：

# -*- coding: utf-8 -*-
"""
Created on Wed Aug 29 16:40:57 2018

@author: Zheng
"""
#這次要對神經元個數進行觀察，繼續觀察stddev和lr，同時加入公式化評價指標
import tensorflow as tf
from sklearn.datasets import load_diabetes
import matplotlib.pyplot as plt
from sklearn import metrics
from sklearn.preprocessing import MinMaxScaler

#diabetes=load_diabetes()

w1 = tf.Variable(tf.random_normal(shape=[10,2],stddev=0.1,dtype=tf.float64))
b1 = tf.Variable(tf.constant(value=0.0,shape=[2,],dtype=tf.float64))
w2 = tf.Variable(tf.random_normal(shape=[2,1],stddev=0.1,dtype=tf.float64))
b2 = tf.Variable(tf.constant(value=0.0,shape=[1,],dtype=tf.float64))

def inference(X):
    a = tf.nn.relu(tf.matmul(X,w1)+b1)
    return tf.matmul(a,w2)+b2

def loss(X,Y):
    Y_predict = inference(X)
    total_loss = tf.reduce_mean(tf.squared_difference(Y,Y_predict))
    return Y_predict,total_loss

def inputs():
    diabetes = load_diabetes()
    MinMax = MinMaxScaler()
    X = MinMax.fit_transform(diabetes.data)
    target = diabetes.target.reshape(-1,1)
    Y = MinMax.fit_transform(target)
    return X,Y

def train(total_loss):
    lr = 0.1
    return tf.train.GradientDescentOptimizer(lr).minimize(total_loss)
    
def evaluate(Y,Y_p):
    print("解釋方差分數：",metrics.explained_variance_score(Y,Y_p))
    print("平均絕對誤差：",metrics.mean_absolute_error(Y,Y_p))
    print("均方誤差：",metrics.mean_squared_error(Y,Y_p))
    print("中間絕對誤差：",metrics.median_absolute_error(Y,Y_p))
    print("R2分數：",metrics.r2_score(Y,Y_p))
    
def plot_fun(Y,Y_p):
    plt.figure()
    plt.plot(Y,'bo',alpha=0.5)
    plt.plot(Y_p,'ro',alpha=0.5)
    plt.ylabel('progression')
    plt.show()
    
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    X,Y = inputs()
    Y_predict,total_loss = loss(X,Y)
    train_op = train(total_loss)
    
    training_steps = 1000
    for i in range(training_steps):
        sess.run(train_op)
        if i % 10 == 0:
            print("loss:",sess.run(total_loss))
            
    Y_p = sess.run(Y_predict)
    plot_fun(Y,Y_p)
    evaluate(Y,Y_p)
    
    sess.close()

資料集原分佈如下：

實驗結果如下：

（1）隱藏層神經元個數為2：

①stddev=0.1，lr=0.1

②stddev=0.1，lr=0.01

③stddev=0.01，lr=0.1

④stddev=0.01，lr=0.01

（2）隱藏層神經元個數為3：

①stddev=0.1，lr=0.1

②stddev=0.01，lr=0.1

（3）隱藏層神經元個數為4：

①stddev=0.1，lr=0.1

②stddev=0.01，lr=0.1

（4）隱藏層神經元個數為5：

①stddev=0.1，lr=0.1

②stddev=0.01，lr=0.1

大概資料量太小了，所以發現隱藏層神經元個數對網路效能影響不大[手動捂臉]，煞費苦心的跑了這麼多次，還一張一張截圖，真是$%#%$#

[email protected]……，但是另外兩個超引數stddev為0.1或0.01，lr為0.1時效果最好。

【我的TensorFlow之路·3】迴歸度量與糖尿病預測

1 迴歸度量繼房價預測後，匯入糖尿病資料集diabetes進行迴歸預測。這次觀察的超引數除了stddev和lr外還觀察了隱藏層神經元個數的影響，並應魏聰明的要求加入了公式化的評價指標，主要使用sklearn.metrics庫裡的迴歸度量函式。sklear

【我的TensorFlow之路·4】關於CNN的一些細節問題

看CNN相關的東西也有一段時間了，但總是感覺深入不進去，這次又讀《面向機器智慧的TensorFlow實踐》這本書，補充了一些知識漏洞，以前不太注意的，或者直接拿來用的一些東西，現在有了更深入的瞭解。 1.步長設定步長是一種調整輸入張量維度

【Java學習之路---1】List的ArrayList和LinkedList的KTV點歌系統修改

本程式碼是參考書籍敲出，加入了部分自己的東西讓程式完善一些，謝謝！！！ KTVArrayList程式碼： 1 import java.util.Scanner; 2 import java.util.ArrayList; 3 4 public class KTVByArrayList {

【Nginx】學習之路3 Centos安裝與配置

author：咔咔 wechat：fangkangfk CentOS7安裝詳解本文基於vmware workstations進行CentOS7安裝過程展示，關於vmware workstations安裝配置本人這裡不再介紹，基本過程相當於windows下安裝個軟體

【架構師之路】集群/分布式環境下5種session處理策略

復制協調部分 ont 描述分析 bsp 優化 vol 轉自：http://www.cnblogs.com/jhli/p/6557929.html 在搭建完集群環境後，不得不考慮的一個問題就是用戶訪問產生的session如何處理。如果不做任何處理的話，用戶將出現頻繁

【Vue實戰之路】一、Vue-cli全面詳解及進階操作。

image 腳本 js基礎這一命令執行 bsp row 編譯服務器全面的Vue-cli學習，這一篇就夠了！一、下載使用vue-cli前，需先安裝node.js,node的安裝就不贅述，不過在此需要註意： 1. node版本需在4.x以上，首推6.x以上版本

【C#學習之路】001.基本操作

arp main cti 字符 thread 程序 AI 報錯 float 001【HelloWorld】分析代碼塊 //這裏是註釋下面是引入命名空間 using System; using System.Collections.Generic; using Syst

【cisco探索之路】

接口子接口 font ctrl+z 探索 nat轉發 work 命令 psu 查看和維護（show&debug） show show version:顯示版本信息show running-config:顯示當前的配置show interfaces :顯示接口的

【python3的學習之路二】數據類型和變量

添加變量之路 get 學習如果地板 www ins 整數 python可以處理任意大小的整數（包括負整數），如100，0，-8080等。浮點數浮點數也就是小數，如1.23，-9.01等。但對於很大或很小的浮點數，就必須用科學計數法表示，把10用e代

【python3的學習之路三】字符串和編碼

而且亂碼 \n spa 結果雙引號 gb2312 span 大小寫字符串編碼由於計算機是美國人發明的，因此，最早只有127個字符被編碼到計算機裏，也就是大小寫英文字母、數字和一些符號，這個編碼表被稱為ASCII編碼，比如大寫字母A的編碼是65，小寫字母z

【python3的進階之路二】因特網客戶端編程

網絡流 message world! 3.6 login 三元組移除元組類對象一、文件傳輸 1.1 文件傳輸因特網協議最流行的協議包括文件傳輸協議(FTP)、UNIX到UNIX復制協議(UUCP)、用於Web的超文本傳輸協議(HTTP)。另外，還有(U

【itext學習之路】-------（第五篇）對pdf進行蓋章/簽章/數字簽名

在上一篇文章中，我們學習了使用itext對pdf增加圖片水印和文字水印，那麼這篇文章我們將要學習更高階一點的水印—-印章。可能你會有疑問，印章不也是一個圖片嗎？當然，你可以把一個印章圖片來做成圖片水印，但是我們這裡要介紹的是，通過數字簽名的方式來進行pdf簽章。

【itext學習之路】-------（第四篇）給pdf增加文字水印和圖片水印

一般而言，許多公司在做pdf之後，都會將公司的logo或者網址以水印的方式新增到pdf檔案中。本篇文章，我們將介紹在製作pdf的時候，如何將水印加入到pdf中去。 package cn.tomtocc.pdf; import java.io.FileNotFoundE

【itext學習之路】-------（第三篇）對pdf文件進行加密和許可權設定

上篇文章，我們學習了pdf的屬性設定，但是我們知道，在實際開發中，如果pdf文件被黑客盜取的話，那麼pdf中的資訊就會被洩露，因此本篇文章將會介紹pdf的加密設定，並且設定許可權。首先我們要說明的是，itext中對pdf文件的加密包括兩部分，第一部分是使用者密

【itext學習之路】-------（第二篇）設定pdf的一些常用屬性

在上一篇文章中，我們已經成功的建立了一個簡單的pdf，下面我將學習設定該pdf的常用屬性，其中包括：作者，建立時間，pdf建立者，pdf生產者，關鍵字，標題，主題下面是我們的程式碼，非常簡單。 package cn.tomtocc.pdf; imp

【itext學習之路】-------（第一篇）建立一個簡單的pdf文件

iText是著名的開放原始碼的站點sourceforge一個專案，是用於生成PDF文件的一個java類庫。通過iText不僅可以生成PDF或rtf的文件，而且可以將XML、Html檔案轉化為PDF檔案本教程中，首先要說明的是，itext技術在網上很少能有一個相對全面文

【Kaggle-MNIST之路】CNN結構再改進+交叉熵損失函式（六）

簡述這裡再添加了一個卷積層。用一個kernal=4的卷積層做一個卷積之後，再做對映。基於之前的一個版本【Kaggle-MNIST之路】CNN結構改進+改進過的損失函式（五）成績：0.9898 排名：1000+ 程式碼注意

【Kaggle-MNIST之路】CNN再新增一個層卷積（八）

簡述基於之前的框架【Kaggle-MNIST之路】自定義程式結構（七）得分：0.9914 排名：900+ 程式碼 CNN.py 檔案內容 import torch.nn as nn import torch class

【Kaggle-MNIST之路】自定義程式結構（七）

簡述這一篇跟這個系列的其他文章不一樣，這個是重新安排下程式結構結構如下：其中model這個模型專門放模型就好了 model/init.py中不用寫就好了。 model/CNN.py中的內容模型是基於之前的【Kaggle-MNIS

【我的TensorFlow之路·3】迴歸度量與糖尿病預測

1 迴歸度量

1.1 解釋方差分數（explained_variance_score）

1.2 平均絕對誤差（mean_absolute_error）

1.3 均方誤差（mean_squared_error）

1.4 中間絕對誤差（median_absolute_error）

1.5 係數

2 糖尿病預測

仍然使用sklearn裡自帶的資料集，訓練diabetes這個資料集的目標是預測一年後患糖尿病的可能性。資料集如下（共10個特徵，442條資料）：

程式碼如下：

資料集原分佈如下：

實驗結果如下：

（1）隱藏層神經元個數為2：

①stddev=0.1，lr=0.1

②stddev=0.1，lr=0.01

③stddev=0.01，lr=0.1

④stddev=0.01，lr=0.01

（2）隱藏層神經元個數為3：

①stddev=0.1，lr=0.1

②stddev=0.01，lr=0.1

（3）隱藏層神經元個數為4：

①stddev=0.1，lr=0.1

②stddev=0.01，lr=0.1

（4）隱藏層神經元個數為5：

①stddev=0.1，lr=0.1

②stddev=0.01，lr=0.1

大概資料量太小了，所以發現隱藏層神經元個數對網路效能影響不大[手動捂臉]，煞費苦心的跑了這麼多次，還一張一張截圖，真是$%#%$# [email protected]……，但是另外兩個超引數stddev為0.1或0.01，lr為0.1時效果最好。

相關推薦

1.5 $R^{2}$ 係數

大概資料量太小了，所以發現隱藏層神經元個數對網路效能影響不大[手動捂臉]，煞費苦心的跑了這麼多次，還一張一張截圖，真是$%#%$#

[email protected]……，但是另外兩個超引數stddev為0.1或0.01，lr為0.1時效果最好。