TensorFlow入門教程：17：正態噪聲下的線性迴歸

阿新 • • 發佈：2018-12-13

在這裡插入圖片描述這篇文章來看一下，使用加入正態分佈的噪聲之後產生的資料進行訓練，看是否能夠得到期待的結果。

事前準備

訓練資料使用如下方式生成：

xdata = np.linspace(0,1,100)
ydata = 2 * xdata + 1 + np.random.normal(20,6,xdata.shape)*0.2

示例程式碼

liumiaocn:tensorflow liumiao$ cat basic-operation-13.py 
import tensorflow as tf
import numpy      as np
import os
import matplotlib.pyplot as plt

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

xdata = np.linspace(0,1,100)
ydata = 2 * xdata + 1 + np.random.normal(20,6,xdata.shape)*0.2

print("init modole ...")
X = tf.placeholder("float",name="X")
Y = tf.placeholder("float",name="Y")
W = tf.Variable(-3., name="W")
B = tf.Variable(3., name="B")
linearmodel = tf.add(tf.multiply(X,W),B)
lossfunc = (tf.pow(Y - linearmodel, 2))
learningrate = 0.01

print("set Optimizer")
trainoperation = tf.train.GradientDescentOptimizer(learningrate).minimize(lossfunc)

sess = tf.Session()
init = tf.global_variables_initializer()
sess.run(init)

index = 1
print("caculation begins ...")
for j in range(100):
  for i in range(100):
    sess.run(trainoperation, feed_dict={X: xdata[i], Y:ydata[i]})
  if j % 10 == 0:
    print("j = %s index = %s" %(j,index))
    plt.subplot(2,5,index) 
    plt.scatter(xdata,ydata)
    labelinfo="iteration: " + str(j)
    plt.plot(xdata,B.eval(session=sess)+W.eval(session=sess)*xdata,'b',label=labelinfo)
    plt.plot(xdata,2*xdata + 1,'r',label='expected')
    plt.legend() 
    index = index + 1

print("caculation ends ...")
print("##After Caculation: ") 
print("   B: " + str(B.eval(session=sess)) + ", W : " + str(W.eval(session=sess)))

plt.show()
liumiaocn:tensorflow liumiao$

結果確認

在這裡插入圖片描述 100次迭代之後的，線性模型如下：

##After Caculation: 
   B: 1.46369, W : 2.0256715

沒有噪聲的學習過程, 收斂的如下：在這裡插入圖片描述

調整引數

可以看到噪聲新增之後，資料產生了一個較大的偏移量，將引數進行調整

ydata = 2 * xdata + 1 + np.random.normal(20,6,xdata.shape)*0.02

在這裡插入圖片描述

可以看到資料的分佈範圍已經較好的收窄，但是偏差仍然存在：

##After Caculation: 
   B: 1.4173651, W : 1.9516094

可以直接糾偏，線性的只需要減一個常數即可，但是這個糾偏值的算出，可以有很多的方式，這裡可以使用最簡單的方式，比如使用均值的差

糾偏： baisadjust=np.mean(ydata) - np.mean(B.eval(session=sess)+W.eval(session=sess)*xdata)

程式碼示例

liumiaocn:tensorflow liumiao$ cat basic-operation-13.py 
import tensorflow as tf
import numpy      as np
import os
import matplotlib.pyplot as plt

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

xdata = np.linspace(0,1,100)
ydata = 2 * xdata + 1 + np.random.normal(20,6,xdata.shape)*0.02

print("init modole ...")
X = tf.placeholder("float",name="X")
Y = tf.placeholder("float",name="Y")
W = tf.Variable(-3., name="W")
B = tf.Variable(3., name="B")
linearmodel = tf.add(tf.multiply(X,W),B)
lossfunc = (tf.pow(Y - linearmodel, 2))
learningrate = 0.01

print("set Optimizer")
trainoperation = tf.train.GradientDescentOptimizer(learningrate).minimize(lossfunc)

sess = tf.Session()
init = tf.global_variables_initializer()
sess.run(init)

index = 1
print("caculation begins ...")
for j in range(100):
  for i in range(100):
    sess.run(trainoperation, feed_dict={X: xdata[i], Y:ydata[i]})
  if j % 10 == 0:
    print("j = %s index = %s" %(j,index))
    plt.subplot(2,5,index) 
    plt.scatter(xdata,ydata)
    labelinfo="iteration: " + str(j)
    plt.plot(xdata,B.eval(session=sess)+W.eval(session=sess)*xdata,'b',label=labelinfo)
    plt.plot(xdata,2*xdata + 1,'r',label='expected')
    baisadjust=np.mean(ydata) - np.mean(B.eval(session=sess)+W.eval(session=sess)*xdata)
    plt.plot(xdata,2*xdata + 1 + baisadjust, 'y', label='adjusted')
    plt.legend() 
    index = index + 1

print("caculation ends ...")
print("##After Caculation: ") 
print("   B: " + str(B.eval(session=sess)) + ", W : " + str(W.eval(session=sess)))

plt.show()
liumiaocn:tensorflow liumiao$

簡單地糾偏之後，結果如下所示：在這裡插入圖片描述

總結

這篇文章引入了另外一個概念，資料的糾偏，有噪聲，自然就有去噪的方式，也可以稱為糾偏。仔細思考之後會發現，如何獲取噪聲資料和實際期待資料之間的差值往往是實際場景中最為重要的，這篇文章引入這個概念的目的在於說明學習的過程中結果對資料的完全擬合併不一定是最好的，那個前提是資料本身就是完美資料的情況。

TensorFlow入門教程：17：正態噪聲下的線性迴歸

這篇文章來看一下，使用加入正態分佈的噪聲之後產生的資料進行訓練，看是否能夠得到期待的結果。事前準備訓練資料使用如下方式生成： xdata = np.linspace(0,1,100) ydata = 2 * xdata + 1 + np.random.no

TensorFlow入門教程：4：視覺化tensorboard

Tensorboard在pip中顯示的概要資訊是”lets you watch Tensors Flow“，watch tensors的flow就是Tensorboard所要做的視覺化的主要功能。一般用於確認tensorflow模型訓練過程的視覺化。概要資訊

TensorFlow入門教程：8：訓練資料之Iris資料集

Irises，聞名於世的不只是梵高那副價值超過5000萬美元的鳶尾花，同時還有Iris資料集。 Iris資料集由英國統計學家/生物學家Ronald Fisher在1936年所收集，共包含150條資料，

TensorFlow入門教程：11：線性迴歸

相較於前面的基礎，這篇文章才是真正意義上的第一個tensorflow的Hello World。我們將使用tensorflow提供的方法來對資料中所體現的線性關係進行建模，通過輸入資料對模型進行訓練，然後使用訓練生成的穩定模型對未知的自變數所對應的因變數進行確認

TensorFlow入門教程：12：訓練結果的視覺化分析

上篇文章模擬了線性迴歸下的訓練的過程，並演示了訓練後的線性模型對資料的適應程度，同時使用視覺化的方式看到了結果的顯示，在學習的過程中，合理利用諸如matplotlib等庫函式，可以非常有效地對結果進行

TensorFlow入門教程：13：訓練過程的視覺化分析

活用視覺化的結果，使用真正的人類智慧，可以一目瞭然的瞭解的演算法過程中的大致過程，這就是視覺化可以帶來的結果，在機器學習結果的展示上，能畫出來的就儘量不要以數字的形式print出來，這篇文章繼續分析y=3*x + 1的收斂過程，這裡我們來使用圖形化的方式來體驗

TensorFlow入門教程：18：Iris資料集的線性迴歸訓練

這篇文章使用實際的統計資料來確認對線性迴歸的曲線擬合的效果，Iris資料集中花瓣的長度和寬度之間的關係滿足明顯的線性關係，這裡我們將使用前文多次使用的方式來對Iris資料進行分析。 Iris資料集四

【ML學習筆記】17：多元正態分佈下極大似然估計最小錯誤率貝葉斯決策

簡述多元正態分佈下的最小錯誤率貝葉斯如果特徵的值向量服從d元正態分佈，即其概率密度函式為：即其分佈可以由均值向量和對稱的協方差矩陣唯一確定。如果認為樣本的特徵向量在類內服從多元正態分佈：即對於每個類i，具有各自的類內的均值向量和協

Angular 4入門教程系列：17：NG-ZORRO：Layout

這篇文章介紹一下如何使用NG-ZORRO的layout相關的元件。 layout 概述元件說明限制 [nz-layout] nz-layout佈局容器

【tensorflow入門教程二】資料集製作：使用TFRecords製作資料集並使用inceptionv3進行訓練

這篇文章中，我們將探討深度學習中最基本的問題，影象分類中的資料集以及標籤的製作；以及使用Inceptionv3網路對其進行訓練。PS：文末附博文配套程式碼以及資料集原圖的下載。先上一張最後的訓練結果圖：17flowers資料集17flowers資料集包含有17種不同的花的圖片

CodeIgniter 入門教程第一篇：信息發布

per 所有控制知識點 image doc ref har 提交一、MVC CodeIgniter 采用MVC架構即：控制層、模型層和視圖層。對應Application下面的文件夾（圖1）：所有新建文件以.php結尾視圖層

MongoDB最簡單的入門教程之四：使用Spring Boot操作MongoDB

Spring Boot 是一個輕量級框架，可以完成基於 Spring 的應用程式的大部分配置工作。Spring Boot的目的是提供一組工具，以便快速構建容易配置的Spring應用程式,省去大量傳統Spring專案的繁瑣配置。 MongoDB是一個基於分散式檔

python 3.7極速入門教程1安裝：Linux(Ubuntu 18.04)及Windows上安裝Anaconda

安裝 Linux安裝 Anaconda是最受歡迎的python資料科學和機器學習平臺，用於大規模資料處理，預測分析和科學計算。Anaconda發行版附帶了1,000多個數據包，conda命令列工具和Anaconda Navigator的桌面圖形使用者介面。一般而言，使用Anaconda比直接

C++生成隨機數：高斯/正態分佈（gaussian/normal distribution）

常用的成熟的生成高斯分佈隨機數序列的方法由Marsaglia和Bray在1964年提出，C++版本如下： #include <stdlib.h> #include <math.h> double gaussrand() { static double V1, V2, S

RabbitMQ入門教程(十五)：普通叢集和映象叢集

普通叢集推薦一篇優秀的文章：映象叢集映象叢集的特點：所有節點的訊息都會進行同步。RabbitMQ是沒有中心的。 Rabbit映象功能，需要基於rabbitmq策略來實現，政策是用來控制和修改群集範圍的某個vhost佇列行為和Exchan

DirectX11入門教程——第二篇：DirectX11的基礎知識

本系列系作者原創，可隨便轉發但一定要註明出處剛才明明說盡量不跳章的，為啥一進來就變成第二章，這裡首先用幾句話說明一下原因：因為第一章我想留給更基礎更概念的GPU發展史和管線描述。在此對不起大家了。不過我保證這個系列初步成型後絕對不跳章 2010年5月微軟釋出了Direct

【QT】QT從零入門教程(十一)：QT自定義視窗

首先是借鑑了網上的部落格，實現無邊框，自由拖動的自定義視窗效果。 #ifndef CUSTOMWINDOW_H #define CUSTOMWINDOW_H #include <QtGui> #include <QtWidg

RabbitMQ入門教程(十四)：RabbitMQ單機叢集搭建

叢集簡介理解叢集先理解一下元資料佇列元資料：佇列的名稱和宣告佇列時設定的屬性(是否持久化、是否自動刪除、佇列所屬的節點) 交換機元資料：交換機的名稱、型別、屬性(是否持久化等) 繫結元資料：一張簡單的表格展示瞭如何將訊息路由到佇列。包含的列有交換機名

RabbitMQ入門教程(十一)：訊息屬性Properties

簡介傳送訊息可以為訊息指定一些引數 Delivery mode: 是否持久化，1 - Non-persistent，2 - Persistent Headers：Headers can have

Maya零基礎新手入門教程第一部分：介面

第1步：選單如果您曾經使用過一個軟體，那麼您將習慣選單！在Maya中，選單包含用於在場景中工作的工具和操作。與大多數程式一樣，主選單位於Maya視窗的頂部，然後還有面板和選項視窗的單獨選單。您還可以使用熱盒訪問主選單中包含的選單。通過按住視圖面板中的空格鍵開啟它。選單設定很可能對

TensorFlow入門教程：17：正態噪聲下的線性迴歸

事前準備

示例程式碼

結果確認

調整引數

程式碼示例

總結

相關推薦