例子:tensorflow實現神經網路
add_layer 功能
首先,我們匯入本次所需的模組。
import tensorflow as tf
import numpy as np
構造新增一個神經層的函式
def add_layer(inputs, in_size, out_size, activation_function=None): Weights = tf.Variable(tf.random_normal([in_size, out_size])) biases = tf.Variable(tf.zeros([1, out_size]) + 0.1) Wx_plus_b = tf.matmul(inputs, Weights) + biases if activation_function is None: outputs = Wx_plus_b else: outputs = activation_function(Wx_plus_b) return outputs
匯入資料
構建所需的資料。 這裡的x_data和y_data並不是嚴格的一元二次函式的關係,因為我們多加了一個noise,這樣看起來會更像真實情況。
x_data = np.linspace(-1,1,300, dtype=np.float32)[:, np.newaxis]
noise = np.random.normal(0, 0.05, x_data.shape).astype(np.float32)
y_data = np.square(x_data) - 0.5 + noise
利用佔位符定義我們所需的神經網路的輸入。 tf.placeholder()就是代表佔位符,這裡的None代表無論輸入有多少都可以,因為輸入只有一個特徵,所以這裡是1。
xs = tf.placeholder(tf.float32, [None, 1])
ys = tf.placeholder(tf.float32, [None, 1])
搭建網路
接下來,我們就可以開始定義神經層了。 通常神經層都包括輸入層、隱藏層和輸出層。這裡的輸入層只有一個屬性, 所以我們就只有一個輸入;隱藏層我們可以自己假設,這裡我們假設隱藏層有10個神經元; 輸出層和輸入層的結構是一樣的,所以我們的輸出層也是隻有一層。 所以,我們構建的是——輸入層1個、隱藏層10個、輸出層1個的神經網路。
下面,我們開始定義隱藏層,利用之前的add_layer()函式,這裡使用 Tensorflow 自帶的激勵函式tf.nn.relu。
l1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu)
接著,定義輸出層。此時的輸入就是隱藏層的輸出——l1,輸入有10層(隱藏層的輸出層),輸出有1層。
prediction = add_layer(l1, 10, 1, activation_function=None)
計算預測值prediction和真實值的誤差,對二者差的平方求和再取平均。
接下來,是很關鍵的一步,如何讓機器學習提升它的準確率。tf.train.GradientDescentOptimizer()中的值通常都小於1,這裡取的是0.1,代表以0.1的效率來最小化誤差loss。
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction),
reduction_indices=[1]))
train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
使用變數時,都要對它進行初始化,這是必不可少的。
# init = tf.initialize_all_variables() # tf 馬上就要廢棄這種寫法
init = tf.global_variables_initializer # 替換成這樣就好
訓練
下面,讓機器開始學習。
比如這裡,我們讓機器學習1000次。機器學習的內容是train_step, 用 Session 來 run 每一次 training 的資料,逐步提升神經網路的預測準確性。 (注意:當運算要用到placeholder時,就需要feed_dict這個字典來指定輸入。)
每50步我們輸出一下機器學習的誤差
with tf.Session() as sess:
sess.run(init)
for i in range(1000):
# training
sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
if i % 50 == 0:
# to see the step improvement
print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))
執行結果:
標題整體程式碼:
import tensorflow as tf
import numpy as np
# in_size輸入多少個單位 out_size輸出多少個單位
def add_layer(inputs,in_size,out_size,activation_function=None):
Weights = tf.Variable(tf.random_normal([in_size,out_size]))#生成一個in_data行和out_data列的矩陣
biases = tf.Variable(tf.zeros([1,out_size])+0.1)#生成一個1行和out_data列的矩陣
WX_plus_b = tf.matmul(inputs, Weights) + biases
if activation_function is None:
outputs = WX_plus_b
else:
outputs = activation_function(WX_plus_b)
return outputs
x_data = np.linspace(-1,1,300)[:,np.newaxis]#區間(-1,1)300個維度
noise = np.random.normal(0,0.05,x_data.shape)#方差是0.05,格式和x_data一樣的 格式
y_data = np.square(x_data) - 0.5 + noise
xs = tf.placeholder(tf.float32,[None,1])
ys = tf.placeholder(tf.float32,[None,1])
#建造隱層層和輸出層
l1 = add_layer(xs,1,10,activation_function=tf.nn.relu)#輸入1個,輸出10個神經元
predition = add_layer(l1,10,1,activation_function=None)#輸出層接的是l1,10個輸入一個輸出
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys- predition),
reduction_indices=[1]))
train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
init = tf.global_variables_initializer() # 替換成這樣就好
"""
sess = tf.Session()
sess.run(init)
for i in range(1000):
# training
sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
if i % 50 == 0:
# to see the step improvement
print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))
"""
with tf.Session() as sess:
sess.run(init)
for i in range(1000):
# training
sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
if i % 50 == 0:
# to see the step improvement
print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))