keras 模型用於預測時的注意事項

阿新 • • 發佈：2019-02-14

為什麼訓練誤差比測試誤差高很多？

一個Keras的模型有兩個模式：訓練模式和測試模式。一些正則機制，如Dropout，L1/L2正則項在測試模式下將不被啟用。

另外，訓練誤差是訓練資料每個batch的誤差的平均。在訓練過程中，每個epoch起始時的batch的誤差要大一些，而後面的batch的誤差要小一些。另一方面，每個epoch結束時計算的測試誤差是由模型在epoch結束時的狀態決定的，這時候的網路將產生較小的誤差。

【Tips】可以通過定義回撥函式將每個epoch的訓練誤差和測試誤差並作圖，如果訓練誤差曲線和測試誤差曲線之間有很大的空隙，說明你的模型可能有過擬合的問題。當然，這個問題與Keras無關。

在keras中文文件中指出了這一誤區，筆者認為產生這一問題的原因在於網路實現的機制。即dropout層有前向實現和反向實現兩種方式，這就決定了概率p是在訓練時候設定還是測試的時候進行設定

利用預訓練的權值進行Fine tune時的注意事項：

不能把自己新增的層進行將隨機初始化後直接連線到前面預訓練後的網路層

in order to perform fine-tuning, all layers should start with properly trained weights: for instance you should not slap a randomly initialized fully-connected network on top of a pre-trained convolutional base

. This is because the large gradient updates triggered by the randomly initialized weights would wreck the learned weights in the convolutional base. In our case this is why we first train the top-level classifier, and only then start fine-tuning convolutional weights alongside it.
we choose to only fine-tune the last convolutional block rather than the entire network in order to prevent overfitting, since the entire network would have a very large entropic capacity and thus a strong tendency to overfit. The features learned by low-level convolutional blocks are more general, less abstract than those found higher-up, so it is sensible to keep the first few blocks fixed (more general features) and only fine-tune the last one (more specialized features).

fine-tuning should be done with a very slow learning rate, and typically with the SGD optimizer rather than an adaptative learning rate optimizer such as RMSProp. This is to make sure that the magnitude of the updates stays very small, so as not to wreck the previously learned features.

keras 模型用於預測時的注意事項

為什麼訓練誤差比測試誤差高很多？一個Keras的模型有兩個模式：訓練模式和測試模式。一些正則機制，如Dropout，L1/L2正則項在測試模式下將不被啟用。另外，訓練誤差是訓練資料每個batch

Android Sqlite資料庫升級時注意事項

在app版本升級時，同時升級了Sqlite資料庫的版本號的話，如果需要保留之前的資料，需要在onUpgrade方法中做處理。這裡記錄一下在onUpgrade處理升級的時候的一些注意事項。先看下常用的SQLiteOpenHelper的方法： public class Database

.NET MVC和.NET WEB api混用時注意事項

1、同時配置了mvc路由和api路由時，mvc路由無法訪問(呼叫所有mvc路由全部404錯誤) 在Global.asax中，需注意路由註冊的順序，將api路由註冊放在最後：即將 void Application_Start(object sender, EventArgs e)

vue之watch監聽物件或者一個值時注意事項（深度觀察deep:true慎用！）

vue中想在某個值改變的時候能夠做一些其他事情，可以使用其提供的監聽機制，使用watch。注意，本篇不講技術問題，只是講解如何應用，因為筆者也是一個前端的小白例：經手專案中就有使用，截圖如下：下面來分析上面分別是怎樣實現監聽的：其實除了畫紅線的地方，別的都沒什

安裝windows和ubuntu雙系統時，安裝ubuntu時注意事項

1.允許安裝第三方軟體圖形、硬體以及是否聯網更新（可選也可不選） 2.引導驅動裝置應選全盤即/dev/sda即可------這是Ubuntu的grub2引導；如果將引導驅動裝置放入分好的/boot區，則是由Windows引導。 3.當更新windows或者Ubuntu時，造成開機無法進入即找不到引導

ovirt掛載多儲存環境時注意事項

我的測試環境如下 default資料中心+default叢集+NFS儲存 default叢集有node1和node2 新建FC叢集，並加入node3，然後掛載fc儲存 node1和node2沒有hba卡，並未連線到儲存，隸屬於不同叢集，但還是會報錯，看來儲存在同一資料中心

Unity 模型匯入流程及注意事項

取自Unity官方ppt資料並整合 1.貼圖匯入相關 2.貼圖匯入相關設定過濾貼圖模式過濾模式：Point ：馬賽克，但效能消耗小

使用Spring + quartz叢集持久化時注意事項

1、持久化時未序列化異常 java.io.NotSerializableException: Unable to serialize JobDataMap for insertion into database because the value of property '

mybatis寫xml時注意事項

mybatis寫xml時注意事項: 1. 如果資料庫欄位中有關鍵字，使用`關鍵字`，最好是隻要是欄位就用``符號，可以減少很多錯誤 2. 如果更新的欄位中有時間戳，更新時，使用如下(加上jdbcType可以防止出錯): <if test="updateTime !=null"> &

JAVA中在main函式中呼叫變數時注意事項

在下面這段程式碼中會報錯 [java] view plain copy print?System.out.println(s1); System.out.println(s1);Cannot make a static reference to the non-static field s1 只要把

適配平板和手機端時注意事項

在適配平板和手機佈局時，經常會建立幾種不同的佈局。完了執行時butterknife會報空指標，用死方法一個個抓到最後才指向 Caused by: java.lang.IllegalStateException: Required view 'ivGoodListStyle'

$.each key值相同時注意事項

如果 key的值相同的話，會輸出後面的value值。 var trdate={"姓名":"張三","姓名":"李四","姓名":"王五","姓名":"趙六","姓名":"小七"}; var i=0; $.each(trdate,function(key,valu

使用DecimalFormat時注意事項

DecimalFormat ff=new DecimalFormat("#,###,###.######"); 綠色區域為保留的小數位數（四捨五入）----但不會保

對於tp5.0關聯模型的幾點注意事項

1.belongsTo()、hasOne()的區別在定義一對一關聯模模型方法時，對其有疑惑不知道該定義哪個： belongsTo是定義在關聯模型從模型中，也是從模型對應的表一般都儲存外來鍵id，在關聯模型屬於從屬關係 hasOne 是定義在主模型中，在關聯模型中屬

公開aidl介面給外部apk呼叫時注意事項

當我們寫的一個service通過aidl公開介面給外部第三方應用時，通常的做法是會將aidl以及對應java檔案打成jar包，以供第三方的app使用。這樣做沒有任何問題，但要注意的是在後續升級這個介面的時候，得保持介面中方法順序不變，即只能在aidl的後面新增新方法，而不能

WSAEventselect模型中的一些注意事項（尤其是event和事件的關聯與重置；FD_WRITE事件的作用）

1. 需要包含winsock2.h，連結ws2_32.llib 2. 把#include <winsock2.h>放到最前面至於原因，那是因為windows.h這個標頭檔案已經包含了winsock.h,winsock.h和winsock2.h貌似有衝突

struts2接收javabean物件時注意事項

struts2在接收javabean物件的時候，action的中的屬性既要有get方法也要有set方法，不然只能接收到一個屬性。示例如下: xtype: 'form', itemId : '

Go 多變數賦值時注意事項

說到多變數賦值時，先計算所有相關值，然後再從左到右依次賦值，但是這個規則不適用於python我們來看一例： package main import "fmt" func main() { data, i := [3]string{"喬幫主","慕容復","鳩摩智"}, 0 i, data

keras利用vgg16模型直接預測圖片類型時的坑

速度程序 strong 第一次結果 mod 如果預測圖文件第一次使用keras中的預訓練模型時，若本地沒有模型對應的h5文件，程序會自動去github上下載，但國內下載github資源速度太慢，可以選擇直接去搜索下載，下載後將模型（h5文件）放入C:\User

[ML]keras波士頓房價預測模型

ets close 方法 valid seq same layer n) 預測 from keras.datasets import boston_housing from keras.models import Sequential from keras.layers

keras 模型用於預測時的注意事項

為什麼訓練誤差比測試誤差高很多？

相關推薦