1. 程式人生 > >《Character-level convolutional networks for text classification》論文網路結構解讀

《Character-level convolutional networks for text classification》論文網路結構解讀

1.資料

比如有一條資料【x=“Simultaneous Tropical Storms are Very Rare”】.則把該句子的大寫字母全部表示成小寫,構建char字符集的詞彙表如下(這裡詞彙表長度為70(69+1,即其他的不在詞彙表的表示為0)):
在這裡插入圖片描述
資料可以表示為x=70X1014 (高X寬,即70個特徵,每個特徵的長度為1014),該矩陣初始為0,反向依次遍歷【x=“simultaneous tropical storms are very rare”】,即首先遇到長度1014向量的第一個字元“e”,則查詢"e"在詞彙表中的位置為index,在矩陣index行中把第0列置1;然後遇到長度1014向量的第2個字元“r”,則查詢"r"在詞彙表中的位置為index,在矩陣index行中把第1列置1;…重複以上遍歷,則可以表示一條資料最終為x=70X1014的矩陣。(1014是一個固定引數,根據問題而定)

2.網路結構

分為9層,輸入為x=70*1014;輸出為4個類別。(如果類別之間不平衡,則處理方式是,對於較少的類別,提高其類別權重。比如類別A:B:C:D=1:2:3:4,則weight(A)=(1+2+3+4)/1=10;weight(B)=(1+2+3+4)/2=5)
在這裡插入圖片描述

參考
1.程式碼
2.《Character-level convolutional networks for text classification》