論文筆記：Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks

阿新 • • 發佈：2019-01-07

Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks

========簡陋的記錄===========
背景知識：Distant Supervised Relation Extraction，該方法的主要思想是，假設知識庫KB當中存在實體與實體的關係，那麼將KB當中的關係引入到正常的自然語言句子當中進行訓練，例如‘蘋果’和’喬布斯’在KB中的關係是CEO，那麼我們就假設類似於“【喬布斯】釋出了【蘋果】的新一代手機”的句子上存在CEO的關係，如此，利用KB對海量的文字資料進行自動標註，得到標註好的資料（正項），再加入一些負項，隨後訓練一個分類器，每個分類是一個關係，由此實現關係抽取。
在Distant Supervised Relation Extraction當中，面臨著兩個問題：1）KB當中Entity之間的關係和自然語言文字的對齊是啟發式的，兩個Entity同時存在一個句子就被標記起KB當中的關係，然而這假設太強，就存在很多錯誤標記的問題（如“【喬布斯】吃了一個【蘋果】”，就是錯誤標記，KB中表示這兩個是CEO關係，但實際上不是）。2）採用統計模型去分類的時候，應用的是人工設定的特徵（特徵工程錯誤、NLP工具的本身的Error 引起Error Propagation），其中可能存在一些上的錯誤，由此導致效能受影響。為了解決這個問題，本篇文章提出了一個名作PCNN的框架，加上Multiple Instance Learning學習方法，共同去解決1、2的問題。為了解決問題1，錯誤標記的問題，採用了Multiple Instance Learning（所有instance被聚合到若干個包當中，一個包如果被標記為正項，那麼至少有一個正項instance，如果被標記為負項，那麼一定不存在一個正項instance），由此降低錯誤標記帶來的影響。為了解決問題2，特徵工程的錯誤，則直接不引入任何人工特徵工程的工作，直接使用一個CNN + Piecewise Max Pooling 去抽取特徵。
傳統的關係抽取方法，包含bootstrap、無監督發現或者有監督分類集中模式。其中有監督的方法是最常使用的，也是效能表現最好的一類，有監督主要是將關係轉換成類別標籤去考慮。但是，有監督的方法需要大量的資料，如果基於人工去標註每一句話當中的距離，那麼明顯是不現實的，也因此，這個方法也一直受制於訓練資料量不足的問題。為了解決這個問題，才引入了Distant Supervised Relation Extraction，引入外部KB來實現自動化的語料標註。自動標註解決了語料的數量問題，但是其標註質量一般，存在大量的wrong label，於是又引入了multi-instance learning來解決這個問題。與此同時，如何提取特徵也是一個很重要的工作，主流的方法有兩種，基於特徵的，無論基於什麼方法，都難以找到高質量的特徵。於是，本文準備使用PCNN進行特徵抽取和分類。
在PCNN部分，其特點在於：1、使用了預訓練的Word-Embedding 2、加入了Position Embedding，3、卷積部分是採用了常見的針對文字的卷積核設計，單向滑動。 4、在池化層，是按照分段進行max pooling的，而PCNN的P就是這個代表，將句子按照兩個entity進行分割，分割得到三段，這三段分別進行max pooling。5、最後使用一個Softmax分類器進行類別判斷。
在Multiple instance learning部分，專門針對次修改了優化的方法，來適應使用Multiple Instance Learning來降低Wrong Label。目前的理解是，針對上述PCNN模型，假設需要學習的引數是P，且訓練資料一共有T個bags，C種關係，那麼在訓練時則在bag級別進行訓練，損失函式為bag級別的交叉熵，每個袋子預測為關係r的概率為這個袋子裡被預測為袋子r關係最大的值，即分類器仍然是在袋子裡面的instance級別進行計算，但是在計算損失更新引數的時候，則同時考慮這個袋子裡面的所有instance，選擇概率最大的那一個作為這個袋子的代表。就這樣每輪將Mini-batch裡的所有袋子的損失計算出來，用於更新引數P，即bag-level，而不是傳統的instance level。
實驗部分主要關心：1、利用Multiple Instance Learning + PCNN能否提升效能2、測試不同引數的影響。資料集使用了一個公開的資料集，KB是Freebase，而metric為precision/recall。實驗Baseline部分包含：傳統的Distant Supervision RE Baseline、包含Multiple-Instance改進的，同時包含Multiple-Instance+Multiple Labels改進的。實驗顯示該方法均高於Baseline模型不少

論文筆記：Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks

Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks ========簡陋的記錄=========== 背景知識：Distant Sup

論文筆記：Spectral Normalization for Generative Adversarial Networks [ICLR2018 oral]

Spectral Normalization for Generative Adversarial Networks 原文連結：傳送門一篇純數學類文章，有興趣的時候再看！ Emma CUH

影象隱寫術分析論文筆記：Deep learning for steganalysis via convolutional neural networks

好久沒有寫論文筆記了，這裡開始一個新任務，即影象的steganalysis任務的深度網路模型。現在是論文閱讀階段，會陸續分享一些相關論文，以及基礎知識，以及傳統方法的思路，以資借鑑。這一篇是Media Watermarking, Security, and Forensi

論文筆記：Perceptual Losses for Real-Time Style Transfer and Super-Resolution[doing]

1.transformation: image to image 2.perceptual losses: psnr是per-pixel的loss,值高未必代表圖片質量好，廣泛應用只是因為

論文筆記 / Mitosis Detection in Breast Cancer Histology Images with Deep Neural Networks

僅供參考，如有翻譯不到位的地方敬請指出。轉載請標明出處！論文地址：https://link.springer.com/chapter/10.1007/978-3-642-40763-5_51 摘要我們使用含有最大池化層的深度卷積神經網路來檢測乳腺組織學影象中的有絲分裂。訓練網路以

論文筆記：目標追蹤-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking

exploit orm dom ons tail red 最好早期形式化基於自適應顏色屬性的目標追蹤 Adaptive Color Attributes for Real-Time Visual Tracking 基於自適應顏色屬性的實時視覺追蹤 3月講的第一

深度學習論文筆記：Deep Residual Networks with Dynamically Weighted Wavelet Coefficients for Fault Diagnosis of Planetary Gearboxes

這篇文章將深度學習演算法應用於機械故障診斷，採用了“小波包分解+深度殘差網路(ResNet)”的思路，將機械振動訊號按照故障型別進行分類。文章的核心創新點：複雜旋轉機械系統的振動訊號包含著很多不同頻率的衝擊和振盪成分，而且不同頻帶內的振動成分在故障診斷中的重要程度經常是不同的，因此可以按照如下步驟設計深度

論文筆記：Learning Region Features for Object Detection

中心思想繼Relation Network實現可學習的nms之後，MSRA的大佬們覺得目標檢測器依然不夠fully learnable，這篇文章類似之前的Deformable ROI Pooling，主要在ROI特徵的組織上做文章，文章總結了現有的各種ROI Pooling變體，提出了一個統一的數學表示式

論文筆記：IRGAN：A Minimax Game for Unifying Generative and Discriminative Information

2017 SIGIR 簡單介紹 IRGAN將GAN用在資訊檢索（Information Retrieval）領域，通過GAN的思想將生成檢索模型和判別檢索模型統一起來，對於生成器採用了基於策略梯度的強化學習來訓練，在三種典型的IR任務上（四個資料集）得到了更顯著的效果。生成式和判別式的檢索模型生成式檢索模

論文筆記：雙線性模型《Bilinear CNN Models for Fine-Grained Visual Recognition》

雙線性模型是2015年提出的一種細粒度影象分類模型。該模型使用的是兩個並列的CNN模型，這種CNN模型使用的是AlexNet或VGGNet去掉最後的全連線層和softmax層，這個作為特徵提取器，然後使用SVM作為最後的線性分類器。當然，作者還在實驗中嘗試了多種方法，比如最後使用softmax但

論文筆記：Feature Pyramid Networks for Object Detection

初衷 Feature pyramids are a basic component in recognition systems for detecting objects at different scales. But recent deep

論文筆記：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application

1.歷史方法 1）基於字元的DCNN,比如photoOCR.單個字元的檢測與識別。要求單個字元的檢測器效能很強，crop的足夠好。 2）直接對圖片進行分類。9萬個單詞，組合成無數的單詞，無法直接應用 3）RNN,訓練和測試均不需要每個字元的位置。但是需要預處理，從圖片得到特

論文筆記：Is object localization for free?

Is object localization for free? Weakly-supervised learning with convolutional neural networks 摘要提出一個弱監督卷積神經網路for 分類。主要貢獻有：

論文筆記：MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

Abstract MatchNet：一個用來從patches中提取特徵的深度卷積網路 + 一個用來比較提取出的特徵相似度的三層全連結網路構成。 Introduction 在MatchNet中，每個patch輸入卷積網路，生成一個固定維度的類似

論文筆記：Deep neural networks for YouTube recommendations

https://blog.csdn.net/xiongjiezk/article/details/73445835 Download [1] Covington P, Adams J, Sargin E. Deep neural networks for youtube recommen

論文筆記：Fisher Kernels on Visual Vocab ularies for Image Categorization

Fisher Kernels on Visual Vocabularies for Image Categorization 論文連結：CVPR 2006 在模式分類領域，Fisher Vector（FV）是一個強有力的構架，因為他結合了生成式（概率密

論文筆記：DRAW: A Recurrent Neural Network For Image Generation

DRAW: A Recurrent Neural Network For Image Generation 2019-01-14 19:42:50 Paper：http://proceedings.mlr.press/v37/gregor15.pdf 本文將 V

論文筆記：Residual Attention Network for Image Classification

前言深度學習中的Attention，源自於人腦的注意力機制，當人的大腦接受到外部資訊，如視覺資訊、聽覺資訊時，往往不會對全部資訊進行處理和理解，而只會將注意力集中在部分顯著或者感興趣的資訊上，這樣有助於濾除不重要的資訊，而提升資訊處理的效率。最早將A

論文筆記：Self-critical Sequence Training for Image Captioning

引言現在image caption主要存在的問題有： exposure bias：模型訓練的時候用的是叫“Teacher-Forcing”的方式：輸入RNN的上一時刻的單詞是來自訓練集的ground-truth單詞。而在測試的時候依賴的是自己

論文閱讀筆記：Perceptual Losses for Real-Time Style Transfer and Super-Resolution

這篇文章是ECCV2016的一篇文章，主要是提出了一種全新的Loss用於影象風格轉換和影象超分辨。整體框架如上圖所示，分為兩個網路，影象轉換網路和損失網路，其中影象轉換網路是深度殘差網路，將圖片轉換為^ y = fW (x) 。我們訓練影象轉換網路來最小化損失網路的輸出值加權

論文筆記：Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks

相關推薦