論文筆記 Acquiring Common Sense Spatial Knowledge through Implicit Spatial Templates (AAAI2018)
這篇文章是比利時魯汶大學的一篇文章,它提出了一個新的任務:
輸入結構化的文字(主語,關係,賓語),來預測兩個物體之間的空間位置關係。
對於spatial template可以劃分:
explicit型別:比如on, below等直接的空間關係。
implicit型別:比如(man, pulling, kite) , (man, pulling, luggage)等,本文主要處理的是這種型別。
文章的方法比較直接:兩種模型(基於迴歸和基於畫素),深度網路對位置進行約束訓練。
評價指標:(1)IOU (2)Regression (3)Above/below classification (4)Pixel (macro) accuracy
資料集:Vgnome篩選合適的樣例,最終∼378K instances,2,183 unique implicit Relationships and 5,614 unique objects
(i.e., Subjects and Objects).
資料集樣例:
一些視覺化的例子:
原文連結:Acquiring Common Sense Spatial Knowledge through Implicit Spatial Templates
相關推薦
論文筆記 Acquiring Common Sense Spatial Knowledge through Implicit Spatial Templates (AAAI2018)
這篇文章是比利時魯汶大學的一篇文章,它提出了一個新的任務: 輸入結構化的文字(主語,關係,賓語),來預測兩個物體之間的空間位置關係。 對於spatial template可以劃分: explicit型別:比如on, below等直接的空間關係。 implicit型別:比如
論文筆記-Deep Interest Network for Click-Through Rate Prediction
圖片 res 興趣 log through deep pre 出發 amp 重點:認為不同的廣告會觸發用戶的興趣點不同導致user embedding隨之改變。 DIN網絡結構如下圖右邊 DIN的出發點:認為不同的廣告會觸發用戶的興趣點不同導致user embedd
SPP-Net(Spatial Pyramid Pooling Network)論文筆記
1. 論文思想 SPP-Net的提出首先是為了解決傳統CNN網路對於輸入影象尺寸具有嚴格的大小限制,其原因也就是最後的全連線層需要的輸入尺寸是固定的。那麼對於一副比較大的影象就需要進行剪裁了,如下圖所示: 但是這樣會造成資料失真以及資料的不完整。那麼,要使CNN網路可以接受任意影象
Semantic Parsing via Staged Query Graph Generation: Question Answering with Knowledge Base【論文筆記】
一、摘要 我們對知識庫問答提出一個新穎的語義解析框架。我們定義了一個類似於知識庫子圖的查詢圖,可以直接對映為邏輯形式。語義解析被簡化為查詢圖生成,被表述為分階段搜尋問題。與傳統方法不同,我們的方法在早期就利用知識庫來修剪搜尋空間,從而簡化語義匹配問題。通過應用實體鏈指系統和深度卷
蒸餾神經網路(Distill the Knowledge in a Neural Network) 論文筆記 蒸餾神經網路(Distill the Knowledge in a Neural Network) 論文筆記
轉 蒸餾神經網路(Distill the Knowledge in a Neural Network) 論文筆記 2017年08月06日 16:19:48 haoji00
論文筆記 Learning Visual Knowledge Memory Networks for Visual Question Answering (CVPR2018)
這篇文章的一個出發點也是希望VQA裡面的視覺內容與人的結構化知識相聯絡起來,提出了一種visual knowledge memory network (VKMN)來將結構化知識與視覺特徵融合進端對端的學習框架。在經典VQA 資料集VQA v1.0與v2.0上在與知識推理相關的問題
論文筆記 Dynamic Graph Generation Network: Generating Relational Knowledge from Diagrams (CVPR2018)
Related works 1. visual relationships 2. Neural networks on a graph 3. Memory augmented neural network 文章方法上值得關注的地方 This paper propose
論文筆記:Distilling the Knowledge
原文:Distilling the Knowledge in a Neural Network Distilling the Knowledge 1、四個問題 要解決什麼問題? 神經網路壓縮。 我們都知道,要提高模型的效能,我們可
【論文筆記】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge
一、概要 該文章發於ACL 2017,在Knowledge base-based question answering (KB-QA)上,作者針對於前人工作中存在沒有充分考慮候選答案的相關資訊來訓練question representation的問題,提出
論文筆記:目標追蹤-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking
exploit orm dom ons tail red 最好 早期 形式化 基於自適應顏色屬性的目標追蹤 Adaptive Color Attributes for Real-Time Visual Tracking 基於自適應顏色屬性的實時視覺追蹤 3月講的第一
論文筆記之 SST: Single-Stream Temporal Action Proposals
ron 我們 裁剪 只需要 lock proposal 數據 function 性能 SST: Single-Stream Temporal Action Proposals 2017-06-11 14:28:00 本文提出一種 時間維度上的 proposal
Selective Search for Object Recognition 論文筆記【圖片目標分割】
line 單個 介紹 images 分層 什麽 但是 如果 抽樣 這篇筆記,僅僅是對選擇性算法介紹一下原理性知識,不對公式進行推倒. 前言: 這篇論文介紹的是,如果快速的找到的可能是物體目標的區域,不像使用傳統的滑動窗口來暴力進行區域識別.這裏是使用算法從多個維度對找
Deep Learning論文筆記之(二)Sparse Filtering稀疏濾波
structure 分布 的確 tlab bolt 期望 有一個 尋找 mean Deep Learning論文筆記之(二)Sparse Filtering稀疏濾波 自己平時看了一些論文,但老感覺看完過後就會慢慢的淡忘,某一天重新拾起來的時候又好像沒有
Semi-supervised Segmentation of Optic Cup in Retinal Fundus Images Using Variational Autoencoder 論文筆記
str 很好 流程 Coding 測試 eat www tin nal MICCAI 2017年論文 Overview: 視杯視盤精確分割後,就可以計算杯盤比了,杯盤比是青光眼疾病的主要manifestation。以往的方法往往采用監督學習的方法,這樣需要大量的精確像素
論文筆記之:Collaborative Deep Reinforcement Learning for Joint Object Search
region format es2017 join sid col str bottom respond Collaborative Deep Reinforcement Learning for Joint Object Search CVPR 2017 Motiva
論文筆記-Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation
mach default rap lin -s rnn alias for wrap 針對機器翻譯,提出 RNN encoder-decoder. encoder與decoder是兩個RNN,它們放在一起進行參數學習,最大化條件似然函數。 網絡結構: 註意輸入語句與
論文筆記-Sequence to Sequence Learning with Neural Networks
map tran between work down all 9.png ever onf 大體思想和RNN encoder-decoder是一樣的,只是用來LSTM來實現。 paper提到三個important point: 1)encoder和decoder的LSTM
論文筆記-DeepFM: A Factorization-Machine based Neural Network for CTR Prediction
contain feature 比較 san date res 離散 edi post 針對交叉(高階)特征學習提出的DeepFM是一個end-to-end模型,不需要像wide&deep那樣在wide端人工構造特征。 網絡結構: sparse feature
論文筆記-Item2Vec- Neural Item Embedding for Collaborative Filtering
href resource 數據 per con doc 訂單 優化 div 將word2vec思想拓展到序列item的2vec方法並運用到推薦系統中,實質上可以認為是一種cf 在word2vec中,doc中的word是具有序列關系的,優化目標類似在max對數似然函數
論文筆記-Neural Machine Translation by Jointly Learning to Align and Translate
tps idt 個人理解 att date eight default con ati 提出attention機制,用於機器翻譯。 背景:基於RNN的機器翻譯 基本思路是首先對語言x進行編碼encoder,然後解碼decoder為語言y。encoder和decoder可