1. 程式人生 > >本週最熱 AI 論文大集合,還不快一鍵收藏?

本週最熱 AI 論文大集合,還不快一鍵收藏?

640

640?

在碎片化閱讀充斥眼球的時代,越來越少的人會去關注每篇論文背後的探索和思考。

在這個欄目裡,你會快速 get 每篇精選論文的亮點和痛點,時刻緊跟 AI 前沿成果。

點選本文底部的「閱讀原文」即刻加入社群,檢視更多最新論文推薦。

這是 PaperDaily 的第 97 篇文章

640?

Compositional Attention Networks for Machine Reasoning

@NoaRicky 推薦

#Machine Reasoning

本文是斯坦福大學發表於 ICLR 2018 的工作,論文解決了樹狀結構網路在機器閱讀、機器推理問題中雖有良好表現,但模型訓練時間過長的問題,同時幸運的是在精確度方面勝過了以往所有模型

。它其中一名作者是斯坦福 CS224n 授課老師 Manning 教授,該文章模型已被 Stanford NLP 團隊實現。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2207

原始碼連結

https://github.com/stanfordnlp/mac-network

640?

Know What You Don't Know: Unanswerable Questions for SQuAD

@guohao916 推薦

#Machine Reading Comprehension

本文是斯坦福大學發表於 ACL 2018 的工作,論文在原來的 SQuAD(SQuAD 1.1)的十萬個問題 - 答案對的基礎上,SQuAD 2.0 中新增了超過五萬個新增的、由人類眾包者對抗性地設計的無法回答的問題

。執行 SQuAD 2.0 閱讀理解任務的模型不僅要能夠在問題可回答時給出答案,還要判斷哪些問題是閱讀文字中沒有材料支援的,並拒絕回答這些問題。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2180

原始碼連結

https://bit.ly/2rDHBgY

640?

Learning-to-Ask: Knowledge Acquisition via 20 Questions

@yihongchen 推薦

#Knowledge Discovery

本文是清華大學、微軟和阿里巴巴聯合發表於 KDD 2018 的工作。為機器賦能知識是讓機器具有智慧的一種重要手段,通過提問獲取知識是一種常見的方法,但如何保證提問的效率和有效性是一個核心問題,本文針對這些問題提出了一種基於深度強化學習和矩陣分解的 Learning-to-Ask 方法,並用貝葉斯方法表示知識來增強魯棒性。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2174

640?

Simple and Effective Multi-Paragraph Reading Comprehension

@guohao916 推薦

#Question Answering

本文將段落級的神經 QA 模型擴充套件到篇章級。在訓練階段取樣了多個段落,並改造了目標函式使之產生全域性正確的輸出。當 QA 模型的輸入為篇章時,處理方法可分為兩類:流水線方法首先選擇一個最相關的段落再預測答案跨度;基於置信的方法將模型使用在多個段落上返回最高的置信值。基於置信的方法對於段落選擇的錯誤具有強魯棒性,然而這要求模型對每一個段落計算出較精確的置信值。

本文將上述兩個思路相結合,使流水線方法能夠計算出各個段落更加精確的置信值。首先使用 TF-IDF 選擇用於訓練和測試的段落,針對語料的遠端監督噪聲較大的問題,將目標函式定義為所有可能的答案位置的邊緣值;最後通過使用一個共享標準化目標函式,使答案選擇基於篇章中各個段落的比較,有效提高了模型的魯棒性。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2179

原始碼連結

https://github.com/allenai/document-qa

640?

Towards Human-Machine Cooperation: Self-supervised Sample Mining for Object Detection

@kezewang 推薦

#Object Detection

近年來,隨著網際網路的快速發展和計算能力的提升,受益於大規模訓練資料的深度學習技術取得了突破性的進步。物體檢測作為計算機視覺領域的一個經典任務,檢測精度取得了巨大的提升。以候選區域為基礎的物體檢測網路對一張輸入的影象提取大量的候選物體區域,並對這些區域進行類別標註和位置迴歸,提升了物體檢測的識別精度和識別速度。然而,神經網路的檢測效果極其依賴訓練網路的標註樣本資料,因此,如何利用大規模的未標註或是少量標註的資料有效訓練網路,提升其檢測精度是亟待解決的問題。 

為了使用更少的標註資料訓練出高精度的檢測模型,一般需要解決以下技術問題: 

1. 在保證模型效果的同時,儘量減少人工樣本標註。通常的神經網路訓練,非常依賴大量人工標註的資料集,而比起其他視覺任務(例如,影象分類和動作識別),標註物體需要提供圖片中所有物體的類別標籤和物體所處區域的邊框座標。因此,對影象進行人工標註非常耗時耗力,發展自動標註無標籤資料的方法是減少人工標註負擔的關鍵步驟。 

2. 挖掘能夠顯著提高分類器表現的特殊訓練樣本。現有的物體檢測資料集通常包含了絕大多數普通的“簡單”樣本和少量有益的“困難”樣本(即,富含各種光照,變形,遮擋和類內變化的資訊量)。因為他們服從長尾分佈,“困難”的例子是罕見的,為了利用這些能夠最有效訓練神經網路的“困難”樣本,需要能夠從大量樣本中將其識別出來。 

3. 抑制壞樣本的負面影響。一些訓練樣本(例如,離群點或噪聲樣本)可能會使模型發生偏移,在訓練時排除被資料集中的標註者標記為“混亂”的樣本後,訓練得到的物體檢測效能可以得到大幅度的改進和提高。 

為克服上述現有技術存在的不足,我們的研究動機在於提供一種基於自監督過程改進主動學習的通用物體檢測系統及方法,以結合樣本挖掘技術和深度學習物體檢測技術,利用少量標註的樣本和海量的未標註樣本聯合訓練提升模型的檢測效能以提高檢測精度。 同時,可在減少大量的人力物力、節約成本基礎上實現通用物體檢測目的。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2177

原始碼連結

https://github.com/yanxp/SSM

640

Attention-Gated Networks for Improving Ultrasound Scan Plane Detection

@hsu 推薦

#Semantic Segmentation

本文是 Attention U-Net 的前序文章論文提出了 Attention Gate,和主流方法一樣使用的是 soft-attention 機制。文章將 Attention-Gate 應用於超聲影象的分類問題,包括若干器官。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2198

原始碼連結

https://github.com/ozan-oktay/Attention-Gated-Networks

640

CLIP-Q: Deep Network Compression Learning by In-Parallel Pruning-Quantization

@yanjoy 推薦

#Model Compression

本文是西蒙弗雷澤大學發表於 CVPR 2018 的工作,論文提出先剪枝後量化的壓縮框架,並且自動優化超引數。結果在 GoogLeNet 上有 10x 壓縮,在 ResNet-50 有 15x 壓縮,並不降低準確率。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2181

640

deepNF: deep network fusion for protein function prediction

@xuehansheng 推薦

#bioinformatics

本文將深度學習應用到多網路融合的過程中,並針對蛋白質功能預測的網路結構特點,提出了一種基於多模式深度自動編碼器的網路融合方法——deepNF,從多個異構互動網路中提取蛋白質的高階特徵。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2172

原始碼連結

https://github.com/VGligorijevic/deepNF

640

Large scale distributed neural network training through online distillation

@paulpeng 推薦

#Neural Networks

本文來自 Google,論文提出了一種大規模分散式神經網路的的改進方法。具體來說,作者提出了一種 distillation 模型的變種,一方面考慮是支援大規模資料的並行化處理,另一方面考慮是為預測模型提供了一種可重複的方法。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2205

640?

RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems

@xuzhou 推薦

#Recommender Systems

本文是上海交大、微軟亞洲研究院和香港理工大學聯合發表於 CIKM 2018 的工作。為了解決協同過濾的稀疏性和冷啟動問題,研究人員通常利用社交網路或專案屬性等輔助資訊來提高推薦效果。本文將知識圖譜應用到推薦系統中,是一個很新穎的方法,給推薦系統提供了一個全新的思路。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2201

原始碼連結

https://github.com/hwwang55/RippleNet

640?

MojiTalk: Generating Emotional Responses at Scale

@filterc 推薦

#Response Generation

本文是清華大學和 UCSB 發表於 ACL 2018 的工作,論文旨在教會機器生成有情緒的回答,比如當用戶傷心的時候,機器回答一定不能很開心。這項工作的難點在於缺少大規模標註好的情感訓練集,以及如何控制生成回答的情感。現有的情感資料集對深度模型都太小,並且只有有限的幾個分類(生氣、開心,或者正面、負面)。 

本文解決方案如下:1. 使用含有 emoji(選擇了 64 種)的 Twitter 資料來做自動情感標註(規模:600K) 2. 在生成回答時,根據給定的 emoji 來生成不同情感的回答

640640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2199

原始碼連結

https://github.com/Claude-Zhou/MojiTalk

640

A Minimal Span-Based Neural Constituency Parser

@godweiyang 推薦

#Constituency Parsing

本文提出了一種不同於傳統方法的成分句法分析方法。傳統的句法分析器需要預處理出語法規則集合,然後利用語法規則來進行各種句法分析,這類方法的弊端有很多,主要有三點:

1. 語法規則集合構造的好壞直接影響到分析效果的好壞;

2. 不僅如此,利用語法規則的方法時間複雜度高,因為每次都要遍歷一遍語法規則集合來決定每個短語採用哪一條語法規則;

3. 還有一種弊端就是利用語法規則的方法無法產生新的產生式,也就是說如果測試集中的語法規則沒有在訓練集中出現過,那麼是無法預測出來的。

本文提出的模型不需要預先構造出語法規則集合,只需要預測出每個短語的label和 split 就行了,這樣就能構造出一棵完整的句法樹。該模型分為編碼與解碼兩部分,其中編碼部分就是利用雙向 LSTM 將每個詞和短語表示成向量,解碼部分提出了兩種模型,一種是 chart 模型,類似於 CKY 演算法,另一種是 top-down 模型,就是自頂向下的貪心演算法。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2098

原始碼連結

https://github.com/mitchellstern/minimal-span-parser

640

Learning Structural Node Embeddings via Diffusion Wavelets

@xuehansheng 推薦

#Network Embedding

本文是斯坦福大學發表於 KDD18 的工作,論文提出了一種通過利用熱小波擴散模式通過低維嵌入來表示每個節點的網路鄰域的方法——GraphWave。 GraphWave 不是在手工選擇的特徵上進行訓練,而是以無人監督的方式學習這些嵌入。文章在數學上證明具有相似網路鄰域的節點將具有類似的 GraphWave 嵌入,即使這些節點可能駐留在網路的非常不同的部分中。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2204

原始碼連結

https://github.com/snap-stanford/graphwave

640

Adversarial Network Embedding

@xuzhou 推薦

#Network Embedding

ANE 是發表在 AAAI 2018 上的用對抗生成網路學習網路表示的文章。現有的網路表示方法 Deep Walk、LINE、node2vec 等保留了網路的一階、二階或者更高階的相似性,但這些方法都缺少增加 embedding 魯棒性的限制。本文通過對抗訓練的規則來正則化表示學習過程

ANE 包含兩個部分:結構保留、對抗學習。在結構保留部分,本文實驗中分別使用了 Inductive DeepWalk 和 Denoising Auto encoder 兩種模型;對抗學習部分主要是學習穩定、魯棒的網路表示,使結構保留部分生成的網路表示服從先驗(prior)分佈。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2164

640

Deep Spatial Feature Reconstruction for Partial Person Re-identification: Alignment-Free Approach

@Molly 推薦

#Person Re-identification

本文是中國科學院大學發表於 CVPR 2018 的工作,論文介紹了一種行人遮擋情況下的重識別方法。在實際應用中,行人互相遮擋或者被畫面中其他物體遮擋,往往會導致模型表現下降。這篇文章提出的方法在消耗較少計算資源的情況下,可以得到更好的結果。 

文章提出了一種框架,先使用 FCN 提取特徵,再使用 Deep Spatial Feature Reconstruction 方法計算特徵的相似度。即使用完整行人的特徵的線性組合來表示部分行人的線性特徵,如果誤差很小,則認為是同一個人。否則不是同一個人。

640640640640

論文模型:點選檢視大圖

640

論文連結

https://www.paperweekly.site/papers/2183

640?#推 薦 有 禮#

本期所有入選論文的推薦人

均將獲得PaperWeekly紀念週邊一份

640?640640

▲ 深度學習主題行李牌/卡套 + 防水貼紙

禮物領取方式

推薦人請根據論文詳情頁底部留言

新增小助手領取禮物

想要贏取以上週邊好禮?

點選閱讀原文即刻推薦論文吧!

640?

點選以下標題檢視往期推薦: 

關於PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號後臺點選「交流群」,小助手將把你帶入 PaperWeekly 的交流群裡。

相關推薦

javascript功能插件集合寫前端的親們記得收藏

progress ogre 工作 寫作 自動調整 pen handle 國際化 沖突 導讀:GitHub 上有一個 Awesome – XXX 系列的資源整理。awesome-javascript 是 sorrycc 發起維護的 JS 資源列表,內容包括:包管理器、加載器、

IT行業熱門的5崗位看看你哪個適合你?

IT行業作為當今發展前途最大的幾大行業之一,獲得了前所未有的廣泛關注,且隨著科技的發展,這一趨勢將更加明顯。 但是,對於IT行業新人來說,想要在IT行業有所建樹,首先應該選擇適合的職位。那麼IT行業究竟有哪些職位呢?哪些崗位是當下最熱門的呢? (小編推薦一個學C語言/C++的學習裙【 七八八

每天一道LeetCode-----買賣商品問題計算利潤分別有次交易兩次交易多次交易的情況

Best Time to Buy and Sell Stock 給定一個價格序列prices,其中prices[i]代表第i天商品的價格,商家需要在某一天買入,然後在之後的某一天出售,計算可以獲得的最大利潤 本質就是計算prices[i]−price

本週杭州程式設計師工資調查高於深圳和廣州

今天晚上11點,爬了某招聘網站,獲取近7日內杭州的程式設計師工資2344條。其中,有工資的2275條。本文分別統計了工資的分佈,工資和學歷,工作經驗和公司的性質,規模,產業的關係。 這裡的程式設計師包括普通程式設計師,架構師,演算法工程師,計算機圖形,美工等。

讓程式設計師撓頭的9任務你認同幾項?

那些非程式設計師認為軟體開發是非常困難的,確實如此,但這種困難不像那些外行人理解的那樣。最近在 Quora 上的一次討論,程式設計師分享了他們認為工作中的最大困難,在這裡為大家呈現出其中的 9 個。你可以看到,寫程式碼並不是最難的事情,如果你也在從事軟體開發,看看哪些內容你認為也是很難的。一、怎樣才是最佳解決

Deep Reinforcement Learning深度強化學習_論文集合

  本文羅列了最近放出來的關於深度強化學習(Deep Reinforcement Learning,DRL)的一些論文。文章採用人工定義的方式來進行組織,按照時間的先後進行排序,越新的論文,排在越前面。希望對大家有用,同時歡迎大家提交自己閱讀過的論文。 目錄 •   

SXSSFWorkbook XSSFWorkbook 我所遇到的坑集合希望能幫助更多的人。

坑一:為什麼模板中的資料獲取不到? 當你企圖使用SXSSFWorkbook去載入一個已存在的Excel模板時,首先你應該用XSSFWorkbook去獲取它  XSSFWorkbook(java.io.File file) XSSFWorkbook(java.io.Inpu

IT類舒適的10職位你同意嗎?

  程式設計師、工程師、產品經理,是IT職業中人們首先聯想到的職位。然而,每天喊著OT、猝死、單身狗的ITer,真的那麼受傷嗎?別被騙了,事實上在IT網際網路這個最富活力和挑戰的行業,也存在著大量的生活工作平衡(Work-lifeBalance)度很好的“爽上天”職業,其

leetcode+雙指標求容積思維。右指標

點選開啟連結#include<iostream> #include<stdio.h> #include<stdlib.h> #include<string&g

從0基礎到次過6科的晉級只有與註會死磕到底!

說了 網校 模擬試卷 分數 容易 推薦 休息 順序 不容易 我2016年順利通過了六科考試,想和大家一起交流一下此天下第一考的備考心得。 我的背景 很不好意思的告訴大家,我並不是一個科班出生的會計人或者財務人,反而是心血來潮半路出家來搶飯碗的,在2015年

爬蟲高玩教你用Python每秒鐘下載張高清不快

on() print async tpc 多說 xxx ima 所有 mkdir 如果爬蟲需要展現速度,我覺得就是去下載圖片吧,原本是想選擇去煎蛋那裏下載圖片的,那裏的美女圖片都是高質量的,我稿子都是差不多寫好了的,無奈今天重新看下,妹子圖的入口給關了。 至於

隻猴子有100個香蕉把香蕉搬到50米之外的家裡每次多拿50個香蕉每走米要吃掉一個香蕉最後家裡能剩下幾個香蕉

題目:一隻猴子有100個香蕉,把香蕉搬到50米之外的家裡,每次最多拿50個香蕉,每走一米要吃掉一個香蕉,最後家裡能剩下幾個香蕉。 答案: 很多人的方案:猴子先搬50根,走17米,在回來搬50根走到17米處,回來後再搬剩下的49根走完33米,最後得到16根!   但是其實可以剩下17根。 猴

【碼農的青春】不要停止好奇不要羨慕做好自己步走向夢想。

如果天總也不亮,那就摸黑過生活;如果發出聲音是危險的,那就保持沉默;如果自覺無力發光,那就不必去照亮別人。但是不要習慣了黑暗就為黑暗辯護,不要為自己的苟且而得意洋洋,不要嘲諷那些比自己更勇敢更有熱量的人們。我們可以卑微如塵土,不可扭曲如蛆蟲。

從前端菜鳥到看這篇就夠了

結合個人經歷總結的前端入門方法,總結從零基礎到具備前端基本技能的道路、學習方法、資料。由於能力有限,不能保證面面俱到,只是作為入門參考,面向初學者,讓初學者少走彎路。網際網路的快速發展和激烈競爭,使用者體驗成為一個重要的關注點,導致專業前端工程師成為熱門職業,各大公司對前端

資料】華為內部狂轉好文資料看這篇就夠了!

來源:華為IT產品解決方案導讀科技的進步在很多的時候總會超出我們的想象,試想如果未來我們一個人擁

未來中國具潛力的小生意建議看

找到 外賣 color 關聯 git crm 免費 旅遊 們的 馬雲很有希望成為未來首富的有力競爭者,但是馬雲並非一開始就是個有錢人,而是一步一步做到現在的地步,馬雲也是比較早接觸互聯網的人,趁著互聯網的井噴,一下子成為互聯網的領頭人物,把阿裏巴巴也做到了市值上千億美元,不

神們都在用的5款手機APP個個都是高質量收藏

img mark 內容 mar 高清 什麽 通過 合格 apm 我們都知道,APP的種類是多種多樣的,看著琳瑯滿目的APP,想不挑選都不行,可是怎樣才能找到適合自己手機的APP了,沒關系,今天小編先給你送上一批,趕緊去瞧瞧,有喜歡的就去收藏一下。 1.Snapmod 一個讓

【微信公眾平臺開發】利用百度接口制作導航功能

顯示 12px font -c cati blog ltr vertica 拾取 微信開發中,非常多商家用戶都要求點詳細地址。能在百度或者soso地圖上面顯示自己的地址。 而這種功能。利用百度api接口地圖標點功能就能夠非常easy實現。 1.功能說明例如以下:

支持源碼多重加密將網站生成EXE文件運行封裝網站源碼演示運行

php整站打包工具 php網站打包成exe php網站生成exe php項目怎麽打包成exe php整站打包程序 PHP打包器應用場景:做好網站程序後,發布給用戶看,但是不想泄露源碼,可以選擇“封裝源碼生成EXE文件”,建議封裝前先用zend等加密代碼,可以起到雙重保險,對方在破解軟件的同