哈工大SCIR三篇長文被AAAI-19錄用
AAAI-19 (Thirty-Third AAAI Conference onArtificial Intelligence) 將於2019年1月27日至2月1日在美國夏威夷舉行。AAAI是人工智慧領域的頂級國際會議,CCF A類會議,每年舉辦一次。今年AAAI-19大會共計收到7700個有效投稿,其中7095篇論文進入到評審環節,最終有1150篇論文被大會錄用,總錄用率僅為16.2%,創歷史新低。
哈爾濱工業大學社會計算與資訊檢索研究中心共有3篇長文被AAAI-19錄用 ,下面是論文列表及介紹:
• A Neural Approach for Verb Phrase Ellipsis Resolution
作者:張偉男,張嶽,劉元興,狄東林,劉挺
動詞短語省略(VPE)是一種語言現象,其中一些動詞短語作為句法成分被省略並且通常由輔助動詞引用。先前的工作主要集中在手動構建從輔助詞、句法樹等中提取的特徵。然而,先前的工作並沒有很好地解決特徵表示的優化,連續特徵的有效性和特徵的自動組合。在本文中我們嘗試探索神經模型對VPE消解任務(包括管道和端到端過程)的優勢,並比較統計模型和神經模型之間的差異。我們使用兩種神經模型(MLP和Transformer)分別進行VPE檢測和消解的子任務。實驗結果表明,神經模型在子任務和端到端結果方面均優於最先進的基線。
• Exploring Answer Stance Detection with Recurrent Conditional Attention
作者:袁建華,趙妍妍,秦兵,許靜芳
從社群問答QA對中提取人們對問題的觀點立場傾向性是一個有意思的問題。不同於以往的立場分析任務,我們這裡的target不是給定的實體(entity)或者宣告(claim),而是整個問題,因而更難去建模依賴問題的(target-dependent)回答句表示。為此,我們提出一種迴圈條件注意力結構(Recurrent Conditional Attention),在迴圈閱讀QA對的過程中,提煉Q、A語義表示,挖掘Q-A之間的相互依賴關係,逐步推敲獲得真實的觀點傾向。在人工收集標註的社群問答立場傾向性資料集上(搜狗公司提供),相比四個強基線模型,我們的RCA模型在macro-f1值平均提高2.90%,在micro-f1值上平均提高2.66%。
• Gaussian Transformer: A Lightweight Approach for Natural Language Inference
作者:郭茂盛,張宇,劉挺
自然語言推理 (Natural Language Inference, NLI) 是一個活躍的研究領域,許多基於迴圈神經網路(RNNs),卷積神經網路(CNNs),self-attention 網路 (SANs) 的模型為此提出。儘管這些模型取得了不錯的表現,但是基於RNNs的模型難以並行訓練,基於 CNNs 的模型需要耗費大量的引數,基於 self-attention 的模型弱於捕獲文字中的區域性依賴。為了克服這個問題,我們向 self-attention 機制中引入高斯先驗 (Gaussian prior) 來更好的建模句子的區域性結構。接著,我們為NLI任務提出了一個高效的、不依賴迴圈或卷積的網路結構,名為 Gaussian Transformer。它由用於建模區域性和全域性依賴的編碼模組,用於收集多步推理的高階互動模組,以及一個引數輕量的對比模組組成。試驗結果表明,我們的模型在 SNLI 和 MultiNLI 資料集上取得了當前最高的成績,同時大大減少了引數數量和訓練時間。此外,在 HardNLI 資料集上的試驗表明我們的方法較少受到標註的人工痕跡 (Annotation artifacts) 影響。
同時,哈工大訊飛聯合實驗室(公眾號:哈工大訊飛聯合實驗室)的一篇長文被AAAI-19錄用,祝賀!
• Convolutional Spatial Attention Model for Reading Comprehension with Multiple-Choice Questions
作者:陳致鵬,崔一鳴,馬文濤,王士進,胡國平
選擇型的機器閱讀理解需要機器閱讀一個篇章並根據問題從多個候選答案中選出正確答案。本文中,我們提出一種基於卷積空間注意力的模型(Convolutional Spatial Attention,CSA)用來解決中國初高中英文閱讀理解選擇題。該模型可以充分的提取篇章、問題以及選項之間的互資訊,然後使用互資訊增強各自的向量空間表示。除此之外,為了結合不同向量空間的注意力資訊,我們使用不同的卷積視窗動態的從不同的空間注意力矩陣上抽取特徵。實驗結果表明,CSA模型在RACE(中國初高中英文閱讀理解資料)和SemEval-2018 Task11(國際語義評測比賽中的閱讀理解任務)兩個任務都取得了顯著效能提升,證明了我們的方法的創新性和有效性。
相關資料
Artificial Intelligence
在學術研究領域,人工智慧通常指能夠感知周圍環境並採取行動以實現最優的可能結果的智慧體(intelligent agent)
來源: Russell, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach.
Neural Network
(人工)神經網路是一種起源於 20 世紀 50 年代的監督式機器學習模型,那時候研究者構想了「感知器(perceptron)」的想法。這一領域的研究者通常被稱為「聯結主義者(Connectionist)」,因為這種模型模擬了人腦的功能。神經網路模型通常是通過反向傳播演算法應用梯度下降訓練的。目前神經網路有兩大主要型別,它們都是前饋神經網路:卷積神經網路(CNN)和迴圈神經網路(RNN),其中 RNN 又包含長短期記憶(LSTM)、門控迴圈單元(GRU)等等。深度學習是一種主要應用於神經網路幫助其取得更好結果的技術。儘管神經網路主要用於監督學習,但也有一些為無監督學習設計的變體,比如自動編碼器和生成對抗網路(GAN)。
來源:機器之心
Convolutional neural network
卷積神經網路(Convolutional Neural Network, CNN)是一種前饋神經網路,它的人工神經元可以響應一部分覆蓋範圍內的周圍單元,對於大型影象處理有出色表現。卷積神經網路由一個或多個卷積層和頂端的全連通層(對應經典的神經網路)組成,同時也包括關聯權重和池化層(pooling layer)。這一結構使得卷積神經網路能夠利用輸入資料的二維結構。與其他深度學習結構相比,卷積神經網路在影象和語音識別方面能夠給出更好的結果。這一模型也可以使用反向傳播演算法進行訓練。相比較其他深度、前饋神經網路,卷積神經網路需要考量的引數更少,使之成為一種頗具吸引力的深度學習結構。 卷積網路是一種專門用於處理具有已知的、網格狀拓撲的資料的神經網路。例如時間序列資料,它可以被認為是以一定時間間隔取樣的一維網格,又如影象資料,其可以被認為是二維畫素網格。
來源:Goodfellow, I.; Bengio Y.; Courville A. (2016). Deep Learning. MIT Press. 維基百科
Information Retrieval
資訊檢索(IR)是基於用於查詢檢索資訊的任務。流行的資訊檢索模型包括布林模型、向量空間模型、概率模型和語言模型。資訊檢索最典型和最常見的應用是搜尋引擎。
來源:機器之心
probabilistic models
概率模型(Statistical Model,也稱為Probabilistic Model)是用來描述不同隨機變數之間關係的數學模型,通常情況下刻畫了一個或多個隨機變數之間的相互非確定性的概率關係。 從數學上講,該模型通常被表達為 ,其中 是觀測集合用來描述可能的觀測結果, 是 對應的概率分佈函式集合。
來源: 維基百科
推薦文章