GitHub專案:自然語言處理領域的相關乾貨整理
阿新 • • 發佈:2019-02-08
自然語言處理(NLP)是電腦科學,人工智慧,語言學關注計算機和人類(自然)語言之間的相互作用的領域。本文作者為NLP初學者整理了一份龐大的自然語言處理領域的概覽。選取的參考文獻與資料都側重於最新的深度學習研究成果。這些資源能為想要深入鑽研一個NLP任務的人們提供一個良好的開端。
指代消解
論文自動評分
- 論文:Automatic Text Scoring Using Neural Networks(使用神經網路的自動文字評分):https://arxiv.org/abs/1606.04289
- 挑戰:Kaggle:The Hewlett Foundation: Automated Essay Scoring(Kaggle:The Hewlett Foundation:論文自動評分系統):
自動語音識別
自動摘要
共指消解
- 論文:Deep Reinforcement Learning for Mention-Ranking Coreference Models(對Mention-Ranking的共指模型進行深度強化學習:https://arxiv.org/abs/1609.08667
- 論文:Improving Coreference Resolution by Learning Entity-Level Distributed Representations(通過學習實體級分散式表示來改善相關的解決方案):https://arxiv.org/abs/1606.01323
- 挑戰:CoNLL 2012 Shared Task: Modeling Multilingual Unrestricted Coreference in OntoNotes(CoNLL 2012共享任務:在OntoNotes中對多語言的不受限制的共指進行建模):http://conll.cemantix.org/2012/task-description.html
- 挑戰:CoNLL 2011 Shared Task: Modeling Unrestricted Coreference in OntoNotes(CoNLL 2011共享任務:在OntoNotes中對多語言的不受限制的共指進行建模):http://conll.cemantix.org/2011/task-description.html
語法錯誤校正
字素轉換到音素
語種識別
語言建模
詞形還原
脣語辨別
機器翻譯
命名實體識別
釋義檢測
語法分析
詞性標記
拼音與中文轉換
問答系統
關係提取
語義角色標記
語句邊界消歧
情緒分析
源分離
說話者識別
語音分段
語音合成
語音增強
詞幹提取
術語提取
- 論文: Neural Attention Models for Sequence Classification: Analysis and Application to KeyTerm Extraction and Dialogue Act Detection(序列分類的神經提示模型:分析和應用於關鍵詞提取和對話法檢測):https://arxiv.org/pdf/1604.00077.pdf
文字簡化
文字蘊涵
音譯
詞嵌入
詞彙預測
- 論文: The prediction of character based on recurrent neural network language model(基於迴圈神經網路語言模型的字元預測):http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7960065
- 論文: An Embedded Deep Learning based Word Prediction(一個基於深度學習的詞彙預測):https://arxiv.org/abs/1707.01662
- 論文:Evaluating Word Prediction: Framing Keystroke Savings(評估單詞預測:框擊鍵儲存):http://aclweb.org/anthology/P08-2066
- 專案: Word Prediction using Convolutional Neural Networks—can you do better than iPhone™ Keyboard?(使用卷積神經網路的詞彙預測——你能比iPhone鍵盤做得更好嗎?):https://github.com/Kyubyong/word_prediction
詞分割
詞義消歧