1. 程式人生 > >自然語言處理(一)NLP概述

自然語言處理(一)NLP概述

NLP概述

NLP是利用計算機為工具,對人類特有的書面形式和口頭形式的自然語言的資訊進行各種型別處理和加工的技術.

NLP內容結構

NLP基礎技術

詞法分析

詞法分析目的是從句子中分出單詞,找出詞彙的各個詞素,從中獲得單詞的語言學資訊並確定單詞的詞性. 詞法分析是很多中文資訊處理任務的必要步驟.

  • 自動分詞
  • 命名實體識別
  • 詞性標註

句法分析

句法分析是對句子和短語結構進行分析,如句子的形式結構:主語、謂語、賓語等. 句法分析是語言學理論和實際的自然語言應用的一個重要橋樑. 一個實用的、完備的、準確的句法分析將是計算機真正理解自然語言的基礎.

  • 短語結構分析(賓州樹庫)
  • 依存分析

語義分析

解釋自然語言句子或篇章各部分(詞、片語、句子、段落、篇章)的意義. 目前語義計算的理論、方法、模型尚不成熟.

  • 詞義消歧(詞)
  • 語義歸納、推理(詞)
  • 語義角色標註(句子)

篇章分析

指超越單個句子範圍的各種可能分析,包括句子(語段)之間的關係以及關係型別的劃分,段落之間的關係的判斷,跨越單個句子的詞與詞之間的關係分析,話題的繼承與變遷等.

NLP核心應用

  • 機器翻譯(Machine translation, MT)
  • 資訊檢索(Information Retrieval)
  • 資訊抽取(Information Extraction)
  • 自動文摘(Automatic summarization/abstracting)
  • 問答系統(Question-Answering system)
  • 閱讀理解(Machine Reading)
  • 文件分類(Document categorization)
  • 情感分類(Sentimental classification)
  • 資訊推薦與過濾(Formation Recommendation and Filtering)

NLP技術及應用架構

NLP領域的學術會議

  • ACL(Association of Computational Linguistics)
  • Coling(International Conference on Computational Linguistics)
  • EMNLP(Conference on Empirical Methods in Natural language Processing)
  • EACL(European Chapter of ACL)
  • IJCNLP(International Joint Conference on Natural language Processing)
  • SIGIR(SIG Information Retrieval)
  • TREC(Text REtrievalConference)
  • JSCL(全國計算語言學聯合學術會議)

國內NLP研究組

參考資料

中國科學院大學-NLP課程課件(IIE胡玥老師主講)