1. 程式人生 > >你需要學好知識圖譜——用AI技術連線世界

你需要學好知識圖譜——用AI技術連線世界

微信公眾號

關鍵字全網搜尋最新排名

【機器學習演算法】:排名第一

【機器學習】:排名第一

【Python】:排名第三

【演算法】:排名第四

立即參團

原價 ¥899.00

50人以上  ¥499.00

100人以上  ¥399.00

點選文末閱讀原文,立即參團

640.png?wxfrom=5&wx_lazy=1

《知識圖譜》第一期 

課程簡介:

本次的知識圖譜課程主要包括三大部分:

      1)知識圖譜的工程方法論。指導學員瞭解並掌握知識圖譜的基本概念和發展歷史,梳理清知識圖譜的技術體系,掌握知識圖譜的核心技術原理,建立知識圖譜工程的方法論思維。

      2)知識圖譜的實戰技術。從實戰出發,圍繞知識表示、知識抽取、語義搜尋、知識問答、知識推理、知識融合等系統性介紹知識圖譜相關的實戰技術,使得學員具備研發知識圖譜相關應用的基礎能力。

      3)知識圖譜的典型應用。結合醫療、金融、電商等實際應用場景,介紹知識圖譜各個技術點的實際應用落地方式,使得學員具備結合自身背景開展知識圖譜技術實踐的應用能力。

主講老師:

王昊   著名知識圖譜專家

博士畢業於上海交通大學,CCF術語專委會執委,中文資訊學會語言與知識計算委員會副祕書長,共發表75餘篇高水平論文。中文知識圖譜zhishi.me創始人,OpenKG聯盟發起人之一,其帶隊構建的語義搜尋系統在Billion Triple Challenge中榮獲全球第2名;在著名的本體匹配競賽OAEI的實體匹配任務中斬獲得全球第1名。曾主持並參與多項國家自然科學基金、863重大專項和國家科技支撐專案,以學術負責人身份參與Paypal、Google、Intel、IBM、百度等企業的合作專案。

開課時間:2017年10月24日

學習方式:

線上直播,共11次

每週2次(週二、四晚上20:00-22:00

直播後提供錄製回放視訊,線上反覆觀看,有效期1年

課程大綱

第一課:  知識圖譜概論  

    1.  知識圖譜的起源和歷史
    2.  典型知識庫專案簡介
    3.  知識圖譜應用簡介
    4.  本次課程覆蓋的主要範圍:知識表示與建模、知識抽取與挖掘、知識儲存、知識融合、知識推理、語義搜尋、知識問答和行業知識圖譜應用剖析等內容。


第二課:  知識表示與知識建模 

    1.  早期知識表示簡介
    2.  基於語義網的知識表示框架
         a.  RDF和RDFS


         b.  OWL和OWL2 Fragments
         c.  SPARQL查詢語言
         d.  Json-LD、RDFa、HTML5 MicroData等新型知識表示
    3.   典型知識庫專案的知識表示
    4.   基於本體工具(Protege)的知識建模最佳實踐

第三課:  知識抽取與挖掘I

    1.  知識抽取任務定義和相關比賽:實體識別、關係抽取和事件抽取
    2.  面向結構化資料(關係資料庫)的知識抽取,包括D2RQ和R2RML等轉換與對映規範與技術介紹
    3.  面向半結構化資料(Web tables, 百科站點等)的知識抽取
         a.  基於正則表示式的方法
         b.  Bootstrapping和Wrapper Induction介紹
    4.  實踐展示:基於百科資料的知識抽取


第四課:  知識抽取與挖掘II

    1.  面向非結構化資料(文字)的知識抽取
         a.  基於本體的知識抽取,包括NELL和DeepDive系統介紹
         b.  開放知識抽取,包括TextRunner、Reverb和OLLIE等系統介紹
    2.  知識挖掘
         a.  知識內容挖掘:實體消歧與連結
         b.  知識結構挖掘:關聯規則挖掘與社群發現
         c.  知識表示學習與連結預測,包括TransE和PRA等演算法介紹    


第五課:  知識儲存

    1.  基於關係資料庫的儲存設計,包括各種表設計和索引建立策略
    2.  基於RDF的圖資料庫介紹
         a.  開源資料庫介紹:Apache Jena、Sesame、gStore、RDF-3X等
         b.  商業資料庫介紹:Virtuoso、AllegroGraph、BlazeGraph等
    3.   原生圖資料庫介紹,包括Neo4j、OrientDB、Titan和Cayley等
    4.  實踐展示:使用Apache Jena儲存百科知識,並使用Fuseki構建圖譜查詢服務


第六課:  知識融合

    1.  知識融合任務定義和相關競賽:本體對齊和實體匹配
    2.  本體對齊基本流程和常用方法
         a.  基於Linguistic的匹配
         b.  基於圖結構的匹配
         c.  基於外部知識庫的匹配
    3.  實體匹配基本流程和常用方法
         a.  基於分塊的多階段匹配
         b.  基於規則(配置或通過學習)的實體匹配
    4.  知識融合工具介紹:包括Falcon-AO、Silk、PARIS、DEDUPE、LIMES和KnowledgeVault
    5.  實踐展示:使用Falcon-AO融合百度百科與維基百科中的知識


第七課:  知識推理

  1.  本體知識推理簡介與任務分類,包括概念可滿足性、概念包含、例項分類和一致性檢測等
    2.  本體推理方法與工具介紹
         a.  基於Tableaux運算的方法:Fact++、Racer、Pellet和Hermit等
         b.  基於一階查詢重寫的方法:Ontology-based Data Access的Ontop等
         c.  基於產生式規則的方法(如Rete):Jena、Sesame和OWLIM等
         d.  基於邏輯程式設計(如Datalog)改寫的方法:KAON2和RDFox等
     3.  實踐展示:使用Jena完成百科知識上的上下位推理、缺失類別補全和一致性檢測等


第八課:  語義搜尋

   1.  語義搜尋概述,包括Knowledge Card、Rich Snippet、Facebook Graph Search等
   2.  基於語義標註的網頁搜尋
         a.  Web Data Commons專案介紹
         b.  排序演算法介紹,擴充套件BM25
   3.  基於圖譜的知識搜尋
         a.  本體搜尋(ontology lookup)
         b.  探索式知識檢索,包括查詢構造、結果排序和分面(facets)推薦
   4.  知識視覺化,包括本體、查詢、結果等的展現方式和視覺化分析
   5.  實踐展示:使用ElasticSearch實現百科資料的語義搜尋


第九課: 知識問答I

    1.  知識問答概述和相關資料集(QALD和WebQuestions)
    2.  知識問答基本流程
    3.  知識問答主流方法介紹
         a.  基於模板的方法,包括模板定義、模板生成和模板匹配等步驟
         b.  基於語義解析的方法,包括資源對映,邏輯表示式候選生成與排序等
         c.  基於深度學習的方法


第十課:  知識問答II

    1.  IBM Watson問答系統及核心元件詳細解讀
         a.  問句理解
         b.  候選答案生成
         c.  基於證據的答案排序
    2.  實踐展示:面向百科知識的問答baseline實現


第十一課:  行業知識圖譜應用

    1.  行業知識圖譜特點
    2.  行業知識圖譜應用,包括金融、醫療、數字圖書館等領域應用
    3.  行業知識圖譜構建與應用的挑戰
    4.  行業知識圖譜生命週期定義和關鍵元件

常見問題:

Q參加本門課程有什麼要求

A: 有一定Python程式設計能力,有基本大學數學基礎。

Q: 有課外學習資料嗎?

A: 有,老師會根據情況提供講義,並給出進階學習資源與專案的建議。

參團!諮詢!檢視課程!

就點這裡!

640?