知識圖譜推理與實踐（1）

由於工作原因，需要在系統裡建立圖譜推理功能，因此簡單學習了浙江大學陳華鈞教授知識圖譜導論課程課件，這裡記錄下學習筆記。

知識圖譜推理的主要方法

• 基於描述邏輯的推理（如DL-based）
• 基於圖結構和統計規則挖掘的推理（如： PRA、 AMIE）
• 基於知識圖譜表⽰學習的推理（如： TransE）
• 基於概率邏輯的⽅法（如： Statistical Relational Learning）

基於符號邏輯的推理——本體推理

傳統的符號邏輯推理中主要與知識圖譜有關的推理手段是基於描述邏輯的本體推理。
描述邏輯主要被⽤來對事物的本體進⾏建模和推理，⽤來描述和推斷概念分類及其概念之間的關係。

主要方法：
- 基於表運算（Tableaux）及改進的⽅法： FaCT++、 Racer、 Pellet Hermit等
- 基於Datalog轉換的⽅法如KAON、 RDFox等
- 基於產⽣式規則的演算法（如rete）： Jena 、 Sesame、 OWLIM等

基於圖結構和統計規則挖掘的推理

主要方法：
• 基於路徑排序學習⽅法(PRA， Path ranking Algorithm)
• 基於關聯規則挖掘⽅法(AMIE)

基於知識圖譜表示學習的關係推理

將實體和關係都表示為向量
通過向量之間的計算代替圖的遍歷和搜尋來預測三元組的存在，由於向量的表示已經包含了實體原有的語義資訊，計算含有⼀定的推理能⼒。

可應⽤於連結預測，基於路徑的多度查詢等

基於概率邏輯的⽅法——Statistical Relational Learning

概率邏輯學習有時也叫Relational Machine Learning (RML)，關注關係的不確定性和複雜性。
通常使用Bayesian networks or Markov networks

基於符號邏輯的推理

本體概念推理

圖譜中基於RDF來作為資源描述語言，RDF是Resource Description Framework的簡稱。

但是RDF表示關係層次受限，因此有了RDFS,在RDF的基礎上，新增了Class, subClassOf, type, Property, subPropertyOf, Domain, Range

詞彙，可以更好的表述相關關係。

基於RDFS，可以做一些簡單的推理

OWL在RDFS的基礎上，進一步擴充套件了一些複雜型別、約束：

因此，我們也叫OWL為本體語言：

OWL是知識圖譜語言中最規範，最嚴謹，表達能力最強的語言
基於RDF語法，使表示出來的文件具有語義理解的結構基礎
促進了統一詞彙表的使用，定義了豐富的語義詞彙
允許邏輯推理

OWL的描述邏輯系統：

一個描述邏輯系統包括四個基本的組成部分
- 1）最基本的元素：概念、關係和個體（例項），
- 2) TBox術語集 (概念術語的公理集合) - 泛化的知識
  - 描述概念和關係的知識，被稱之為公理 (Axiom)
- 3) ABox斷言集 (個體的斷言集合) --具體個體的資訊
  - ABox包含外延知識 (又稱斷言 (Assertion))，描述論域中
    的特定個體
- 4) TBox和ABox上的推理機制
不同的描述邏輯系統的表示能力與推理機制由於對這四個組成部分的不同選擇而不同

描述邏輯與OWL的對應：

推理就是通過各種方法獲取新的知識或者結論，這些知識和結論滿足語義。

OWL本體推理

可滿足性
- 本體可滿足性：檢查一個本體是否可滿足，即檢查該本體是否有模型。
- 概念可滿足性，檢查某一概念的可滿足性，即檢查是否有模型，使得對該概念的解釋不是空集。

分類(classification)，針對Tbox的推理，計算新的概念的包含關係

例項化（materialization）,即計算屬於某個概念或關係的所有例項的集合。

例子：

典型的推理演算法： Tableaux，適用於檢查某一本體概念的可滿足性，以及例項檢測，基本思想是通過一系列規則構建Abox，以檢測可滿足性，或者檢測某一例項是否存在於某概念，基本思想類似於一階邏輯的歸結反駁。

基於邏輯程式設計改寫的方法

本體推理的侷限:

(1) 僅支援預定義的本體公理上的推理 (無法針對自定義的詞彙支援靈活推理)
(2) 使用者無法定義自己的推理過程

因此，引入規則推理

(1) 可以根據特定的場景定製規則，以實現使用者自定義的推理過程
(2) Datalog語言可以結合本體推理和規則推理

Datalog的語法：

原子（atom）
- p(t1,t2,...,tn)
- p是謂詞，n是目數，ti是項
- 例如has_child(x,y)
規則（rule）
- H:-B1,B2,...,Bm
- has_child(X, Y) :−has_son(X, Y)
事實(Fact)
- F(c1,c2,...cn):-
- 沒有體部且沒有變數的規則
- 例如：has_child(Alice,Bob):-

Datalog程式是規則的集合：

has_child(X, Y) : −has_son(X, Y).
has_child(Alice, Bob) : −

Datalog 推理舉例：

相關工具：

基於產生式規則的方法

產生式系統，一種前向推理系統，可以按照一定機制執行規則從而達到某些目標，與一階邏輯類似，也有區別，可以應用來做自動規劃和專家系統。

產生式系統的組成：

事實集合 (Working Memory)
產生式/規則集合 (Production Memory, PM)
推理引擎

產生式表示：

IF conditions THEN actions

conditions是由條件組成的集合，又稱為LHS（Left Hand Side）
actions是由動作組成的序列，又稱為RHS（Right Hand Side)

LHS，是條件的集合，各條件是且（AND）的關係，當所有條件均被滿足，則該規則觸發。
條件形如(type attr1: spec1 attr2:spec2)條件的形式：

原子 (person name:alice)
變數（person name:x)
表示式 (person age:[n+4]
布林 (person age:{>10})
約束的與、或、非

RHS，是執行動作（action）的序列，執行時依次執行。動作的種類有ADD pattern，Remove i，Modify i，可以理解為對WME（Working Memory）的CUD；

產生式舉例：

IF (Student name: x)
Then ADD (Person name: x)

也可以寫作：

(Student name: x) ⇒ ADD (Person name: x)

推理引擎

➤ 控制系統的執行：

模式匹配，用規則的條件部分匹配事實集中的事實，整個LHS都被滿足的規，則被觸發，並被加入議程(agenda)
解決衝突，按一定的策略從被觸發的多條規則中選擇一條
執行動作，執行被選擇出來的規則的RHS，從而對WM進行一定的操作

產生式系統=事實集+產生式集合+推理引擎

產生式系統執行流程

模式匹配——RETE演算法

將產生式的LHS組織成判別網路形式
用空間換時間

相關工具介紹

Drools
Jena 提供了處理RDF、 RDFS、 OWL資料的介面，還提供了一個規則引擎

Model m = ModelFactory.createDefaultModel(); 
Reasoner reasoner = new
GenericRuleReasoner(Rule.rulesFromURL("file:rule.txt"));
InfModel inf = ModelFactory.createInfModel(reasoner, m)

Inductive Reasoning – 基於圖的方法

PRA

➤ 將連線兩個實體的路徑作為特徵來預測其間可能存在的關係

• 通用關係學習框架 (generic relational learning framework)

路徑排序演算法 – Path Ranking Algorithm (PRA)

TransE

知識圖譜嵌⼊模型： TransE

TransE(Translating Embeddings for Modeling Multi-relational Data. NIPS 3013)

⽬標函式：

損失函式：

知識圖譜嵌⼊模型：預測問題

測試三元組( h, r, t )
尾實體預測( h, r, ? )
頭實體預測( ?, r, t )

PRA vs. TransE

基於Jena實現演繹推理

構建model

NO BB, show code：

Model myMod = ModelFactory.createDefaultModel();
String finance = “http://www.example.org/kse/finance#”;

// 實體
Resource shb = myMod.createResource(finance + "孫巨集斌");
Resource rczg = myMod.createResource(finance + "融創中國");


// 關係

Property control = myMod.createProperty(finance + "執掌");

// 加入三元組
myMod.add(shb, control, rczg);

上圖所示的圖譜，包含如下的三元組：

finance :孫巨集斌 finance :control finance :融創中國
finance :賈躍亭 finance :control finance :樂視網
finance :融創中國 rdf:type finance :地產公司
finance :地產公司 rdfs:subclassOf finance:公司
finance:公司 rdfs:subclassOf finance:法人實體
finance:孫巨集斌 rdf:type finance:公司
finance:孫巨集斌 rdf:type finance:人
finance :人 owl:disjointWith finance:公司

我們可以依次加入，程式碼略。

新增推理機

jena推理使用的是InfModel，可以基於Model構造，實際上在原來的Model之上加了個RDFS推理機

InfModel inf_rdfs = ModelFactory.createRDFSModel(myMod);

• 上下位推理

通過listStatements來獲取是否有滿足條件的三元組，從而實現判斷，subClassOf是RDFS裡的vob，因此使用RDFS.subClassOf。

public static void subClassOf(Model m, Resource s, Resource o) {
for (StmtIterator i = m.listStatements(s, RDFS.subClassOf, o); i.hasNext(); ) {
Statement stmt = i.nextStatement();
System.out.println(" yes! " );
break;
}
}

subClassOf(inf_rdfs, myMod.getResource(finance+"地產公司"),myMod.getResource(finance+”法人實體"));

• 針對類別的推理，OWL推理機可以針對個體類別做出完備推理，即補充完整該個體的所有類別；在查詢的時候，可以直接打印出所有類別！

首先構建owl推理機：

Reasoner reasoner = ReasonerRegistry.getOWLReasoner();
InfModel inf_owl = ModelFactory.createInfModel(reasoner, myMod);

然後執行類別推理

public static void printStatements(Model m, Resource s, Property p, Resource o) {
for (StmtIterator i = m.listStatements(s,p,o); i.hasNext(); ) {
Statement stmt = i.nextStatement();
System.out.println(" - " + PrintUtil.print(stmt));
}
}
printStatements(inf_owl, rczg, RDF.type, null);

• 不一致檢測, jena的另一個常用推理就是檢驗data的不一致。

Model data = FileManager.get().loadModel(fname);
Reasoner reasoner = ReasonerRegistry.getOWLReasoner();
InfModel inf_owl = ModelFactory.createInfModel(reasoner, myMod);
ValidityReport validity = inf_owl.validate();
if (validity.isValid()) {
System.out.println(“沒有不一致");
} else {
System.out.println(“存在不一致，如下： ");
for (Iterator i = validity.getReports(); i.hasNext(); ) {
System.out.println(" - " + i.next());
}
}

作者：Jadepeng
出處：jqpeng的技術記事本--http://www.cnblogs.com/xiaoqi
您的支援是對博主最大的鼓勵，感謝您的認真閱讀。
本文版權歸作者所有，歡迎轉載，但未經作者同意必須保留此段宣告，且在文章頁面明顯位置給出原文連線，否則保留追究法律責任的權利。

相關推薦

知識圖譜推理與實踐（1）

由於工作原因，需要在系統裡建立圖譜推理功能，因此簡單學習了浙江大學陳華鈞教授知識圖譜導論課程課件，這裡記錄下學習筆記。知識圖譜推理的主要方法 • 基於描述邏輯的推理（如DL-based） • 基於圖結構和統計規則挖掘的推理（如： PRA、 AMIE） • 基於知識圖譜表⽰學習的推理（如： TransE）

知識圖譜學習與實踐（1）——知識圖譜的演化過程

1 引言知識圖譜是一個包含很多技術內容的知識體系，總的來說，是處理關聯的知識，核心是資料，但強調了資料之間的關聯關係。簡單來看，可以認為是資料庫或知識庫，和語義網有著千絲萬縷的聯絡。知識圖譜是由谷歌首先提出來的，用於優化它的搜尋能力，之後，獲得了蓬勃的發展，研究的人也越來越多。知識圖譜的出

知識圖譜學習與實踐（2）——知識圖譜資料模型的構建

資料模型就是資料組織方式，是構建知識圖譜首要解決的問題，無論是開放域的知識圖譜還是行業的知識圖譜，都需要收集大量的資料，這些資料的收集是有選擇性的，這個選擇的依據就是資料模型。資料模型，也可以稱為知識表達模型，解決知識圖譜如何組織資料的問題，是資料的底層架構，是一個知識體系框架，能夠涵蓋住知識圖譜所有的資料，

知識圖譜學習與實踐（3）——知識表示

構建知識圖譜的時候，首先是要建立知識表達的的資料模型，也就是知識圖譜整個的資料組織體系，主要是資料的分類及層次關係，還有屬性及屬性的關係。資料組織體系建立之後，我們就要考慮資料如何表達的問題，這種表達方式應該是既可以讓人們容易理解，也要讓計算機能夠理解和使用。 1 Linked Data

知識圖譜學習與實踐（5）——Protégé使用入門

1 Protégé簡介 Protégé是一個本體建模工具軟體，由斯坦福大學基於java語言開發的，屬於開放原始碼軟體。軟體主要用於語義網中本體的構建和基於本體的知識應用，是本體構建的核心開發工具，最新版本為5.5.0（截至2019年7月）。 Prot

知識圖譜學習與實踐（7）——網頁資料抽取（包裝器的使用）

網際網路中蘊含著大量的資料資源，這些資料存在於html的程式碼之中，如何從浩瀚的程式碼中提取有效的資料，針對不同的情況，可以採用多種方法來實現網頁資料的提取。 1 手工方法網頁呈現資料的

推薦系統演算法理論與實踐（1）

舉例：電影推薦系統電影評分表張三李四王五小明小時代 1 5 ？ 5 精武英雄？ 3 5 4 摔跤吧，爸爸 1 5 ？ 5 死侍？

ELMo模型的理解與實踐（1）

論文：2018 NAACL 《Deep Contextualized Word Representations》一、優點 1.學習單詞的複雜特徵，包括語法、語義 2.學習在不同上下文下的一詞多義二、模型 1.Bidirectional language models（BLM）

基於R的資料探勘方法與實踐（1）——資料準備

1、資料檢查資料檢查是資料探勘的第1步，從不同的維度檢查資料，找出其中有問題的資料以便對其進行修正。 1.1 資料型別檢視資料的構成與形態，尤其是各列的屬性。 > library(MASS) > data(ChickWeight) > str(Chic

知識圖譜的筆記之一（1）

好記星不如爛筆頭，而且最近由於專案的需要，看了一些知識圖譜的資料，突發奇想在這裡記錄下自己的學習過程，剛開始寫會有很多的缺陷，還請讀者給出寶貴的建議；下面就言歸正傳，開始寫筆記了。在我們在百度裡面搜尋知識圖譜，都會從Google在2012年釋出的一篇部落格的開始說起的，然

吳裕雄 python深度學習與實踐（1）

span 實踐 __init__ class col tar pri png self #coding = utf8 import threading,time count = 0 class MyThread(threading.Thread): def

知識圖譜推理與實踐 (2) -- 基於jena實現規則推理

本章，介紹基於jena的規則引擎實現推理，並通過兩個例子介紹如何coding實現。規則引擎概述 jena包含了一個通用的規則推理機，可以在RDFS和OWL推理機使用，也可以單獨使用。推理機支援在RDF圖上推理，提供前向鏈、後向鏈和二者混合執行模式。包含RETE engine 和 one tabled d

Chap03知識抽取與挖掘（1）

eva image str spa 實體方法深度學習 ron int 大綱 1.知識抽取任務定義和相關比賽 2.面向結構化數據的知識抽取 3.面向半結構化數據的知識抽取 4.實踐展示：基於百科數據的知識抽取競賽：MUC ACE KBP SemEval

模型處理實踐（1）——simplygon下載與安裝

一、simplygon 1.Simplygon介紹 1.1 簡介 Simplygon是一個平臺，利用它可對模型和紋理之類的 3D 素材進行不同目的的優化，無需手動操作（或僅需少量操作）。可使用 Simplygon 建立 LOD 鏈、減少繪製呼叫、將多個高精度模型

【專欄】- 知識圖譜：圖資料（neo4j）從0到1

----關注我，得永生------ ♀♀♀如果學習是做愛♀♀♀ ♂♂♂請你記住要深入♂♂♂ ----ME----聯絡方式------ 數學建模:虐雲建模網機器學習Q群：249885734 PythonQ群：867300100

軟件工程綜合實踐（1）

creat from tro log ble nav .com jdbc logs 軟件工程綜合實踐（1） 1.學習回顧 mysql 使用 a. sql 文的使用（增、刪、改、查詢）創建數據庫 mybatis a1. 表的創建保存的表名 user

JVM高級特性與實踐（二）：對象存活判定算法（引用）與回收

添加引用計數器程序計數器正文 bmc 進入 block 結構內存關於垃圾回收器GC（Garbage Collection），多數人意味它是Java語言的伴生產物。事實上，GC的歷史遠比Java悠遠，於1960年誕生在MIT的Lisp是第一門真正使用內存動態分配和垃

三維渲染引擎設計與實踐（四）

方式 lora 扇面多個幀緩存 binding osg smo tco 五、繪制幾何對象和文字幀緩存（Frame Buffer）為用戶與顯示設備交互的一個接口，將顯示的畫面抽象成一塊可以進行讀寫操作的內存區域。幀緩存的每一個存儲單元都對應顯示屏上的一個像素。整個緩存

三維渲染引擎設計與實踐（八）

窗口 drag 支持機制對象 window ani handle ima 視頻 8.2三維人機交互工具 osg實現了三維場景的漫遊以及場景中三維對象的操縱。 8.2.1漫遊器 osgGA::MatrixManipulator類漫遊器也是事件處理器GUIEventHand

Openstack實踐（1）安裝部署第一個實例及neutron網絡

ipv6 dir hostname 鏈接 segment 訪問外網繼續過程命名版權聲明：本文為博主原創文章，歡迎轉載，轉載請註明作者、原文超鏈接，博主地址：http://www.cnblogs.com/SuperXJ/ 如何快速部署使用op