1. 程式人生 > >知識圖譜(RDF)大型資料集 網路下載資源整合

知識圖譜(RDF)大型資料集 網路下載資源整合

不定期更新

一、DBPedia

簡介:

DBpedia 是一個很特殊的語義網應用範例,它從維基百科(Wikipedia)的詞條裡擷取出結構化的資料,以強化維基百科的搜尋功能,並將其他資料集連結至維基百科。透過這樣的語意化技術的介入,讓維基百科的龐雜資訊有了許多創新而有趣的應用,例如手機版本、地圖整合、多面向搜尋、關係查詢、檔案分類與標註等等。DBpedia 同時也是世界上最大的多領域知識本體之一,也是 Linked Data 的一部分,美國科技媒體 ReadWriteWeb 也將 DBpedia 選為2009 年最佳的語義網應用服務。

DBpedia 2014 版的資料集擁有超過458萬的物件,包括144萬5000人、73萬5000個地點、12萬3000張唱片、8萬7千部電影、1萬9000種電腦遊戲、24萬1000個組織、25萬1000種物種和6000個疾病。其資料不僅被BBC、路透社、紐約時報所採用,也是Google、Yahoo等搜尋引擎檢索的物件。

二、YAGO

簡介:

As of 2012, YAGO3 has knowledge of more than 10 million entities and contains more than 120 million facts about these entities. The information in YAGO is extracted from Wikipedia (e.g., categories, redirects, infoboxes), WordNet (e.g., synsets, hyponymy), and GeoNames. The accuracy of YAGO was manually evaluated to be above 95% on a sample of facts.

[To integrate it to the linked data cloud, YAGO has been linked to the DBpedia ontology[6] and to the SUMO ontology.

YAGO3 is provided in Turtle and tsv formats. Dumps of the whole database are available, as well as thematic and specialized dumps. It can also be queried through various online browsers  and through a 

SPARQL endpoint hosted by OpenLink Software. The source code of YAGO3 is available on GitHub.

YAGO has been used in the Watson artificial intelligence system.

三、wikipedia

簡介:就不用多說了。

四、PDD

簡介:

一個國內團隊開發的醫療相關資料集,PDD Graph is a Patient-Disease-Drug Graph, Bridging MIMIC-III and Linked Data Cloud.