Atitit 知識圖譜解決方案:提供完整知識體系架構的搜尋與知識結果overview
Atitit 知識圖譜解決方案:提供完整知識體系架構的搜尋與知識結果overview
網際網路正從僅包含網頁和網頁之間超連結的文件全球資訊網(Document Web)轉變成包含大量描述各種實體和實體之間豐富關係的資料全球資訊網(Data Web)。在這個背景下,Google、百度和搜狗等搜尋引擎公司紛紛以此為基礎構建知識圖譜,分別為Knowledge Graph、知心和知立方,來改進搜尋質量,從而拉開了語義搜尋的序幕。下面我將從以下幾個方面來介紹知識圖譜:知識圖譜的表示和在搜尋中的展現形式,知識圖譜的構建和知識圖譜在搜尋中的應用等,從而讓大家有機會了解其內部的技術實現和各種挑戰。
知識圖譜的表示和在搜尋中的展
方法的是清晰的,沒有什麼祕密。樓上各位都說的很清楚了:實體提取,關係提取,圖譜儲存和檢索。
實現一個大規模中文知識圖譜主要有兩部分,以“美人魚的導演是誰”為例:1. 建知識庫。爬百度百科,解析網頁,實體對齊。知識庫可以用RDF表示:三元組(美人魚,導演,周星馳),和對應的schema(movie, movie_director, person)。儲存方式有多種:可以Neo4j、MySQL,也可以自定義。抓取的網站越多,歧義消除/指代消解之類的事越多,找質量好的網站可以省很多事。半結構化的網頁到結構化的資料也是一大坑。2. 查詢理解。語義分析“美人魚的導演是誰” ,得到句法樹,生成檢索語句(與對應的儲存方式對應:SparQL-Neo4j / MySQL-SQL),檢索知識庫得到結果 “周星馳”。
作者:滿地大松果
Google在其官方部落格中宣稱:為了讓使用者能夠更快更簡單的發現新的資訊和知識,Google搜尋將釋出“知識圖譜”(Knowledge Graph)——可以將搜尋結果進行知識系統化,任何一個關鍵詞都能獲得完整的知識體系。 比如搜尋“Amazon”(亞馬遜河),一般的搜尋結果會給出和Amazon最相關的資訊。比如Amazon網站,因為網上關於它的資訊最多,但Amazon並不僅僅是一個網站,它還是全球流量最大的Amazon河流。如果在追溯歷史,它可能還是希臘女戰士一族的代稱。而這些結果未來都會在Google搜尋的“知識圖譜”中展現出來。
讓使用者能夠更快更簡單的發現新的資訊和知識,
1. 找到正確的結果。由於一個關鍵詞可能代表多重含義,所以知識圖譜會將最全面的資訊展現出來,讓使用者找到自己最想要的那種含義。
1.
最好的總結。有了知識圖譜,Google可以更好的理解使用者搜尋的資訊,並總結處相關的內容和主題。當你搜“瑪麗·居里”時,你不僅可以獲得這個關鍵詞的所有相關內容,還能獲得居里夫人的詳細生平介紹。
2.
3.
更深、更廣。由於“知識圖譜”會給出搜尋結果的完整知識體系,所以使用者往往會發現很多不知道的東西(知識)。當你搜索一個即將去旅行的地方時,可能你會發現一個以此命名的餐館,甚至還可能發現還有一本小說就叫這個名字,並且已經改編成了同名電影。
4.
Google的“知識圖譜”不僅僅會從Freebase、維基百科或全球概覽中獲得專業的資訊,同時還通過大規模的資訊搜尋分析來提高搜尋結果的深度和廣度。現在Google資料庫中包含超過5億個事物,不同事物之間的關係超過35億條。同時人們搜尋的越多,Google獲得的資訊也就越多越全面,整個知識圖譜也就會達到更好的效果。
目前Google的知識圖譜會先從英文搜尋開始,未來會向手機平板等移動裝置和更多的語言擴充套件。欲瞭解更多資訊,請移步
提升Google搜尋效果
Knowledge Graph從以下三方面提升Google搜尋效果:
1、找到最想要的資訊。
語言可能是模稜兩可的 —— 一個搜尋請求可能代表多重含義,Knowledge Graph會將資訊全面展現出來,讓使用者找到自己最想要的那種含義。現在,Google能夠理解這其中的差別,並可以將搜尋結果範圍縮小到使用者最想要的那種含義。
2、提供最全面的摘要。
有了Knowledge Graph,Google可以更好的理解使用者搜尋的資訊,並總結出與搜尋話題相關的內容。例如,當用戶搜尋“瑪麗·居里”時,不僅可看到居里夫人的生平資訊,還能獲得關於其教育背景和科學發現方面的詳細介紹。此外,Knowledge Graph也會幫助使用者瞭解事物之間的關係。
3、讓搜尋更有深度和廣度。
由於Knowledge Graph構建了一個與搜尋結果相關的完整的知識體系,所以使用者往往會獲得意想不到的發現。在搜尋中,使用者可能會了解到某個新的事實或新的聯絡,促使其進行一系列的全新搜尋查詢。
所謂知識圖譜聽起來很高大上號稱給計算機裝上了大腦…其實無非就是從各種結構化/半結構化/非結構化資料中抽取實體/實體屬性/實體之間的關係,構成一張圖,這張圖能夠反映真實世界的相關資訊,因為真實的世界在人類的認知當中就是由實體、屬性和實體間的關係構成的
獲取這些東西的最大挑戰無非就是實體識別、消歧(重名,別名)、實體關係挖掘等,這些歸根到底都屬於nlp的問題
知識圖譜_百度百科.html
Google釋出“知識圖譜”:為使用者提供有完整知識體系的搜尋結果.html
(1 封私信 _ 2 條訊息) 中文知識圖譜構建思路是什麼? - 知乎.html
作者:: 綽號:老哇的爪子 (全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿爾 拉帕努伊 )
漢字名:艾提拉(艾龍), EMAIL:[email protected]
轉載請註明來源: http://blog.csdn.net/attilax
Atiend
相關推薦
Atitit 知識圖譜解決方案:提供完整知識體系架構的搜尋與知識結果overview
Atitit 知識圖譜解決方案:提供完整知識體系架構的搜尋與知識結果overview 網際網路正從僅包含網頁和網頁之間超連結的文件全球資訊網(Document Web)轉變成包含大量描述各種實體和實體之間豐富關係的資料全球資訊網(Data Web)。在這個背
解決方案:Java+selenium定位元素後,sendKeys()輸入的內容顯示不完整
一、執行環境:Java + selenium + chrome 二、問題描述: 使用XPath定位到元素後,使用sendKeys()輸入內容,在輸入框顯示出來的內容不完整,也就是與所輸入內容不一致。比如sendKeys()輸入的是18611372039,輸入後,只顯示部分數字,18611。
零售行業BI解決方案:就連神秘的新零售也亟需
load 分享 power 接受 website 零售行業 pic 開發部署 ref 隨著物質水平的提高,人們的品味也在隨之增高。品質走高,消費升級,零售行業在近些年迅猛發展,更叠換代。從實體店線下零售到線上零售,再到今天新概念新零售,零售業在變得越來越智能。
0512日重點:淘寶的H5手機端自適應解決方案:Flexible
自動獲取 手機端 issue 解決方案 target 解決 flex get bsp 參考文檔: https://github.com/amfe/lib-flexible https://github.com/amfe/article/issues/17 自我總結:F
C#進階系列——WebApi 跨域問題解決方案:CORS
dea ati ice pro target default 異常 測試工具 復雜 前言:上篇總結了下WebApi的接口測試工具的使用,這篇接著來看看WebAPI的另一個常見問題:跨域問題。本篇主要從實例的角度分享下CORS解決跨域問題一些細節。 WebApi系列文章
C#進階系列——WebApi 身份認證解決方案:Basic基礎認證
str 常見 bre 這一 dex ace timeout ticket 結合 閱讀目錄 一、為什麽需要身份認證 二、Basic基礎認證的原理解析 1、常見的認證方式 2、Basic基礎認證原理 三、Basic基礎認證的代碼示例 1、登錄過程 2、/Home/I
【ansible】Windows開啟遠程控制錯誤解決方案:無法檢查防火墻狀態
contain ret turn nbsp windows wall 解決方案 itl wrapper 這個在老版本的Windows系統才有這種bug。例如Windows 2008 R2和Windows 7,如果你的系統的阿裏雲的Windows server 2
外顯子分析彈錯解決方案:Exception in thread "main" picard.PicardException: New reference sequence does not contain a matching contig for NC_007605
clear except -c 解決 als index false quest div 最近從公共數據庫下載了一堆bam文件和reference 基因組文件,重新分析外顯子流程時,跑出了“Exception in thread "main" picard.Pi
外顯子分析彈錯解決方案:Invalid command line: Cannot process the provided BAM/CRAM file(s) because they were not indexed.
highlight exe line light logs mtools and cannot not in 出現這種問題說明bam/cram文件沒有進行index. Samtool能解決這個問題,以bam文件為例,輸入以下命令行即可解決問題: /path/to/y
MYSQL問題解決方案:Access denied for user 'root'@'localhost' (using password:YES)
program 重啟 user 輸入 update tables 令行 mda 連接 這兩天在MyEclipse中開發Web項目時,連接MYSQL數據庫,出現問題:Access denied for user ‘root‘@‘localhost‘ (using passwo
教程 | Kaggle網站流量預測任務第一名解決方案:從模型到代碼詳解時序預測
abs rdf reg lock 集成 deep 月份 current 均值 https://mp.weixin.qq.com/s/JwRXBNmXBaQM2GK6BDRqMw 選自GitHub 作者:Artur Suilin 機器之心編譯 參與:蔣思源、路雪、黃小天
Android Studio更改工程名異常解決方案 :can't rename root module
包括 extern ext 相關 文件名 post roo 手動 修改文件 在修改Android Studio 中 project的名字時 ,提示 “can’t rename root module”。 這是因為Android S
C# 無法恢復到按鈕設置好的BackColor?只能恢復到Control BackColor(例如灰色)的解決方案:
clas blog post cor span icon div ren 當前 C# 無法恢復到按鈕設置好的BackColor? 只能恢復到Control BackColor(例如灰色)的解決方案: //定義一個顏色 Color currentbtBac
MYSQL高可用解決方案:PHXSQL(騰訊微信)編譯實錄
mysql phxsql [root@king01 ~]# rpm -ivh epel-release-6-8.noarch.rpm[root@king01 ~]# yum install -y automake zlib autoconf cmake gcc libtool ncurses ncur
MYSQL讀寫分離解決方案:MariaDB MaxScale部署實錄
maxscaleMASTER(KING01)[root@king01 ~]# mysql -uroot -pabcd.1234 Welcome to the MySQL monitor. Commands end with ; or \g. Your MySQL connection id is 173 S
MYSQL讀寫分離解決方案:MYCAT部署實錄
mysql mycat 讀寫分離 MASTER (KING01)[root@king01 ~]# mysql -uroot -pabcd.1234 mysql> show master status; +------------------+----------+--------------
Oracle數據庫容災解決方案:Oracle DataGuard部署實錄
oracle dataguardSQL> alter database force logging; Database altered. SQL> col force_logging for a15 SQL> select force_logging from v$database; FO
開源監控解決方案:ZABBIX部署實錄
lamp zabbix 安裝 Apache HTTP Server [root@king01 ~]# groupadd apache [root@king01 ~]# useradd apache -g apache -s /bin/nologin[root@king01 ~]# tar zxvf a
開源監控解決方案:Observium部署實錄
lamp observium snmp [root@king01 ~]# rpm -ivh https://mirror.webtatic.com/yum/el6/latest.rpm [root@king01 ~]# rpm -ivh epel-release-6-8.noarch.rpm [
開源監控解決方案:Icinga(Nagios)部署實錄
apache mysql nagios [root@king01 ~]# rpm -ivh http://repo.mysql.com/mysql-community-release-el6-5.noarch.rpm [root@king01 ~]# yum install -y mysql-