知識圖譜應用篇(三)-知識圖譜的問答場景應該如何選擇?
筆者會以產品經理的視角來寫技術相關的文章,在前面的文章中簡要的介紹了知識圖譜的概念,構建以及基本應用形式。這篇文章主要介紹如何判斷問答場景是否適合知識圖譜。
什麼是知識圖譜的問答
業界通用的問答系統是以Q&A為中心構建問答,需要運營去窮舉使用者的所有的問題(question),然後給每個問題配上相應的答案。然後演算法用Q-Qmatch解析到運營配置的問題(question)上,召回答案(answer)返回給使用者。目前廣泛用於語音助手,客服機器人當中,案例:三星BIXBY語音助手,小I機器人。
知識圖譜的問答和是以知識為中心,通過將使用者的問題匹配到對應知識上,然後通過召回知識返回給使用者,匹配演算法一般使用的是 KB-QA,中間會涉及到圖查詢,命名實體識別(NER),屬性識別,推理引擎等技術。
知識圖譜的問答有哪些特點
1.可以基於海量原生知識去進行問答,QA系統的A一般是運營深度加工過的,例如很人性化的話術,圖片等等
2.問答容量更大,常規的QA系統在Q超過一定數量之後演算法的召回準確率會急劇下降
3.這個比較難一句話說完,問答一般是有邏輯的,QA系統一般是由運營去解析使用者問題中的邏輯,知識圖譜的問答可以將這個邏輯讓機器去解析,簡單來說就是推理。後面會有案例講到。
4.因為是以知識為中心去做問答,對話管理模組會更好做,在資訊不確定的情況下可以多輪會話,人對話的時候會經常省略一些內容,可以通過上下文做意圖繼承。
5.擴充實體的訓練邊際成本極低,運營成本極低
6.擴充schema的訓練成本較高,變動成本極高
如何選擇場景
價值:產生的問答效果,積累下來的領域資料,商業上能夠致勝等等
成本:包括技術成本,構建成本,時間成本,後期運營成本等等
一個最基本的衡量標準是產生的價值>成本即可。
根據上述的知識圖譜特點,將成本進行拆分:

知識圖譜問答的成本分析
挑選成本可控,價值比較明確的場景即可。
業內案例
目前工業界使用知識圖譜作為主要問答解析方式的其實不多,實際應用中會更關注覆蓋率,已經擴充的便捷性,而這一點恰好是QA系統的強項。
案例1:i問財-產業鏈推理
案例介紹,I問財本身是基於結構化知識去做問答,例如通過股票的各種知識找股票,比較複雜的產業鏈推理如下圖所示,筆者估計,其背後是一套網羅了中國所有公司的圖譜,包含了產業,產品,公司,產品和產品之間的關係,公司和產品之間的關係。通過複雜的關係網路去做知識推理,不過估計是因為語義解析成本的關係,沒有做的很豐富。從這點看,可能是平衡好價值和成本。
網址:www.iwencai.com

i問財-產業鏈推理
案例2-淘寶直播
最近在看淘寶直播的小哥哥小姐姐的時候,驚奇的發現,有些主播,我問主播的一些資訊的時候會有回覆,例如,我讓主播試一下8號寶貝,系統會返回主播已經穿過這個了,然後把之前的錄播視訊發你了。覺得比較有意思,有時候還問問10號寶貝有沒有優惠券啥的,系統會讓你領10號寶貝的優惠券。再試了一下啊,發現還能問三圍什麼的- -。不知道以後會不會問他的年收入都能問的出來。估摸著是手淘這邊用這類知識構建的直播領域圖譜,順便做了個問答。
