百度的All in AI為什麼在搜尋亂象問題上行不通?
在使用者、媒體、有關部門的多重監督之下,國內的搜尋體驗對比多年前已經有所改善,但依然還是有一些搜尋亂象出現在人們的生活中。
近日,據央視報道,9月8日晚,上海市工商局表示,復大醫院利用百度推廣,將本地知名醫院的關鍵詞作為搜尋關鍵詞,以提升自己醫院的搜尋排名。其行為涉嫌虛假宣傳,上海市工商局檢查總隊已立案調查,並將依據《中華人民共和國反不正當競爭法》對其處罰。
訊息一出,各大主流媒體紛紛對這一亂象進行跟蹤報道,百度競價排名似乎大有死灰復燃現象。對此,百度作出緊急迴應:“儘管百度一直致力於打擊仿冒網站、黑色產業等,但總有一些不法分子想方設法,試圖侵害網民的權益。當網民使用百度搜索時,如遭遇搜尋推廣結果中因假冒、釣魚欺詐等網站受到損失,只要提供相關證據,百度將不設上限進行“全額”先行保障!”——雖然百度本次在亂象曝光後的態度足夠誠懇,但還是沒能消除從業者和使用者對百度搜索推介的一些質疑。
那麼,百度對搜尋亂象提出的一些解決方案是否有效?如果無法徹底根除搜尋亂象,那百度至少會需要作出一些怎樣的改進?今天,我們就一起來結合整個搜尋行業,來談談百度目前提出的搜尋推薦究竟靠不靠譜。
所有搜尋引擎都有醫療廣告,搜尋醫療廣告不應該被妖魔化
首先,與搜尋引擎相關的醫療廣告已經導致了多起事故發生,作為一個對接使用者與商家雙方需求的平臺,真實有效的醫療資訊和醫療廣告,確實是可以幫助使用者解決一些生活中遇到的問題。
舉個例子,在沒有搜尋引擎沒有網際網路網站之前,由於資訊不對稱的因素,一些庸醫誤人的現象也是頻繁發生。畢竟使用者本身並沒有辦法基於過往的例子和材料判斷一個醫院/醫生是否足夠專業,只能通過口口相傳和醫院品牌來對一位醫生進行判斷。同時,如果去一個知名的大醫院,要麼就需要熟人帶領才可以熟悉瞭解看病流程,要麼連掛號都需要提前去醫院才可以進行。
搜尋引擎和網際網路的出現,至少在掛號、就診流程、醫院和醫生資料案例公開等方面都提供了一些幫助,可以讓使用者更方便地找到一些醫院的資訊,並且更好地看病。所以,本身搜尋引擎出現醫療相關資訊我認為是一件好事,但對於一些知名醫院和醫生以競價廣告進行流量劫持的行為,這確實給廣大使用者帶來了巨大傷害。
做好了真實醫療資訊的對接,搜尋引擎可以說是大功一件,但如果給虛假資訊提供了更加優質的排名,這很可能就會誤人一輩子。值得一提的是,目前的市場,包括百度、谷歌、360、搜狗、必應在內的所有搜尋引擎都有醫療廣告。據新華社一篇名為“醫療競價廣告捲土重來:公然把公立名牌醫院搜尋名稱賣了”的報道顯示:新華社記者在百度、搜狗、必應、360等多款主流搜尋頁面搜尋相關關鍵詞後發現,醫療競價廣告悄然重現,搜病名先推薦醫院,甚至還出現了公然售賣公立名牌醫院搜尋名稱的現象。在一些搜尋網站上,公然將正規名牌醫院名稱售賣給他人的情況常見,有的雖然在PC端下架了醫療廣告,但移動端App中卻將廣告置頂了。
因此,所有搜尋引擎都有醫療廣告。醫療搜尋結果和醫療廣告用到實處,確實還是能對使用者起到很大的幫助。所以,搜尋醫療廣告不應該被妖魔化,不應該被一棍子打死。
當下,可以說醫療廣告已經成為百度乃至整個搜尋行業都必須解決的一個難題。都說擁有多大能力就得承擔多大社會責任,百度作為國內最大的搜尋引擎,多次因搜尋問題導致事故發生並引起巨大風波,確實需要比其他同行更大力度去整治這些醫療廣告內容。
全額保障只是基礎,所謂的防護技術是否真有用很關鍵
如果說醫療廣告可以合理合規地成為搜尋引擎提供的標準內容,那至少也得解決當下的搜尋亂象問題,各大搜索引擎才能真正為使用者提供好醫療服務。百度既是此次重點被曝光的物件,同時也是中國搜尋引擎裡最應該去解決醫療廣告問題的平臺。
在此次上海復大醫院事件中,百度雖然快速推出了保障的計劃。但在我看來,保障還只是一個基礎。使用者通過搜尋引擎來找醫院,自然不是抱著要百度賠償的目的,而是真正想解決醫療方面的問題,而能否真正保證資訊的準確性,就需要考驗到百度和眾搜尋引擎的決心和技術力量了。
在後續的宣告中,百度重點提到了其利用人工智慧技術打擊一些搜尋亂象的例子。事實上,百度很多的技術也逐漸公開,那麼百度目前所提出的這些技術解決方案究竟有沒有辦法根治搜尋廣告亂象?技術會是解決搜尋亂象的大剋星嗎?下面,我們就從百度自己所說的技術來進行一些分析。
在宣告中,百度表示用人工智慧技術對一些變體詞進行有效打擊,經過百度 AI 稽核拒絕醫療變體詞推廣量日均達160萬,2018年上半年拒絕醫療變體詞推廣量超3億。
變體詞是什麼呢?如上圖所示,用一些錯別字或者繁體字來進行偽裝的關鍵詞,這個要識別的話,理論上就將一個豐富的詞庫進行比對就也可以實現。針對這一變體詞,如果可以直接遮蔽關鍵詞,這確實可以起到一定整治的幫助。但就以百度官方宣佈的例子來看,筆者在搜尋“痔瘡”、“zhichuang”這類關鍵詞,均還是發現了一些競價廣告。
目前還無法確定這是否是一個偶然,但如果百度能夠識別到一些相關變體詞而不對這樣的關鍵詞結果進行鎖定排序,不準競價廣告滲入,那這樣的技術很難在其整治搜尋亂象中發揮價值。同時,百度還有建立一個黑名單的詞庫。有訊息顯示:截至目前,百度的黑名單詞彙總量超過50萬個,涉及醫療類的詞彙總數達25萬個。同時,2018年1月至今已拒絕不良的醫療廣告為2.2億條。
這樣的黑名單詞庫,如果可以對這些關鍵詞結果進行遮蔽,那自然是一個好技術,但如果不行也還是無法發揮價值。此前,一直也有百度風控技術在外流傳,涉及非法敏感(賭博欺詐、色情低俗、涉賭販毒等)、違反廣告法(商標侵權、虛假廣告等)、內容不合規(歧義誤導等)和使用者體驗差(感官不合、反感描述等)這4個方面,都會被這個AI風控技術所監控。
有訊息透露,AI 加權後百度的侵權風險露出率從2015年的0.97%下降到現在的0.25%,降低率達到74%;侵權識別準確率也從2015年的68.3%提升到現在的98.6%,準確率提升近45%。雖然這些AI技術也會對改善一些搜尋問題有幫助,但要讓整個搜尋引擎的亂象都更少,這其實需要人工與技術的一起協同,才有可能把這樣的問題給解決好。
兩大方向,改善搜尋問題關鍵還是要靠決心和及時響應的服務
可以說,技術確實可以幫助搜尋引擎更好地整治一批搜尋亂象。但純靠技術,至少目前來看是很難將搜尋亂象根治。我認為要改善這些問題,兩個方向值得去嘗試。
要有整治決心,廣告數量和質量都要被控制
廣告是搜尋引擎最核心的盈利方向,包括百度、谷歌、360在內的一眾搜尋引擎。但就以百度、360來說,其競價廣告大多數都是各地代理商去聯絡客戶,去提供廣告內容。
我們雖然相信百度會用技術辦法去打擊搜尋結果,但這個優化的過程可以說永遠沒有終點。舉個例子,幾乎每個搜尋引擎都有關鍵詞聯想詞,除開一些變體詞以外,很多也還會利用一些關鍵詞聯想詞進行廣告投放。既然百度有技術實力可以檢測判斷到這些關鍵詞聯想詞,那同時遮蔽掉這些關鍵詞聯想詞的搜尋結果相比也是可以實現的吧?
同時,高額利益的優化下,很多代理商也就只能鋌而走險地去幫助一些客戶上架一些違規廣告。就目前來說,用競價廣告投放一些“高收益”的服務或商品,已經成為了一個巨大的產業鏈。
縱然沒那麼大的能力很快時間就把這個產業鏈打擊掉,但百度可以通過控制特殊領域的廣告數量來保持特殊領域關鍵詞的搜尋體驗。就以醫療廣告來說,所有百度入庫的正規醫院直接用品牌官網給予優質位置後,一律不允許競價廣告對這些相關關鍵詞進行投放,這才能保障百度自然搜尋結果與競價廣告處於同一個標準,讓使用者搜尋一些醫療關鍵詞的時候儘可能地找到正規準確的資訊。
所以,在技術已經解決一部分事情的情況下,要做好搜尋亂象整治的事情,需要所有搜尋引擎擁有巨大的決心。
使用者反饋要及時,使用者全民來監督
在這次復大事件宣告中百度提出:儘管百度一直致力於打擊仿冒網站、黑色產業等,但總有一些不法分子想方設法,試圖侵害網民的權益。
在鉅額利益的吸引下,大批不法分子不斷與百度乃至所有搜尋引擎的規則進行鬥爭,如果純靠搜尋引擎平臺來保障網民的權益確實不是一件易事。
但從某種意義上來說,百度可以投入更多人力專項稽核包括醫療在內的廣告投訴,及時響應使用者投訴,同時對提供違規廣告主體以及開通廣告主體銷售人員進行嚴厲懲罰,這本身就可以有效提升特殊行業關鍵詞的搜尋質量。
目前來說,雖然百度也已經開放了舉報入口,但一個是反饋速度不夠及時,另一個就是違規廣告數量實在太多。與其等到使用者上當受騙後給予全額補償,或許用有獎舉報的方式引領全民監督的方式更人性化。這結合一些AI技術與針對廣告銷售體系的嚴懲內容後,相信會比當下的整治結果更有利。
好的搜尋結果,會提升使用者的生活品質和工作效率,但一個違規的搜尋內容卻很有可能誤人一生。技術是死的,一直都會有漏洞,要真正解決搜尋亂象問題,或許還得是人與技術相結合,才有可能給整個搜尋行業帶來優質的體驗,這或許是百度、360、神馬、谷歌都需要深思的問題。
(文章來源:CSDN(ID:CSDNnews) 作者:小謙)