大資料社會需要考慮演算法治理(環球走筆)
演算法,曾被描述為一件相當溫和的事情——計算過程明確,步驟可控,結果一目瞭然。近年來,演算法通常與大資料結合,通過打分、排序、評級的方式在使用者、環境和推薦物件之間建立聯絡,進行自動化推薦。搜尋引擎中的網頁呈現,電子商務中的商品推薦,社交網路中“你可能認識的好友”,內容推薦引擎中的新聞推薦等,都是演算法應用的豐富場景。
然而,演算法的廣泛應用也引發一些問題。不久前,英國伯明翰地方警局表示正在研發一套名為“國家資料分析方案”的系統,旨在通過對居民個人資料資料的分析,預測公民的“犯罪指數”,引導警方提前干預。儘管警方一再強調不會僅根據風險指數就進行逮捕,但這個訊息還是引發了廣泛爭議。
由於演算法具有技術門檻,很多時候出現問題難以追責,造成傷害無從補償。如何讓資料分析系統自證其演算法“公平有效”,這是人們十分關心的問題,也是一道現實難題。2015年,美國芝加哥法院使用的犯罪風險評估演算法就被證明對黑人造成了系統性歧視:黑人更有可能被這個系統錯誤地標記為具有高犯罪風險,從而被法官判處更長的刑期。另外,數百萬人由於該演算法無法獲得保險、貸款和租房等服務,如同被演算法“囚禁”。美國皮尤研究中心釋出的《公眾對計算機演算法的態度》報告則顯示,58%的受訪者認為,演算法和其他計算機程式總會包含偏見。
顯然,演算法的設計、目的、資料使用等都是設計開發者的主觀選擇,其主觀偏見有可能被嵌入算法系統。資料的有效性和準確性,也會影響整個演算法決策和預測的準確性。正是由於設計偏向、資料缺陷,再加上無法公開透明的“演算法黑箱”,使得演算法過濾、演算法偏見、演算法歧視和演算法操控的情況屢屢發生。近幾年,全球網際網路平臺紛紛開發智慧推薦系統,大多數都是根據使用者使用痕跡進行關聯推薦。演算法越智慧,越能使使用者被“安排”進所謂“資訊繭房”,即陷入為其量身定製的資訊之中。久而久之,使用者處於資訊“自我禁錮”困境,從而失去了解更大範圍事物的機會。其後果,有可能就是導致人們視野日趨偏狹,思想日趨封閉、僵化甚至極化。
大資料背景下,解決演算法智慧帶來的麻煩已是不可迴避的課題。越來越多人提出著手研究演算法治理的主張,雖然註定是十分艱鉅的事情,但也當屬值得邁出的一步。