大資料應該確定成什麼權利
大資料是依確定目的而挖掘、處理的大量不特定主體的數字資訊。大資料的本質屬性是財產性而非人身性。大資料發展的指向應該是開放而不是封閉,在個人權益與社會福利間謀求均衡。
相較於債權、智慧財產權這兩種路徑,把大資料確定為物權的制度效率最高。具體要研究、確定大資料在挖掘階段、儲存階段、分析階段、應用階段的權利內容。
目前學界將“大資料”、“資料”與“個人資訊”混為一談,將注意力集中到人身權、隱私權研究,既忽視了財產性才是大資料的根本屬性,又忽視了大資料在挖掘、雲端儲存、雲端計算和應用等方面與一般資料的諸多客觀區別。
大資料是資訊時代的新產物,在法律性質、權利內容、權利歸屬方面存在著諸多制度空白,進而導致了公地悲劇、市場壟斷和逆向選擇等負外部性的出現,阻礙社會福利最大化的實現。需要通過法律經濟學對大資料確權進行比較制度分析,以解決大資料初始產權的界定問題。
目前大資料討論中存在著似是而非的理解
法律視角中,什麼是大資料?大資料和普通資料有什麼區別?目前理論、實務界與立法者出於現實考慮,默契一致地選擇迴避正面回答“什麼是大資料”,而是採用了描述性的概念界定即眾所周知的“4V標準”,將“大資料”定義為“大量(普通)資料的集合”。這樣定義,導致大資料在世界範圍內被拖入隱私權爭論的泥淖之中。
不清楚大資料在法律上是什麼,何談確權?如何流轉?如何保障?
筆者認為,大資料是依確定目的而挖掘、處理的大量不特定主體的數字資訊。
不具備“特定目的挖掘”主觀要件和“挖掘、處理”客觀要件,而只是靜置、沉睡的資料,種類和數量再多、處理速度和本身準確性再高也不會產生這種精準預測力,也不是“大資料”。
“數字資訊”是“大資料”與“個人資訊”的核心區別。目前,國內由於“大資料”提法的興起與販賣個人資訊活動日益猖獗的週期高度重合、同步,使得國內輿論與研究者也將除大資料應用之外的主題放到了隱私權保障上,《個人資訊保護法》的呼聲也日益高漲。但這和大資料的關係似是而非。大資料要分析和處理的是海量數字化資訊,在大資料儲存、分析的整個流程中,“個人資訊”都不再以初始形式存在,大資料的內容是計算機語言表述的數字資訊。
大資料發展的指向應該是開放而不是封閉,在個人權益與社會福利間謀求均衡。
把大資料界定為物權是較好選擇
探討大資料的權利性質,就是要研究,將目前法律性質不明的大資料界定為物權、債權還是智慧財產權的交易成本最低、制度效率最高。由於不同的法律性質意味著不同的保護模式,也就意味著不同的交易成本與制度效率。
由於“大資料”是依確定目的而挖掘、處理的大量不特定主體的數字資訊,顯然不是天然存在而是人為加工的一種財產。那麼大資料應該屬於何種財產權?已頒佈的《民法總則》在第五章“民事權利”列明瞭財產權利的三個主要組成部分,物權、債權和智慧財產權。從法律經濟學來看,大資料的權利性質確定過程可以被視為一種制度選擇的過程,在物權、債權、智慧財產權這三種路徑的制度競爭間進行“成本-收益分析”,得出效率最高的制度效率。
債權路徑帶有明顯的負外部性後果,促使壟斷和不正當競爭的形成。債權路徑中最主要的是通過契約意思自治來實現大資料確權,這是當前現實中最普遍的形式,比如貴陽和中關村的大資料交易中心所內進行公開交易以及企業間或企業內部進行的非公開資料交易。大資料確權存在制度空白的情況下,通過市場機制進行大資料交易的法律風險過高,進而導致交易成本高。故而大資料企業選擇企業機制,在關聯企業內部流轉大資料形成市場替代。總的來說,如果過度依賴契約路徑與放任大資料產權不明晰狀態的持續則將產生市場失靈,其主要形態是壟斷。屆時小型網際網路公司將不得不對大資料托拉斯繳納高昂的市場進入稅,直接損害社會福利。微軟公司的視窗系統,蘋果公司的App Store都已經出現了這一問題。
從制度需求的角度看,智慧財產權法主要保護的是實現大資料的外在技術,而對於大資料本身的解釋力有限。其解釋力主要在於大資料分析和大資料應用,因為此階段確實包含了大資料工程師的智慧成果。但是在大資料探勘方面則很難解釋,比如Cookies(電腦上網快取)與網路痕跡,並不包含明顯的智慧加工。故而在大資料探勘方面智慧財產權性體現的不明顯。
相較於債權、智慧財產權這兩種路徑,“物權路徑”的制度效率最高,理由在於兩方面。
第一是需要克服的制度稟賦難度低、制度改進成本小。若將大資料解釋為一種物權客體,則現有物權體系中的無體物基本能夠相融,從而更容易被立法者接受,克服制度稟賦難度較小。具體來說,物權的佔有、使用、收益、處分四大權能較好對應大資料流程,佔有對應大資料探勘和大資料儲存,使用對應大資料分析和大資料應用,收益和處分對應大資料交易,這方面明顯優於智慧財產權路徑。
第二是抑制制度負外部性,降低交易費用。這又具體分成三個角度,首先是物權路徑不會直接導致因過度意思自治帶來的壟斷和不正當競爭以及其他市場失靈情形,甚至可以有效抑制壟斷從而優於債權路徑;其次是物權路徑權責最為明晰,大資料產權的所有者與應用者即相關法律責任的承擔者,相較於債權路徑而言降低了因合同相對性與內外雙重效力導致的“侵權無責”傷害社會福利的情形;最後是流轉順暢,相較於智慧財產權路徑而言將大資料理解為一種無體物動產則沒有複雜的登記與公示,更有利於大資料流轉和資訊的傳播以及由此帶來的激勵創新等正外部性的產生。
大資料的權利內容
大資料的權利內容即哪些具體權利應該被法律明確規定、保障?
從產業鏈條上時間先後順序來看,大體包含大資料探勘階段、大資料儲存階段、大資料分析階段、大資料應用階段的權利四部分內容。當然,並非大資料的所有權利內容都適宜通過《民法分則》、《個人資訊保護法》或其他法律部門予以規制。以下說明的是通過成文法尤其是民法典予以規制更具制度效率的大資料基本權利內容。
概括地說,大資料探勘階段的權利內容主要包括有Cookies輔助資料、網站爬行資料和旁路採集資料等。大資料儲存、分析階段的權利內容主要包括清潔資料、區塊鏈資料、Hadoop的MapReduce分散節點資料、使用者行為模型資料等方面。大資料應用階段主要包括LBS資料、CRM資料等。
大資料的權利歸屬
在物權路徑下更為具體的制度選擇中,物權由佔有、使用、轉讓、收益、處分等權能構成,故而在大資料各流程中又面臨著哪些主體對大資料享有完整物權權能或不完整權能這兩種路徑之間的制度競爭問題,需要進一步分析。
挖掘階段的大資料權屬
大資料探勘階段選擇完整物權權能路徑更有效率,應將Cookies輔助資料、網站爬行資料和旁路採集資料等大資料的物權歸屬於大資料探勘者所有。
從佔有權能的角度說,此階段資料探勘者佔有大資料交易成本更低。對此,目前學界和社會公眾中比較流行的看法是“大資料時代個人資訊應歸個人所有,使用者對自己不願意公開的資訊享有被遺忘權”。應該看到,使用者確實是個人資訊的產生者和所有者,但是並不是被數字化、匿名化以及其他大資料技術處理後的個人資訊的產生者與所有者。將挖掘階段大資料的佔有權歸屬於個人使用者的制度設計是明顯無效率性的。以全球大資料企業領頭羊的Google在歐洲的遭遇為例,每年要收到數萬份個人資訊刪除的請求。
從使用、處分權能的角度說,由於資訊成本過高,挖掘階段的使用權人應該是大資料探勘者而不是使用者。相較於將挖掘階段的大資料確權給自然人,確權給有挖掘能力及有效率的企業與政府則更有利於這一技術正外部性的拓展與實現。
從轉讓與收益的角度說,相對於使用者而言,大資料探勘者享有轉讓與收益權更有利於降低交易成本和促成私人談判。
儲存、分析階段的大資料權屬
該階段權利應歸委託人所有或依據契約進行產權確認。大資料儲存、分析階段也即“雲端計算”階段,此時由於個人資訊已被清潔和數字化,從而不再涉及使用者所有權問題。故而制度選擇方案即是在“雲端計算委託人”和“雲端計算受託人”之間進行確權。
“雲端計算”的核心資產是大型、超級計算機,核心競爭力是“4V”標準項下的“大量、多樣、快速、準確”地運算。國內外提供雲服務的企業主要包括Google、IBM、阿里、騰訊以及華為等網際網路寡頭,這些企業大都本身擁有10億級別的大資料運算需求,所以本身都擁有自己的雲服務軟硬體。雲服務是在滿足自身大資料運算的過程中發現的對主營產品的替代商品,將“剩餘運算能力”出售給其他公司實現企業資產配置效率的最大化。總而言之,現在“雲市場”中雲服務的主要生產者與消費者高度統一。
應用階段的大資料權屬
應用階段的大資料應被界定為公有產權,屬於全體社會成員所有,但需要法律對其邊界加以具體限制。
從佔有的角度來說,LBS資料、CRM資料等應用階段的大資料事實上已歸屬於政府和運營商佔有,而這種佔用基於法律行為而產生,且目前並未產生足以降低社會福利的負外部性影響,故而暫時不需要調整。
從使用的角度來說,應用階段的大資料不應私有化。主要原因在於這將抑制正外部性溢位並催生壟斷。從供給側改革的角度來看,應用階段大資料若歸屬於少數大型網際網路公司則意味著法律為價格歧視和無謂損失提供溫床。從“大眾創業,萬眾創新”的角度來講,應用階段的大資料確權將對無償公開大資料成果產生負面激勵,抬高企業創新與科學研究的成本,阻礙正外部性的產生與技術溢位。
從轉讓、收益和處分的角度來說,將應用階段大資料界定為私有產權將導致交易成本陡然增加。
總而言之,應用階段的大資料從社會總體福利的角度來講應該參考土地制度,界定為公共所有並交由政府管理。具體方式可以通過成立“中央大資料銀行”對大資料市場實施“統而少治”。一方面限縮大資料的流動規模以保護國家資訊保安和防治大資料的“新型國有資產流失”,另一方面限制大資料發展中的市場失靈,比如大型網際網路企業大資料托拉斯的形成。
(作者單位:周林彬,中山大學法學院;馬恩斯,深圳市政府政研室)
責任編輯:李蘭鬆