
數據安全的雙重向度
數據安全較之網(wǎng)絡(luò )安全包含更為豐富的維度。網(wǎng)絡(luò )安全主要考慮的是“為”的向度,即網(wǎng)絡(luò )行為是否正常、能否避免或阻止對網(wǎng)絡(luò )的各種破壞或入侵行為;數據安全不僅要考慮“為”的向度(行為向度),還要考慮“知”的向度(信息向度),即數據中所隱含的信息是否會(huì )被應知范圍以外的主體獲悉。數據跨境流動(dòng)尤其需要更多地考慮“知”的向度。數據安全的雙重向度決定了數據安全審查需要什么樣的機制和標準。行為向度上的審查標準和機制基本上可以借鑒網(wǎng)絡(luò )安全審查實(shí)踐,依據《數據安全法》第二十七條第一款的規定,在網(wǎng)絡(luò )安全等級保護制度的基礎上履行數據安全保護義務(wù)。信息向度上的審查卻是全新的挑戰。
數據安全在信息向度上承受的風(fēng)險,除可能直接來(lái)自敏感數據或秘密數據等具備特殊屬性的數據外,主要來(lái)自于兩個(gè)方面:相關(guān)性分析和因果推斷。相關(guān)性分析能夠基于過(guò)往數據及已公開(kāi)的重要公共事件或敏感信息的相關(guān)性,從現有數據推斷出發(fā)生某種情況的可能性;因果推斷則能進(jìn)一步結合因果模型從時(shí)序數據中推測出事實(shí)的發(fā)生機理,從而估計出隱藏得更深的關(guān)鍵信息。盡管此種推測有時(shí)只能獲得通過(guò)格蘭杰因果測試的相關(guān)性結論而非真正的因果關(guān)系,也會(huì )給數據流動(dòng)與利用造成安全上的隱患。因此,數據安全的一個(gè)重要維度是衍生數據的安全性(與所謂“數據分析安全”密切相關(guān)),此種安全性幾乎完全立足于信息向度。影響衍生數據安全性的關(guān)鍵是統計分析及因果推斷的技術(shù)發(fā)展。即便完全滿(mǎn)足網(wǎng)絡(luò )安全等級保護及數據分類(lèi)分級保護的標準,基于深入的相關(guān)性分析及因果推斷,在占有足夠體量及維度的低敏感度數據基礎上,分析者依然有可能獲得背后潛藏的特殊敏感信息,而且其分析能力還會(huì )隨因果推斷等研究日益深入而不斷發(fā)展。
信息向度的現實(shí)挑戰
數據跨境流動(dòng)安全的重要風(fēng)險源是網(wǎng)絡(luò )平臺,平臺數據的巨大體量和豐富維度對數據安全審查造成了顯著(zhù)的挑戰。早在2016年,騰訊存儲的數據體量就超過(guò)了1000PB,如今,多家大型平臺企業(yè)的數據總量都已邁入EB級別,數據安全審查的工作負擔與日俱增。不僅如此,數據安全的威脅還不完全來(lái)自于平臺數據本身。許多公開(kāi)來(lái)源數據本身就有一定安全風(fēng)險,而當僅依靠平臺數據本身無(wú)法推理出關(guān)鍵信息時(shí),平臺數據與公開(kāi)來(lái)源數據的結合推斷更有可能對關(guān)鍵信息的安全造成較大威脅。要從EB級別的平臺數據中發(fā)現所有潛在風(fēng)險已非易事,再結合同樣體量巨大的公開(kāi)來(lái)源數據進(jìn)行精準的安全性判斷就更為困難。
數據安全保護的要求比網(wǎng)絡(luò )安全保護更嚴苛,后者可以在所有技術(shù)性防護措施失效時(shí)緊急切斷網(wǎng)絡(luò )或屏蔽特定范圍的訪(fǎng)問(wèn),通過(guò)強行脫離攻擊而獲得恢復秩序的時(shí)間和空間;相比之下,數據一旦開(kāi)始流動(dòng)出去就意味著(zhù)根本上脫離控制,數據安全保護者已經(jīng)失去了兜底性的保護手段。獲得數據的組織和個(gè)人可以隨時(shí)開(kāi)展數據挖掘、數據分析乃至破解加密措施等活動(dòng),甚至可以等待數學(xué)原理的突破和信息技術(shù)的發(fā)展再擇機隨時(shí)進(jìn)行研究破解。因此,數據安全審查必須提前充分估測數據流出后一段時(shí)期內是否可能發(fā)生“知”的風(fēng)險;同時(shí),信息向度上的風(fēng)險考量又需要避免過(guò)猶不及,對正常的經(jīng)濟交往乃至科技發(fā)展造成過(guò)度的不利影響。
數據安全保護的制度回應
一是數據樣本的有效留存機制。在未來(lái)企業(yè)對數據安全審查工作機制日益了解的條件下,除非勒令企業(yè)停業(yè)并立即查封或全面接管,將難以保證防止企業(yè)捏造、篡改或銷(xiāo)毀關(guān)鍵數據及操作日志以躲避審查,但此種做法顯然不符合比例原則,非十分迫切且必要之前提不可為之。如果能夠確保真實(shí)、有效地定期(常態(tài))或在特定條件下即時(shí)(按需)留存某一時(shí)間截面的數據樣本,可以重點(diǎn)針對截面數據進(jìn)行數據安全審查,既保證充分的分析與研判時(shí)間及工作條件,又盡可能避免過(guò)度干擾企業(yè)的正常運營(yíng)。不過(guò),由于平臺企業(yè)數據體量巨大,真實(shí)有效地留存如此大體量的數據樣本不僅難度與成本較高,也難以保證其真實(shí)性。為避免企業(yè)建“陰陽(yáng)數據源”而不留存或不完全留存真實(shí)的截面數據樣本,可以在當前數據安全能力成熟度標準中有關(guān)“數據副本”要求的基礎上,靈活綜合運用建設數據安全管理平臺、派駐數據安全員、實(shí)施監控審計、保存操作日志且摘要上鏈、進(jìn)行“雙隨機一公開(kāi)”突擊檢查、應用監管沙盒等措施,結合相關(guān)行政及刑事處罰的設定和實(shí)施,形成針對性的監管方案。
二是基于信息向度的數據安全標準。目前,數據安全有關(guān)標準中常見(jiàn)的數據處理安全要求包括身份鑒別、訪(fǎng)問(wèn)控制、授權管理、數據脫敏、數據加密、數據防泄漏等,實(shí)際上均側重于行為向度。當前數據安全測評領(lǐng)域較為依賴(lài)的兩個(gè)標準——《數據安全能力成熟度模型》(DSMM,最新版本為GB/T 37988-2019)和《數據管理能力成熟度評估模型》(DCMM,最新版本為GB/T36073-2018)亦均側重于行為向度的安全問(wèn)題。DCMM的大量評價(jià)指標中雖然有衍生數據安全的相關(guān)部分,但對衍生數據安全性的考慮并不突出。在DSMM中,僅在數據處理安全部分中相當有限地考慮數據分析安全問(wèn)題(在整個(gè)評估模型中占比相當有限),一旦企業(yè)自身有意放松控制或在操作日志上造假,此種數據分析安全要求也難以起到實(shí)質(zhì)性作用,而由行政機關(guān)時(shí)時(shí)處處嚴密監控企業(yè)的數據處理活動(dòng)亦不現實(shí)。不過(guò),DSMM中結果數據掃描及阻斷措施、數據分析過(guò)程的安全風(fēng)險監控平臺、完整記錄訪(fǎng)問(wèn)日志、細粒度的數據權限訪(fǎng)問(wèn)控制等現有安全機制,仍然可以對保障數據分析安全、確保數據正當使用等起到一定積極作用。未來(lái)編制及修訂數據安全方面各項國家標準時(shí),應基于相關(guān)性分析及因果推斷已被證明可行的最前沿實(shí)踐,充分考慮信息向度的數據安全要求,可以將數據分析安全提煉并豐富為一項單獨的標準,采取“基本要求+條件性附加模塊”的方式,對不同類(lèi)型企業(yè)的數據處理活動(dòng)進(jìn)行針對性的精準監管。包含信息向度的數據安全標準的制定和持續更新,既可以持續吸收統計分析及因果推斷的最新技術(shù)進(jìn)展,又可以為企業(yè)數據合規持續提供精準的技術(shù)性指引,有效平衡數據安全保護和數據開(kāi)發(fā)利用的需要,防止濫用數據安全的名義干預正常的數據處理活動(dòng)。
三是包含關(guān)鍵推理數據的重要數據及數據分類(lèi)分級目錄。盡管《數據安全法》提及了“重要數據”,但其目錄尚未正式形成,應當及時(shí)制定重要數據目錄或清單。“重要數據”不僅應當包括本身記錄敏感信息的數據,也應包括關(guān)鍵推理數據。所謂關(guān)鍵推理數據,是指能在統計分析或因果推理中對推斷出涉及國家安全、社會(huì )重大公共利益或大范圍個(gè)人隱私的重要敏感信息具有較大潛在威脅性的數據。對此,應當基于已依法公開(kāi)的各種重要敏感信息,及時(shí)估算和驗證不同類(lèi)型數據(尤其是時(shí)序數據)與重要敏感信息的相關(guān)性,以及其在能夠推導出重要敏感信息的因果模型中的作用,并將此類(lèi)數據根據數據安全保護的現實(shí)需要有選擇地納入重要數據目錄的保護范圍。同理,對于在若干重要因果模型或相關(guān)性分析中被確認能起到較大作用的關(guān)鍵推理數據,也應在數據分類(lèi)分級目錄中作相應的處理。
?。ㄗ髡咛K宇系中國人民公安大學(xué)數據法學(xué)研究院院長(cháng)、副教授)
編輯:薛姣