您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關大數據脫敏是什么,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
大數據脫敏,又稱數據漂白、數據去隱私化或數據變形,是指對某些敏感信息通過脫敏規則進行數據的變形,實現敏感隱私數據的可靠保護,從而在開發、測試和其它非生產環境以及外包環境中安全地使用脫敏后的真實數據集。
隱私數據脫敏技術
通常在大數據平臺中,數據以結構化的格式存儲,每個表有諸多行組成,每行數據有諸多列組成。根據列的數據屬性,數據列通常可以分為以下幾種類型:
可確切定位某個人的列,稱為可識別列,如身份證號,地址以及姓名等。
單列并不能定位個人,但是多列信息可用來潛在的識別某個人,這些列被稱為半識別列,如郵編號,生日及性別等。美國的一份研究論文稱,僅使用郵編號,生日和性別信息即可識別87%的美國人。
包含用戶敏感信息的列,如交易數額,疾病以及收入等。
其他不包含用戶敏感信息的列。
隱私數據泄露類型
隱私數據泄露可以分為多種類型,根據不同的類型,通常可以采用不同的隱私數據泄露風險模型來衡量防止隱私數據泄露的風險,以及對應不同的數據脫敏算法對數據進行脫敏。一般來說,隱私數據泄露類型包括:
個人標識泄露。當數據使用人員通過任何方式確認數據表中某條數據屬于某個人時,稱為個人標識泄露。個人標識泄露最為嚴重,因為一旦發生個人標識泄露,數據使用人員就可以得到具體個人的敏感信息。
屬性泄露,當數據使用人員根據其訪問的數據表了解到某個人新的屬性信息時,稱為屬性泄露。個人標識泄露肯定會導致屬性泄露,但屬性泄露也有可能單獨發生。
成員關系泄露。當數據使用人員可以確認某個人的數據存在于數據表中時,稱為成員關系泄露。成員關系泄露相對風險較小,個人標識泄露與屬性泄露肯定意味著成員關系泄露,但成員關系泄露也有可能單獨發生。
以上就是大數據脫敏是什么,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。