数据匿名难保隐私
科普小知识2021-08-21 14:52:13
...
资料来源:当代科学
伦敦帝国理工学院的伊夫-亚历山大·德·蒙特乔伊和他的同事们开发了一种统计方法,可以通过匿名数据集准确估计重新识别个人身份的可能性。相关结果最近发表在《自然通讯》在线版上。
数据科学和人工智能有望改变人们日常生活的方方面面,如医疗、医疗保健、商业和管理。这些方法依赖于大规模详细的个人数据,但是个人数据的收集和共享引起了对暴露个人隐私的关注。
为了解决这个问题,当前的解决方案包括匿名化和发布不完整的数据集。然而,最近使用匿名数据集(包括浏览历史记录、手机和信用卡数据)来重新识别个人身份的事件表明,上述措施是不够的。
在新的研究中,蒙特乔伊等人引入了一种方法来评估一个人的身份是否可以从一个不完整的匿名数据库中被重新识别。该文件认为,目前的匿名化和数据共享方法可能不足以保护个人隐私或满足数据保护法律法规的要求,如欧盟的“一般数据保护法规”。
研究人员发现,即使数据集不完整,也只需要几个属性,如邮政编码、出生日期、性别和子女数量,就可以高置信度地识别个人。已知的属性越多,被识别的可能性就越大。例如,马萨诸塞州99.98%的人口可以通过15个人口统计属性来识别。因此,他们得出结论,仅仅公布抽样数据集或不完整数据集不足以保护个人隐私。
相关文件:https://doi.org/ 10.1038/S 41467-019-10933-3
上一篇:双氧水在贮藏和使用时应注意什么?
下一篇:西红柿是越红越防癌吗?