你的朋友“出卖”了你
朋友的推文也能揭示你惊人的信息量。资料来源:ISTOCK.COM
即使你完全删除了你的社交账户,你也不能保证隐私。如果你能链接到其他用户,他们的活动也能“暴露”你的信息。现在,计算机科学家已经证明,使用你最亲密的10个联系人的推文可以比使用你自己的推文更好地预测你未来的推文。
奥地利维也纳医科大学的计算社会学家大卫·加西亚没有参与这项研究,他说,从这种“二手”监测来判断一个人的性格“比看上去容易得多”。
在这里,佛蒙特大学的研究人员没有预测任何人的真实推文,但是使用了一种叫做信息熵的测量方法来估计一个人未来发布推文的可预测性。更多的熵意味着更多的随机性和更少的重复。
他们研究了927个用户的推特流,每个人有50到500个追随者。在每个人的信息流中,他们计算单词序列包含多少熵。然后,他们将这个数字输入到信息论工具fano不等式中,来计算一个人的信息流是否能准确预测他下一条微博的第一个词。平均来说,精确度的上限是53%。但是预测每一个连续的单词并不那么准确。
接下来,研究人员根据用户信息流加上15个最接近的联系人计算出信息流的预测上限:准确率上升到60%。当他们把用户信息流从等式中去掉后,这个数字下降到了57%。
研究人员最近在《自然-人类行为》杂志上发表了一份报告,称这意味着利用用户联系对信息流的预测效果几乎和包括用户在内的信息流一样准确,甚至比单独观察用户的信息流还要好。仅使用10个联系人的信息流超过了使用用户个人信息流的预测精度。相比之下,根据陌生人推特的随机分类,最高准确率为51%。
“我们用信息论中一些非常有趣的数学知识来展示,如果你有一个完美的机器学习方法,你能做得多好。”这项研究的第一作者,佛蒙特大学的数据科学家詹姆斯·巴格罗说。
巴斯大学的心理学家乔安妮·海因斯同意这一观点。她说这是一种独特的方法,超越了该领域的许多现有工作。
巴格罗说,结果表明,原则上,人们可以大致预测那些甚至不在推特上的人会发什么推特。实际上,这意味着找到一个人的社交网络朋友,然后找到这些朋友的动态。
目前,许多应用程序可以访问联系人列表,有些甚至共享联系人列表。例如,脸谱网利用用户的联系人列表来创建甚至不在互联网上的人的“影子文件”。
研究人员使用推特来预测个性、抑郁和政治倾向。基于朋友的推文也可以得出同样的结论。
然而,巴格罗说这项工作的一个实际限制是把所有的单词都当作平等的信息,但是有些人可能比其他人更了解你。如果你的朋友在推特上大量谈论同性恋权利,或者只关注共和党政客,这可能会特别暴露你的性取向或政治倾向。
加西亚还发现约会网站上的联系人可以预测一个人的性取向和关系状态,而推特上的联系人可以预测一个人的位置。海因斯说:“我们只触及了可以通过这种方式揭示的信息类型的表面。”
巴格罗说:“就隐私而言,我担心这些大平台有太多获取数据的方式。我认为人们没有意识到这种危险。”此外,人们可能不会考虑的另一件事是:“当他们放弃自己的数据时,他们也放弃了朋友的数据。”(唐毅宸)
相关文件信息:DOI:10.1038/s 11562-018-0510-5
《中国科学日报》(2019-02-15第三版国际版)
上一篇:出卖什么意思 出卖的反义词
下一篇:科学家现在可以将想法直接植入猴脑