欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

Facebook的数据挖掘,从谈情说爱开始

科普小知识2022-03-25 09:24:00
...

不管“大数据”的概念是不是一个陷阱,没有人能否认在我们这个时代,互联网巨头们正坐拥大量的信息。社区产品和社会产品生存的基础是来自用户的数据。

钛媒体注意:不管“大数据”的概念是不是一个陷阱,在我们这个时代,互联网巨头坐拥大量信息是一个不可否认的事实。社区产品和社会产品生存的基础是来自用户的数据。

八仙过海是如何展现他们的魔力让你感受到大数据的?例如,去年年底,你一定看到很多朋友在微信的朋友圈里分享一张“定制”的图片,这标志着你加入了微信产品增长的时间线。你可能会发现,在登录豆瓣电台后,通过一个特殊的记忆频道,豆瓣已经帮你录制了一年的音乐。你从哪一天注册到哪一天听了第一首歌,哪一天听得非常悲伤...没有遗漏任何东西。如果你是智虎的用户,你一定是用了“时间机器”。直到那时,数据组才突然发现你写的答案已经被成千上万的人分享了...

在这些亲密和轰动的产品背后是基于数据挖掘的最基本的形式。这些体贴的数字产品通常会给你的阴郁生活带来些许安慰,你担心年底红包缩水,同时绞尽脑汁写年度总结(除了支付宝的账单,这几乎是一封恐吓信,提醒你“过去一年制造了太多的罪恶……”

你知道社交网站的霸主脸书是如何处理大数据的吗?脸书知道你什么时候和某人约会,什么时候分手——是的,就这么简单。

《大西洋月刊》最近的一篇文章发布了一个有趣的图表(如下),显示了一些脸书用户在一段时间内发布的帖子数量。这是什么意思?

这张照片来自脸书。今年情人节后的第三天,脸谱网通过其发展博客宣布了一项由数据研究部门的科学家团队做出的发现,即利用脸谱网网站的统计数据,它可以确定发布帖子的用户是否以及何时点燃了爱情的火花。换句话说,脸书可能比一些情侣更早发现他们之间的爱情。

类似于传统的离线结婚过程,社交网络用户在建立恋爱关系时也会经历所谓的“求爱”阶段。脸书科学家卡洛斯·丢克(Carlos Diuk)透露,随着时间的推移,在网恋的求爱阶段,两个脸书用户都会发布更多。然而,一旦他们真正认识到对方是对的人,他们在对方脸书留言板上的帖子就会减少。原因可能是恋爱中的恋人在底线下会有更多的时间在一起。

迪乌夫用这样的数字解释了以上所有问题:

通过大量的数据,我们发现在成为恋人前的100天里,未来两个人相爱的人数逐渐缓慢增加。假设关系正式开始的日期是“第零天”,则此类帖子的数量将从“第零天”开始减少。我们发现,在“零日”发帖高峰前的12天里,平均每天有1.67篇帖子被发帖。在“零日”发帖后的85天里,平均每天有1.53篇帖子被发帖。

用一点常识和心理分析来解释这一现象就更简单了:情侣间的恋爱结束后,双方会花更多时间在一起,在线互动会让位于离线现实世界的互动。

多伊奇说,数据还显示了另一个有趣的趋势,即离开单身后,夫妻间的爱情普遍大幅上升,互动的内容会变得越来越甜蜜,传递积极的能量。正如脸书下面的趋势线所示,在第0天和第0天之后的第一天,情侣间发布的信息数量激增(与上图相比)。

拥有2.7亿活跃用户的脸书拥有数亿这样的用户信息。脸谱网为这项分析收集的数据是那些在2010年4月至2013年10月期间宣布了他们整年恋爱的夫妇,不包括那些在此期间改变关系的夫妇。当分析恋人之间的爱有多深时,它主要是针对英语用户的。

迪奥克的同事和另一位脸谱网数据研究团队的科学家波格丹一世州立大学也透露了两个有趣的发现:

首先,如果一段通过脸书发展起来的关系可以持续三个月以上,那么这段关系可能会持续四年甚至更长时间。

其次,情侣最有可能分手的月份是五月、六月和七月。

这显然将取代心理学家和从事社会研究的人的工作节奏。

然而,你可以说这种研究几乎是情人节营销。实话告诉你,脸书真的很喜欢用情人节的时段来玩数据分析。

早在2012年,脸谱网的数据研究团队就开始做一些有趣的尝试,利用用户的数据自愿透露他们的感受。2011年底,脸书开始让用户在社交网络上分享他们的收听习惯(数据来自Spotify插件),同时脸书的数据工作团队也开始工作。

这些有八卦的新数据工程师结合了情感关系和音乐这两个概念,可以发现用户在开始新关系时喜欢播放哪些歌曲,以及分手后经常提到哪些歌曲。我们不知道具体的分析工具,但是看看这个在2012年情人节发布的排行榜,它比仅仅宣传情人节广告更聪明和有趣吗?

新恋情开始时人们最喜欢的歌曲:不想回家(音乐家杰森·德鲁罗的《不想回家》);最受欢迎的失恋歌曲前10名包括:

杰森·德鲁罗的《不想回家》

碧昂斯的《爱情至上》

李尔·韦恩的《如何去爱》

布鲁诺·马斯的《你就是这样》

弗洛·里达的《好心情》

杰森·德鲁罗的《It女孩》

亚当·莱文体育英雄的“立体心脏”

布兰妮·斯皮尔斯的《罪犯》

维兹·卡利法的《无眠》

约翰·梅耶的《*的秋天》

相应地,当人们分手时,首歌是《洞穴》(丹尼尔·埃克法夫·蒙福之子乐团);恋爱中的人最喜欢的10首歌曲包括:

芒福德父子公司的《洞穴》

德雷克的《船员之爱》

坎耶·韦斯特的《所有的灯》

阿黛尔的《在深渊中翻滚》

德雷克的《保重》

布鲁诺·马斯的《会下雨》

蕾哈娜和加尔文·哈里斯的《我们找到了爱》

“你想叫什么就叫什么”

赛琳娜·戈麦斯的《像情歌一样爱你》及现场

大卫·盖塔的《没有你》,主角是亚瑟

除了让你开怀大笑之外,脸书还在其基于数据的推荐引擎上使用这些分析的结果。产品工程师基于各种猜测结果推出了一项新的社交服务——为用户提供最适合他们心情的歌曲。

Facebook的数据挖掘团队就像一群掌握了爱的“读心术”的魔术师,从“仁”、“智”和“畅”开始使用大数据,这条路线看起来更踏实。这让人们想到国内大大小小的婚姻平台和社区。他们没有意识到他们仍然处于1.0时代吗?在未来,真正的媒人和“知心姐妹”可能是社交网站!