纸牌屋的数据生产力
事实上,大数据的核心不在于“数字”,而在于“大”和“数据”。所谓“大”是指数据积累到一定程度。而“根据”,就是找出论据,供企业决策参考。
在信息社会,数据将成为核心资源,就像农业时代的土地和工业时代的能源一样。
中国正在奔向那个时代,但仍有一段路要走。
背后的秘密纸牌屋
在这个网站上,用户每天产生多达3000万个行为,如收集、推荐、回放、暂停等。随着数据挖掘技术的成熟,网飞开始利用这些数据制作电影。
毫无疑问,最受欢迎的美国电视节目是《纸牌屋》。这部美国政治悬疑剧,被中国网民昵称为“白宫甄嬛传”,目前在全球40多个国家流行。严肃的媒体——无论是《纽约时报》、《洛杉矶时报》还是最新一期的《经济学人》——都在重要章节中研究其成功之处。该剧的制片人既不是电视台,也不是传统电影公司,而是网飞,一个类似于中国土豆网和优酷网的在线视频广播网站。
在早期,网飞是北美家喻户晓的在线电影租赁提供商。它的主要业务是通过邮寄租赁DVD来赚钱。然而,在互联网时代,这种盈利模式正在逐渐衰落。结果,网飞转向了在线流媒体,但转型并不成功,并被资本市场抛售。像中国的视频网站一样,网飞也在寻找突破的方法。2012年,网飞开始了它的上升之旅,准备推出自己的自制剧。然而,在决定拍摄什么和如何拍摄时,网飞违背了常规,牺牲了它的秘密武器——大数据。
事实证明,网飞从一开始就意识到了数据的重要性。在这个网站上,用户每天产生多达3000万个行为,如收集、推荐、回放、暂停等。网飞用户还将给出400万的收视率,300万的搜索请求,并询问节目的播放时间和设备。这些都被网飞转换成代码,并记录为内容生产的要素。在早期,网飞使用这些数据进行准确的推荐。随着数据挖掘技术的成熟,网飞开始将它们用于落后的电影制作。
这一次,网飞的工程师发现喜欢英国广播公司戏剧的用户、导演大卫·芬奇和老戏《凯文·派西·福勒》有一个交集。如果一部电影同时满足了这些元素,它可能会卖得很好。
网飞决定赌一把。他们以1亿美元买下了早在1990年播出的英国广播公司电视连续剧《纸牌屋》的版权(几乎是美国电视连续剧平均价格的两倍),并邀请大卫·芬奇担任导演,凯文·派西·福勒担任男主角。
事实证明他们是对的,《纸牌屋》不仅是网飞最受关注的电视剧,也是美国和40多个国家最受欢迎的电视剧。尝过甜头的网飞将在2013年继续推出四部国产电视剧。
倾听数据
微博和微信等社交媒体上的“小字”在某种程度上也是数据之声——社交媒体上的数据之声。网飞只是掘金的先驱之一,中国的追随者一个接一个地出现。2013年3月,搜狐收购了《纸牌屋》在中国的独家转播权。这个过程本身就是一个觉醒的故事。
据搜狐视频版权影视中心负责采购的高级总监马克告诉媒体,早在2012年5月,他们就在一次美国电影会议上看到了《纸牌屋》的信息。当时,只有该剧的主题和阵容,没有确定的广播平台。搜狐当时没有做出购买的决定,但留下了印象。2013年春节前,看过样片后,马可犹豫了:市场会不会不接受这样的高端电影?他有一个伤感的原因:一些内部高管说他们喜欢看,但他的妻子根本看不到。然而,在春节期间,马克发现该剧在微博和微信上一些相对有影响力的朋友圈子里有很好的口碑,并开始发酵。他还注意到一些字幕组甚至加班加点开始盗版。一些互联网上的主流精英支持这部电影,增加了搜狐的信心。马克认为该剧的用户群应该以经验、声音和高收入为特征。在众多视频网站中,搜狐视频一直在努力将自己定位为推出高质量美国电视节目的平台。如果这部电视剧推出,一方面,搜狐将因其“优质美国电视剧品牌”的定位而获得加分。另一方面,它也可以用来吸引广告商为补丁广告支付更高的价格。总的来说,搜狐决定立即推出。春节过后,他们决定增加一笔临时采购。整个过程只花了两周时间。
2013年3月2日,“纸牌屋”在搜狐推出。在接下来的10天里,该剧不负众望,很快登上了排行榜的榜首。马可也赢了。他们的决策并不像网飞那样依赖于多年来的数据挖掘成果,而仅仅是微博、微信等社交媒体上的“几句话”,但在某种程度上,他们也在倾听数据的声音——社交媒体上数据的声音。
关注社交媒体
社交媒体留下了大量数据。这些痕迹的谜题显示了不同事物之间隐藏的甚至是令人费解的联系,例如罗大佑音乐会和大众汽车之间的关系。
社交媒体上的数据正是许多中国数据公司目前正在研究的领域。
毕业于清华大学,从事广告精准营销已有6年。他观察到社交媒体对用户行为变化的影响正在逐渐增加。无论是买车、买房还是吃茶,消费者更有可能在微博等社交媒体上向朋友寻求建议。Ewe认为,企业在社交媒体上的传播在未来可能会成为一个和搜索一样大的市场。结果,2009年在北京地下车库的一次聊天中,欧薇和朋友们一见钟情,建立了孔明的社会管理。
奥威尔提供了一款类似“社交管家”的软件,帮助企业管理微博和人人网等社交媒体。例如,在孔明社交活动的背景下,一旦粉丝评论并转发,信息就会被分类并显示出来。管理员可以根据不同级别进行回复和处理,以提高效率。如果有负面评论,其负面关键词捕捉和监控技术将发挥作用,提醒管理员优先回复和引导。对于一些大型企业来说,这种技术是非常实用的,因为如果只靠人力进行监控,成本很高,反应可能不及时,这将会让负面的舆论发酵,影响企业的品牌。
然而,这些只是低级应用程序。“我们的最终工作是帮助企业找到潜在客户,分析他们的特征、偏好和生活方式,然后根据这些制定有针对性的营销计划,以促进实质性交易。”奥威尔说。
Ewei给《南方周末》记者举了一个例子,比如买车。有些人可能会直接在微博上发信息说他们想买车。捕捉到这些数据后,他们可以直接将汽车广告推到另一边。然而,大多数人可能不会直接说有必要寻找“信息实际上有许多层面”。我们需要知道的是,哪些维度与我们想弄清楚的问题相关,比如买车”。
Ewe透露,在进行数据挖掘时,他们有一个惊人的发现:那些去罗大佑现场音乐会的人对上海大众汽车的兴趣增加了30%。“为什么会这样?这种分析也有道理。例如,这辆车的观众年龄在35岁左右,住在家里并希望提高生活质量的男性与罗大佑的观众非常一致。”
然而,这不一定是真正的原因。真正的原因并不重要。在业界流行的《大数据时代》一书中,被称为“大数据时代先知”的维克托·迈尔·舍恩伯格提出了一个重要的见解:放弃对因果关系的渴求,关注相关关系。也就是说,在许多情况下,只要某些事物之间有关系,知道“什么”就足够了,而不是“为什么”。
谷歌有一个名为“谷歌流感趋势”的工具,该工具跟踪与搜索词相关的数据,以确定美国的流感情况。如果大量的人搜索一些关键词,如体温计、流感症状、胸闷等。,系统将进行跟踪分析并创建区域流感地图(灰线)。结果与美国疾病控制和预防中心的报告(虚线)大体一致。来源:谷歌网站美国:美国疾病控制中心提供的流感样疾病(ILI)数据。
“影响力”是金钱
想想看,同样的冰淇淋,你花5美元和奥巴马花5美元是不一样的——“美国总统的选择”标志是赚钱的工具!
已经有许多公司诞生于微博等社交媒体。这些社交媒体管理工具面向公司和个人用户。甚至有一些应用程序试图量化和评分个人影响,以实现“业务”。
在这方面,Klout目前处于领先地位。它主要通过排名算法和语义分析来分析用户在推特、脸书和领英等社交网络上的活动,从而获得一个可以具体量化你的影响力的分数。影响分数的因素包括活跃粉丝的数量、您发送的消息的转发速率、原始速率和粉丝之间的交互等等。
不要低估这些分数。克劳特有一个著名的口号:影响力就是金钱。想想看,如果你吃同样的冰淇淋,你花的5美元和奥巴马花的5美元是不同的——“美国总统大选”标志是一个赚钱的好工具!
基于这一判断,一些企业开始实践。2012年2月,企业软件巨头Salesforce推出了一项服务,允许客户公司根据Klout评分灵活处理投诉。Klout值越高,投诉处理的速度越快,公司的态度和服务也会更加周到。奢侈品购物网站GiltGroupe也开始根据顾客的Klout评分向他们提供不同的折扣。
Klout的平台经理表示,未来,有影响力的人将能够免费使用机场的贵宾休息室,入住更好的酒店房间,并从重大品牌活动中获得更高的折扣。
为什么这些企业如此“势利”?原因其实很简单:在某种程度上,那些更有影响力的人往往在事业上更成功,拥有更大的购买力。即使这些人既没有钱也没有权力,至少他们还有很多“粉丝”。如果企业冒犯了这些客户,负面评论可能会传达给更多的人,对公司的品牌有更大的影响。
目前,Klout已经是一家只有不到100名员工的星级初创公司,已获得4000万美元的投资,估值已经超过2亿美元。
任重道远
“事实上,大数据的核心不在于数字,而在于大数据和数据。所谓大是指数据积累到一定程度。而“根据”就是找出证据,为企业的决策提供参考
然而,将“大数据”的概念局限于社交媒体太过狭隘。在中国,大数据的商业化还有很长的路要走。
红贝出生于1981年,是见证中国数据产业发展的人之一。2006年,他和他的同行瞿岩一起创立了一家名为AdMaster(中文名字叫京硕科技)的公司,其主要业务是经营在线广告。当时,随着在线广告的兴起,广告商和网络媒体之间迫切需要一个有效的渠道。因此,精细科技的模型也很简单。许多网站是为了广告位置而提前购买的,然后打包出售给广告商。红贝告诉《南方周末》记者,当时他们已经在金融和快速发展的行业取得了领先地位,但他们很快就开始转型。
2009年前后,随着网络广告在企业广告支出中所占比例的增加,企业主开始越来越关注广告效果,一种新的市场广告效果监控开始出现。
京硕科技的第一次转型开始于此时,当时他们将自己定位为独立于广告商和媒体的第三方广告监控组织。
两年前,随着大数据概念越来越流行,京硕科技开始了向大数据的第三次转型。“这是我们从一开始就想做的事情。”红贝说,经过这么多年的技术积累,他们终于等到了机会。到目前为止,京硕科技已经完成了两轮融资,融资总额达2000万美元。事实上,自从红贝开始监控广告效果以来,他就一直在处理数据。
“事实上,当我们谈论大数据时,核心不在于‘数字’,而在于‘大’和‘数据’。所谓“大”是指数据积累到一定程度。而“根据”就是找出证据,为企业的决策提供参考在红贝看来,经过这么多年的互联网发展,数据量不再是问题。问题在于如何找到这些“数据”目前的状况是,他们大多停留在“数据,没有认知”
根据红贝的说法,五年前,数据分析公司可能需要三个月来挖掘数据,但现在,3秒或0.3秒就足够了。数据挖掘的速度已经大大提高,但这并不意味着人们对数据的了解有所提高。红贝说,与他们合作的许多客户手中实际上有大量数据,但许多人不知道如何看待这些数据或其价值。“我们必须首先从客户教育开始。”
然而,随着大数据的价值变得更加突出,一些企业也认识到了机遇。腾讯和阿里巴巴等主要互联网公司已经建立了自己的数据挖掘团队。而银行、保险、电网等拥有大量行业数据的公司也开始在这方面布局。
" AdMaster将来要做的是营销数据处理公司."红贝说,“这种营销不仅仅是广告,而是真正服务于”经营。“红贝解释说,他们对广告效果的监控大多是事后或实时的,而未来的大数据在企业做出决策之前会提供意见和参考——就像网飞利用数据来推后电影的制作。