|
作者:[美]安德雷斯·韦思岸(Andreas Weigend) |
过去传统银行或是签证中心判断你的消费行为参考的银行存款数和打印的流水单,线上的数据能更准确地评估个人信用等级。比如,消费行为不仅仅参照消费数额,而是取决于你用这笔钱做了什么。如果你用来买电子游戏,这样对信用值是不利的,但如果你用来买尿布,对你的信用积分来说是好的。那为什么买尿布会比玩游戏好呢?买尿布的消费行为显示出你是一个有责任感、关心他人的人。
另外一个关于尿布的例子与数据挖掘有关,实际上是说不要去做数据挖掘。最开始市场分析显示,买尿布的人也会买啤酒。你可能会问为什么呢?很有可能是这样的,晚上老婆派丈夫出去买尿布,丈夫在买尿布的过程中顺便就给自己买一点啤酒来犒赏自己。所以,我们今天所说的大数据,并非新发明,也不是要从挖掘数据开始,而是从问问题开始。尤其是在当今的时代,数据呈爆炸性地增长,要做的是先问问题,接着用数据来找答案。
在数据带来便利的同时,也涉及大量的个人隐私的泄露。相信很大一部分人有着这样的担忧。也许软件比我们自己更了解自己,但同时,如果这些数据泄露或者被数据持有者倒卖,会是一件很危险和麻烦的事情。那么,面对数据,消费者只是被动的吗?
作为普通吃瓜群众,大数据如何服务于我们?
在美国和英国,庞大的消费者信贷资料中心负责收集和分析有关个人负债与信用卡还款行为方面的数据,每年都会向客户提供一份个人信用报告复印件。它们鼓励你检查这些数据,并在发现任何错误时通知该中心。如果你没有申请贷款,却发现许多以你的姓名与住址提交的贷款申请,这就是你的身份被盗用的迹象。该中心根据你是否按期偿还贷款的记录是迅速偿清短期债务还是累积了高额或循环债务、信用卡账户的开通时间、申请新的贷款的次数,以及你名下的信用卡、贷款与抵押的整体情况,将你的金融行为与财务状况表示为信用评分。它们会告知你,你在去年有哪些行为给你加分或减分,还会通过描述性分析具体说明它们为各种行为赋予的权重。你从中可以了解到,信用评分中有30%来自及时还款,有10%取决于你的信用卡欠款与其他长期性贷款的情况。
如果你收到的信用报告表明由于你经常逾期还款,导致你的信用风险高于平均水平”,你就需要通过提前或按时还款,努力提高自己的信用评分。你可能认为自己的信用评分是一个数字,即你的金融信用评分(FICO)。但每一个中心给你的信用评分是不同的,因为它们会独立计算你的评分。《纽约时报》统计至少有49 个不同版本的信用评分体系,它
们依据的不仅是各中心收集的数据和收集数据的方式,还包括你申请的贷款种类。此外,据《财富》杂志称,即便同一家中心对同一个人也不只给出“一个”信用得分,因为“每一家机构”(即考虑是否为你办理新的信用卡、贷款或抵押的银行)都会调整各种参数。这种类似于单向镜的做法,导致你无法像审核数据的银行工作人员那样查看这些数据。
真正的透明性能让你看到不同金融机构对不同范畴的信贷数据所分配的权重,换言之,你能了解到金融机构是如何看待你的信用记录的。通过这种方式访问自己的数据,就能知道申请贷款时应该优先考虑联系哪几家银行。
有些数据服务商注重为个人提供产品与服务,有些数据服务商注重为公司与组织提供产品与服务。这些数据产品和服务将为用户带来更大的透明性与主动性。你所要做的就是选择合适的数据服务商,由他们提供工具帮助你提高数据的透明性与用户的主动性,评估数据服务商回馈给你的好处是否合理。
我们近期才认识到社交数据可能对自己不利。我认为需要制定一整套标准,作为我们对数据挖掘进行评价的标准。以下6 项权利为此提供了框架。
第一个就是查看数据、获取数据的权利。例如你可以在自己在淘宝上查看所有的交易记录、购物趋势以便你做出更好的决策。
第二个权利就是看到数据加工的过程,像百度和Google这样的公司,他们会把很多的数据汇总起来进行加工,这样你就能看到他们加工的过程。如果以蚂蚁金服的例子来说,一是能够看数据的权利就你可以知道他们到底收集了有关你的哪些数据。再来就是具体看到蚂蚁金服是怎样计算你的积分,这样就帮助你做出更好的决策,是否多买尿布。
还有4个权利是强调消费者主动的权利,第三个是修改数据的权利,也就是所有的数据你都有权增添删改。第四个权利就是将数据模糊处理的权利,消费者有权利决定是否想让别人知道你确切的位置。而做消费者你应当有权决定,因为如果你订了外卖,你需要送外卖的人把外卖送到你家里而不是邻居家里。但是在有些情况下,可能有些人不太希望别人知道自己晚归的太太去了哪里,从哪里回来。第五个权利就是能够用数据做实验的权利。最后一个权利就是导入和导出数据的权利,可以要求你的数据加工公司将你的数据发送给其他人。
大数据是要从消费者的视角写你的等式,然后你要拥抱透明度而不是抵抗它。过去,公司赚钱是通过建起高高的墙,筑起信息壁垒,而未来公司要赚钱就必须消除这种壁垒。
通过各种方式,社交数据的革命使之前从未量化或无法量化的一切事物都能被量化。过去,我们有理由说,我们无法利用数据或工具对全社会所面临的选择进行归纳和分析。这种情况现在已经一去不复返了,我们可以让自己的选择更加个性化,并观察由此产生的影响。当然,这并不容易实现。
透明性与主动性将推动我们向具体目标迈进,但它们并没有为我们确定目标。此外,没有一种“放之四海皆准的设置”能为所有人优化数据所用;即便我们能够完美地进行一切测算,每个人对各项权重的分配也不一样。未来,我们可能会通过分析一系列数据,极为精确地预测人们的健康与幸福情况,并据此对各项选择排序,这些数据包括人们的搜索条件、社交图片、基因、脸部表情。如果你根据自己在大学所学的知识及之后打算选择的职业道路了解到自己患心脏病的风险很大,你会做出不同的选择吗?你会更换工作、医疗保险或居住的城市吗?你在访问数据、检查数据、修正数据、模糊处理数据、对数据开展实验、导入和导出个人数据时,就能更好地了解自己的目标、关注点,并对自己个人健康函数中的各个变量设定权重。通过体验你在考虑不同假设情况时的感受,你将会坚持自己的价值观,在必要时还会调整自己的公式。我们现在有能力对艰难决定中的取舍进行量化,突出我们的价值观,并测算由此产生的结果,这促使我们在公平与不公平之间做出选择,我们再也不能选择视之不见,也不能选择碰运气。当我们有能力对世界上一切事物的数据进行挖掘,在透明性与主动性方面行使我们的权利时,我们的数据将服务于我们。
(本文内容来源于《大数据和我们》及作者安德雷斯·韦思岸演讲内容)
关于作者:
安德雷斯·韦思岸(Andreas Weigend),世界范围内的重量级大数据、移动社交技术和消费者行为专家,社交数据实验室(Social Data Lab)的创始人和负责人,最早开创亚马逊“猜你想买”的个性化消费推荐的亚马逊前首席科学家。任教于美国斯坦福大学、加州大学伯克利分校,以及中国长江商学院、复旦大学、中欧商学院、及清华大学,讲授大数据相关课程。斯坦福大学、剑桥大学物理学博士。
他所研究的社交媒体数据理论同时为大型企业和初创公司实现社交数据变革的,他所提供咨询服务的公司包括:阿里巴巴、GE、汉莎以及Master Card.他在演讲中分享了自己的独到见解,包括大数据对于个人、商业和社会所带来的势不可挡的影响。