Facebook史上最大丑闻:大数据里的伦理学和政治学教程

  [复制链接]
查看2943 | 回复2 | 2018-3-23 22:58:05 | 显示全部楼层 |阅读模式
Facebook史上最大丑闻:大数据里的伦理学和政治学教程

2018-03-22 15:33:19
文/阳 光
眼下,全球最大的社交网站Facebook(脸谱)正值生死存亡之春。因为它在一周前卷入了一场被《权力的游戏》还要暗黑的谍战剧中,而且不幸充当了暴风眼的中心角色。


这场当下还在酝酿发酵的、全球最吸引眼球的谍战剧,几乎可以完胜好莱坞历史一的任何一幕肮脏的政治权谋剧目,因为它几乎席卷了这个星球上当下最有权势的几个炙手人物:


拥有全球21亿用户(臣民)的社交帝国沙皇Facebook创始人马克·扎克伯格,美国总统特朗普、俄罗斯总统普京、美国亿万富翁兼顶尖的人工智能专家罗伯特·默瑟(Robert Mercer)、特朗普密友美国前白宫首席战略师兼总统高级顾问班农(SteveBannon)、俄国彼得堡大学副教授兼英国剑桥大学高级研究员(Aleksandr Kogan)、最早向英国《卫报》爆料的一家名为英国剑桥分析公司的前联合创始人怀利(Christopher Wylie),一家在英国剑桥设立虚假办公室、“可以玩弄整个国家于鼓掌之间”的大数据公司CA(Cambridge Analytica)创始人兼CEO尼克斯(Alexander Nix)……


序幕:顶尖AI科学家、亿万富翁默瑟博士的出场

首先,请允许笔者花一点点时间,拼贴还原一下这场高科技谍战剧的主要剧情和时间线索:

剧情最早可以追溯到美国总统特朗普的金主、一位神秘的亿万富翁和顶尖AI科学家罗伯特·默瑟(Robert Mercer)。


如果说这个世界上总有为数不多的几个多金博学有权势的“超强大脑”,默瑟无论如何算得上一个。1972年,他从伊利诺伊大学香槟分校获(UIUC)获得计算机博士学位之后,加入IBM,成为一位专门从事计算机语言处理的科学家。在IBM期间,他主导研发了一种所谓的统计机器翻译技术。这种技术可以分析网络文本,将文本中的单词进行分组和聚合,再通过机器的深度学习结合上下文完成自动翻译。

别忘了,这是默瑟在上世纪七八十年代就掌握的AI(人工智能)技术,比起AI在2016年前后成为一个流行词,早了将近半个世纪。为了表彰他在人工智能领域的成就,默博士虽然离开了计算机界,2014年依旧获颁ACL(计算机语言学协会)的ACL终身成就奖。

默博士的机器翻译一面世,当时就令学界侧目。1993年默瑟离开了IT界,加盟了一家名为文艺复兴科技(Renaissance Technologies)美国对冲基金公司,身份是联席CEO。这家创办于1982年的对冲基金和传统基金不同,以“科技智能”闻名业界,成员都是一大帮数学家、计算机科学家和物理学家,主打机器算法中的量化交易。

过去20年来,文艺复兴基金的年平均收益率高达72%,管理基金规模超650亿美元,业界声明赫赫,自然与这一大帮“全球超强大脑”的算法相关。

政治一默博士是最坚定的右翼,作为华盛顿邮报2015年评选的“十大政界最有影响力亿万富翁”之一,他成为时任美国总统候选人特朗普2016年大选的主要资助者,当然更重要的是,2013年他还主要资助成立了本次最大丑闻中的这家空壳公司——专门从事政治大数据分析的剑桥分析公司(Cambridge Analytica)。


转折点:天才少年怀利和天才大叔班农的见面


然而,事情的真正转机,是在2013年计算机“天才少年”怀利(Christopher Wylie)与“天才大叔”、时任极右派媒体布赖特巴特新闻网(Breitbart News)执行主席史蒂夫·班农(Stephen Bannon)。


班农1983年从哈佛商学院拿到MBA学位之后,从“穷二代”翻身成为高盛的投资银行家,多年混迹投资银行、电影和媒体界,与亿万富翁默瑟博士甚为熟稔。

2013年,23岁天才少年怀利和60岁的天才媒体大叔班农的会面,成为特朗普扭转美国大选走向的转折点。


根据怀利后来的回忆,两人的第一次见面充满了戏剧性。

被称为计算机“天才”的加拿大少年的怀利16岁辍学,喜好政治,20岁进入伦敦政治经济学院学习法律,2013年时值23岁的他正在攻读流行预测博士学位。此前,剑桥大学心理测验学中心两位教授科辛斯基(Michal Kosinski)和史迪威尔(David Stillwel)在Facebook上开发多款应用软件预测网友性格特征和行为模式的研究,让他眼界大开。

怀利关于如利用社交网络的用户数据,建立起数据模型,给每一个用户机器“画像“”,瞄准每一位用户的“心魔”的“流行预测”算法,与班农的想法不谋而合。两人相见恨晚,大喜过望。

“特朗普看上去就像一双UGG或者Crocs,你怎么才能让人从感觉‘丑死了’,变成每个人都想穿它们,这就是他班农在找的点。”怀利说。正好班农也深信,政治只能算作文化的“下游”,“改变政治,先从改变文化开始,而文化流行趋势就是一个重要载体。”

两人一拍即合。班农将怀利的计算机“流行预测”算法,推销给了默瑟博士及其丽贝卡。当即,慷慨解囊1300万美元,在这一年(2013年)与英国数据分析公司SCL Elections联合创办了CA(剑桥数据公司)。

接下来的故事发展得格外顺风顺水。

一开始,川普金主、华尔街大佬默瑟博士创办CA公司之后,曾派怀利与剑桥大学心理系著名教授辛斯基和史迪威尔的这一课题组联系,试图建立合作关系。该课题组在2007年以来发明了一整套针对facebook用户信息抓取并进行建模的技术,但仅仅局限于学术研究领域。

因为涉及到数据伦理问题(用户数据仅仅作为学术研究之用,而不能用于商业目的和政治选举等其他用途),剑桥大学心理系的这一课题组负责人拒绝了怀利的要求。

关键时刻,一位来自剑桥大学心理学系的高级研究员科根(Aleksandr Kogan)主动站了出来。

高潮:神秘的科根博士是何方神圣?

得来全不费工夫。在剑桥大学心理学担任高级研究员的科根博士还有一个秘密身份并不为人知。他同时也是俄国彼得堡大学副教授,并从俄国政府领取项目经费,从事一项名为“社交网络中的压力与心理健康”的研究项目。CA公司后来基于用户数据发明的美国大选“心理学建模”方法,正是此人在剑桥大学所参与的课题组所首创。

(科根博士,剑桥大学心理系高级研究员的身份背后,另一个身份是彼得堡大学副教授)

2014年6月4日,CA公司于科根博士注册的一家名为全球科学研究(GSR)的公司达成合作,通过后者收集Facebook上的用户数据,了解用户性格特征。

紧接着科根博士以学术研究的名义,与2015年推出基于可访问Facebook的应用程序“This Is Your Digital Life”,开始招募脸谱网上的年轻用户,称可以帮每一位感兴趣的Facebook用户免费提供你的个性预测,并且每名受访者能得到2到5美元的报酬。

自愿参与测试的受访者需要用自己的Facebook账号登录应用,科根博士则可以通过隐藏这个小小APP里面的数据爬虫技术,计算机会远程自动收集到登录者Facebook账号上的 “城市”、“点赞”、“好友”等所有隐私资料和敏感的个人信息。

更恐怖的是,除了受访者本人之外,这个迷你APP应用还能收集受访者每一位Facebook好友的所有数据资料。

据后来的统计,共有约32万名美国选民参与此次测试,再加上被测试者每个人的Facebook好友,科根博士一下子收集到了超过5000万Facebook用户的数据,并将5000万份敏感的个人用户资料悉数转手卖给了第三方:剑桥分析公司(CA)和它的母公司SCL。

根据科根博士、怀利博士和默瑟博士的算法,研究人员将个性测试的结果与Facebook用户的数据进行匹配,先在推测用户的心理模式基础一,建立算法的初步数据模型。

接下来,研究人员可以将所有Facebook用户的数据与选民记录等资料进行组合和匹配分析,再运用算法的数据模型,为每一位选民“画像”,推算出每一位选民的上百个数据点:你的年龄、性别、工作、政治观点、具有煽情点的兴趣爱好,以及所谓的“心魔”(共鸣点)等等。



在掌握每一个选民的个人基础信息后,CA公司再根据不同选民的特征,推送极具针对性、能准确击中用户“心魔”(共鸣点)的政治广告和各类消息。

根据卫报的报道,科根博士窃取的这个拥有5000万个Facebook用户的数据库中,包含了美国11个州的200万个匹配文件,这些个人信息与选举登记簿都充分匹配。而5000万用户的数据,相当于Facebook北美活跃用户的1/3,其中1/4可能都是美国大选的选民。

谢幕:马克· 扎克伯格和20亿用户,谁是沉默的羔羊?


故事至此,远未终结。

自从2018年3月16日英国《卫报》、《纽约时报》、《观察者报》等相继追踪报道Facebook泄露用户敏感数据以来,包括马克在内的脸谱网高管一直保持高度缄默而备受批判,一周后,直到3月20日马克才出面发声,承认“没能保护好用户数据”。


更严重的指责还在后面,根据马克的坦白,早在2014年Facebook就发现了科根博士可疑的滥用数据行为,以及2015年从《卫报》记者那里就获知了科根博士倒卖数据的事实,但马克本人和Facebook高层从未对用户加以披露和说明。

根据英国数据保护法,CA公司和科根博士收集用户信息的做法并未得到用户许可,在未经允许下将个人数据卖给第三方,更是属于严重的违法行为。而科根此前被允许收集Facebook用户信息,但声称仅仅限于学术研究目的之用。

更有意思的是,Facebook于2015年查封了科根的数据收集应用权利,并要求科根和CA公司销毁相关数据。怀利博士回忆说,所谓销毁相关数据,就是指只需在Facebook出具的证明文件上打个钩,确认自己销毁了数据,签字后将文件寄回,就能证明数据已销毁。

换言之,这5000万Facebook用户数据究竟有没有被销毁,依旧还是悬案。

Facebook大规模用户数据严重泄露丑闻曝光后,其股价一路下跌,累计已跌近600亿美元,其最新市值已经被阿里巴巴超过(前者4920亿美元,后者5100亿美元)。

2018年将是马克和Facebook的生死之年。


至于阿里巴巴,还是要提醒读者一句。读者诸君还记得2018年1月3日的支付宝用户“年度个人账单”晒单风波吗?一纸偷偷隐藏的协议要求每一个晒单用户无偿地允许支付宝公司可以获得你在支付宝上的所有信息,包括可以随时随地将这些用户信息转让给第三者(支付宝的商业合作方)。

在律师岳屾山的友善提醒下,支付宝以称呼自己“非常傻逼、愚蠢至极”的方式收回了这一做法。笔者想问的是,在商业巨头、超级政府以及对伦理学不屑的那些顶尖AI科学家哪里,究竟谁才是真正的“非常傻逼、愚蠢至极”的对象呢?用户?数据科学家?科技富豪?还是数字监控惠及每一个网民的资深政客呢?



学无止境 | 2018-3-26 08:49:43 | 显示全部楼层
来中国大陆吧,这些都不是问题,呵呵~~~~
日出东海落西山  愁也一天喜也一天http://cache.soso.com/img/img/e100.gif
shiguanbaby63 | 2018-7-20 11:21:58 | 显示全部楼层
试管之路是辛苦,但坚持下来结果是让人幸福的,现在想起来还是要特别感谢安排我的顾问,人很好。真心给想了解试管的朋友们介绍她,她的薇是shiguanbaby63

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
您需要登录后才可以回帖 登录 | 注册

本版积分规则