您所在的位置:首页 - 新闻快讯 - 学院新闻

学院新闻

张欣:数字经济时代个人数据商业利用的多元图景


张欣:数字经济时代个人数据商业利用的多元图景


编者按

本文系对外经济贸易大学法学院助理教授张欣博士在“数字经济发展与个人信息保护”研讨会暨中财数字经济与法治研究中心成立大会第三单元“个人信息保护与数据商业利用”上的发言。文章内容经张欣博士确认授权,转载须经作者本人同意,并标明来源。

数字经济时代个人数据商业利用的多元图景

张欣

对外经济贸易大学法学院助理教授

首先特别诚挚地向中央财经大学数字经济与法治研究中心的成立表示祝贺,也非常感谢主办方的邀请。我今天报告的题目是《数字经济时代个人数据商业利用的多元图景》,在报告中我主要以优步公司为例,阐释个人数据在商业利用的多元场景和可能带来的挑战和问题。

我的报告主要由四方面构成:一是数字经济革命时代算法经济的兴起,我认为,数字经济革命的核心其实还体现为一种算法经济;二是数字经济时代个人数据商业利用的经济性维度;三是数字经济时代个人数据商业利用的公共性维度;四是以上两个维度带来的启发和思考。

 

首先我们进入第一部分——数字经济革命时代算法经济的兴起。我认为,数字经济运行的核心支柱有数据和算法两个层面。尤其是算法的产生,可以实现用户数据收集后大规模自动化商业性决策,更好地联结供需双方并进行匹配。例如,电子商务场景下的淘宝平台就是通过搜索算法实现商品的展示和供需双方的匹配。还有在我们现在常见的平台经济中,算法也发挥了巨大的功用。例如,优步利用算法在车辆和乘客之间进行派单、对乘客和司机进行评级以及利用算法来衡量一位乘客对一段乘车距离的心理预期的支付价格。

 

看了这些商业化场景,我们会发现平台经济和传统经济的区别之一在于,平台企业在运营时通过算法经济模式对个人数据的利用达到了多元化维度。它使得个人数据的利用在经济性和公共性层面交织得更加紧密。例如,个人数据的经济性,就是使得平台企业通过算法对用户的数据进行商业化直接利用,这一部分我们在之前两个单元实现了比较充分的讨论。但还有一个视角可能在理论和实践层面被忽略,那就是个人数据在商业化场景下的公共性维度。对于这个维度,我在《中国法律评论》2018年第2期的一篇文章中提出了“平台驱动型参与”的现象。这个现象就是从一个侧面表现了个人数据商业化利用中的公共性维度。所谓“平台驱动型参与”,是指平台企业在联结商品或者服务的供需两端时,也获取了相当规模和数量、共享某一利益、拥有稳定特质的用户群。伴随着平台经济法律制度建构中多方主体日趋激烈的博弈,一种由平台作为驱动主体,借助数据和算法对用户和利益相关者精准动员,以期对特定立法政策展开制度外影响的“平台驱动型参与”逐渐兴起。

 

讲解完个人数据商业利用的两个维度后,我将分别对两个维度进行具体介绍。首先,是数字经济时代个人数据商业利用的经济性维度。这一部分我们拟以优步峰值定价算法为例。相信这个算法大家并不陌生。这一算法就是运用经济学中价格弹性的理论作为支撑,对订单实行动态定价。例如,在交通高峰期,就可以根据不同密度的乘客和车辆供应情况在特定的区域进行提价。那么根据经济学的理论,提价后就会有更多的司机提供服务,而乘客也可以获得更多的出行服务供给。这一理论实际上是优步动态定价算法的正当性基础。但就算法本身而言,仍然处于我们常说的“黑箱状态”。因为该算法的数据和架构并未公布。那么,在个人数据商业化利用的场景中,就随之而来出现一个挑战——这一算法到底是否完成了其预期设定的目的,实现了动态调整司机和乘客间的供需关系,使得高峰时期的乘客获得了更多的运输服务呢?2015年的一项研究部分地回答了这一问题。该项研究在2013年12月到2014年1月展开。在这一期间,研究者自己注册了43个优步账号,通过特定的程序处理对整个优步的动态调整算法运行中的数据进行抓取。通过抓取和研究之后,研究者发现:(1)优步的算法是根据实时的车辆供给的情况、乘客需求的情况、天气、路况、预计等待的时间等动态因素制定每一订单的价格,且该算法每五分钟进行一次更新和动态加价;(2)优步的峰值定价算法在客观运行上存在一个现象,叫做时机抖动。这个词的意思是说,算法每五分钟进行调整加价的时候会产生时间的滞后性,这使得调整加价的一段时间中用户在同一区域中收到的车费价格可能不一致。当进一步比较旧金山和曼哈顿地区的价格后,研究者发现,一位乘客从某一高峰区域走向另一临近区域,可能只需五分钟路程,就可以更好地规避峰值定价,节省10%到20%的费用。因此,这个研究发现,峰值定价算法对乘客的需求实际上产生了负面影响,对车辆供给产生的影响虽然较为正面但非常微弱。这一研究给我们的启发是,优步算法的实效和其预期目标之间存在差距。当研究者将这一算法漏洞报告给优步工程师时,他们立即进行了算法优化来修补漏洞。因此,这一举动也与我们一会儿要讨论的算法规制中不同的激励机制有关。我们看到在算法带来的决策成本并非仅由用户承担时,平台企业本身是具有较强的激励来优化算法的。而当某一算法运行的决策成本全部由用户承担时,可能就需要通过规制来督促算法使用者对算法的优化和正当性进行关注。同时,优步算法的研究也启示我们,作为一般用户,我们的确难以探知某一算法是否对我们施加了歧视或者不公平待遇。因此,最近讨论的GDPR中自动决策解释权的问题是一个非常值得关注的问题。而在美国的语境下,如何对算法进行稽核和规制对于算法治理这一主题也是需要重点关注的视角。综上,这一部分我们展示的是算法经济个人用户数据利用的经济性维度。

 

接下来我们来看个人数据商业利用的公共性维度。仍然以优步为例,公共性维度是说,优步收集了你的数据,但没有直接用于派单和价格制定这一经济目的,而是将个人的数据进行分析后,进行一种精准的公众动员。其目的是为了使得用户和平台一起在立法博弈中对立法者施加所欲的影响。那这种场景下的数据利用到底是商业性的还是非商业性的呢?需要补充的是,平台企业展开平台驱动型参与实际上与其“非法兴起”的市场策略有关。有研究指出,平台企业在初始阶段常采取三种发展策略:(1)依靠一定程度上以补偿的形式承担违反现行法律的风险以继续运行;(2)通过“游击队式扩张”的策略达到“过大而无法禁止”的效果以寻求客观的影响力和支配力;(3)与此处我们讨论的平台驱动型参与原理相类似,通过动员支持者的方式获得谈判的话语权。(参见Jordan M. Barry, Elizabeth Pollman 文)

 

因此我们看到,优步在全世界各地发起了多轮平台驱动性参与。这张图展示了在英属哥伦比亚、芝加哥、西雅图推进的公众参与。另外不仅在国外,在我国的香港、澳门、台湾地区,也吸引了数十万用户参加请愿。当下,不仅优步,我们熟知的Airbnb也在进行类似的一种动员,对用户的数据利用算法进行偏好分析,进行参与行为的影响。进一步观察后,我们会发现个人数据在商业利用的公共性维度当中可能呈现以下几个特征:(1)参与人数呈现瞬时指数级跃迁增长。例如,在伦敦不到24小时就可以轻松地募集到10万的签名;在弗吉尼亚州也是每秒可以产生七个电子签名。(2)参与媒介呈现融合性和扩散性。数字经济当中以平台为主,这种“大平台小前端富生态”的架构具有很强的开放性和多元性,所以优步虽然在自己的平台上展开,但基于这一基础,他们在推特上、脸书上进行迅速扩展和扩张。(3)参与方式呈现数据驱动的多元化特性。例如,优步利用空间的在线分析技术和挖掘技术进行用户和立法者之间信息精准化传递。他们会选择在地理位置上与某一立法者最近的、乘坐频率最高的用户。当被筛选出来的用户恰好具有特定地区选民的特征时,就会给立法者施加较大的压力和影响。例如,在纽约地区,优步拥有超过两百万的用户,每天客运派遣量超过25000次,相当于纽约传统出租体量的两倍。2015年,纽约市长比尔·白思豪(Bill de Blasio)提出限制发放优步平台车辆许可证的法案。此法案一旦通过对于优步在纽约的扩张计划将会带来实质性影响。为最大限度地联结当地用户,优步在纽约地区的应用平台上专门设计了名为 “De Blasio’s Uber”的功能。通过对用户数据进行地域化分析,当纽约地区的用户每一次登录并使用叫车服务时,都会看到“无车可用”或者“等待25分钟”的提示。但实际上,该提示并非当下真实搜索后的结果,而是优步通过技术设计为用户做出的页面展示,通过模拟纽约提案一旦获得通过后该地区优步服务将要面临的境况,来为用户清晰展现该法案与自身的利益联结性。在展示过后,会有页面弹出并号召用户“现在就采取行动”反对该法案的提示信息。同时,纽约市长的邮箱地址在页面上被即时提供。在这次动员中,优步轻松获得了数万名用户的支持。仅市长和城市委员会就收到了超过17000封反对邮件,由用户们详陈反对法案的理由。由此可见,平台驱动型参与彰显了较强的数据驱动特性。

所以,在这一部分我们可以获得几点思考:第一,个人数据的“商业利用”已经在实践中呈现出一种多元化的场景。有一些是在经济性维度当中的直接利用,有一些其实已经扩展到了更广义的公共性维度。因此当我们讨论以个人数据的保护和控制为核心的规制框架的时候,也应当在动态性的场景化下进行细分而不应一概而论。第二,算法的公平性和透明度在数字经济时代应当成为一个重要的研究主题。在这一主题下,有一些当下急需关注的研究。例如,算法治理的可能性路径到底有哪些?私人领域和公共领域的算法问责到底如何细分?如何探索一种激励相容的机制?因为如前所述,当尝试对算法进行规制时,我们还需要关注一个出现问题的算法所造成的决策不利的成本到底由谁承担?算法使用者自身对于算法改进的动力到底如何?以及我们讨论的算法的决策黑箱到底是算法黑箱还是数据黑箱?包括到底在何种程度上要求算法具有透明性?

 

以上就是我的一些思考,非常感谢大家。谢谢。