Christ Yoo教授讲座全文实录:超越喧嚣思考反垄断和数字平台
时间:2019-09-19超越喧嚣思考反垄断和数字平台:‘大’数据真正意味着什么?
近几年,世界各地的竞争执法机构对大型互联网服务提供商的关注愈加密切。其中,“大数据”带来的潜在挑战尤受关注。在执法中引入“大数据”这一思路意味着,执法机构将更注重公司获取和控制消费者信息的数量,而更少关注他们在互联网服务市场中的市场地位。
现任宾夕法尼亚大学法律、通信、计算机与信息科学John H. Chestnut教授,宾夕法尼亚大学技术、创新与竞争中心的创始主任Christopher S. Yoo教授却指出,“大数据”越来越像执法机构对数字平台的执法口号,缺乏了对其应有的实证分析和理性考量。Christopher S. Yoo希望能够通过介绍预测分析如何使用数据、考察数据规模经济的实证主义文献以及审视规模以外的其它数据属性的意义,以更深入地剖析何为“大”数据。
2019年9月5日,由人民大学未来法治研究院组织的“数字经济的制度与文化建构”研讨活动上,Christopher S. Yoo教授做了题为“超越喧嚣思考反垄断和数字平台:‘大’数据真正意味着什么?”的专题发言。
现将Christopher S. Yoo教授的发言及嘉宾的精彩点评整理如下,以飨读者。
【Christopher S. Yoo主题演讲】
生活在今天,全世界似乎都弥漫着对数字平台的焦虑。各种各样的新闻报道让人们轻轻松松地感受到竞争执法机构对数字平台的关注,这种关注给几大耳熟能详的互联网企业带去了天价罚单和麻烦。今天,我想谈谈大数据与反垄断法之间的关系。
继欧盟对谷歌开出高达五十亿美元的罚单之后,美国司法部和贸易促进委员会(Federal Trade Commission)对谷歌、脸书、亚马逊和苹果展开了询问,澳大利亚竞争与消费者委员会(Australian Competition and Consumer Agency)发布了《数字平台调查报告》,英国数字竞争专家小组(Digital Competition Expert Panel)也发布了《弗曼报告》。不仅如此,以色列、西班牙和中国的执法机构也对数字平台展现出了浓厚的兴趣。这样一种全球趋势的背后却隐含着许多令人不安的因素。澳大利亚竞争与消费者委员会的问询之所以能够开展,是因为这不只是执法机关的意思,也是议会的意思。其次,和这个问题一同提出的还有另一个问题,即如何拯救传统媒体,尤其是纸媒。这样一来,这个问题就不只是一个竞争法问题了,由此得出的结论也变得耐人寻味。
我向我的英国朋友请教他们如何看待《弗曼报告》,他们的评价是“brave”。当含蓄的英国人评价一件事“brave”的时候,意味着这件事在他们眼里真的很“crazy”。在我看来,竞争法执法机构对电子平台(digital platforms)的热情着实令人费解。我碰到的所有执法者都想要规制电子平台,但却从来不做分析。可是,如果我们不清楚问题的本质是什么以及问题到底有多大,我们又如何能够找到解决问题的办法呢?
因此,人们现阶段对于“大”这个问题的判断在我看来是有些草率的,大数据恰好变成他们不进行分析的托辞。仅仅因为都拥有庞大的数据,执法者就将GAFA(Google、Amazon、Facebook、Apple)、FANG(Facebook、Amazon、Netflix、Google)为代表的互联网企业混为一谈,而不去分析他们业务之间的差别。这些公司因为它们的“大”而遭到指控,但是竞争法过去五十年的发展恰恰教会我们“大不一定就是坏的”。
规模效应对于高科技企业来说尤为重要,世界上生产电脑芯片的公司就那么几家。当我们对商业的本质有足够的了解后,我们应当允许规模效应在高科技企业的存在。今天,我想说的是,我们不能简单地举旗帜、喊口号,尤其是不能仅仅依靠口号就对这些大数据企业喊杀喊打。相反,我们需要的是,对市场做更多、更翔实的分析,而且是实证分析(empirical analysis)。
反垄断法和竞争法的分析离不开经济研究,但经济研究的实证研究和理论研究之间有着一条巨大的鸿沟,二者之间缺乏互动。理论研究离开实证分析将会导致什么样的结果呢?AT&T收购Time Warner案就是一个最好不过的例子。当时,美国政府审查AT&T收购案时没有给出任何事实分析就对分析模型中的一个参数进行了改动。正是这个毫无根据的改动使得法官对他们分析模型的证明力产生怀疑,没有支持政府的经营者集中审查。
那么,关于大数据的实证研究应该是什么样的呢?今天,我的讲座主要从四个方面进行分析。首先,应当拓宽认识消费者数据的维度,着眼于数据的实际价值。其次,从数量(Volume)的角度理解数据还需要考虑大数据的规模效应和边际递减效应。再者,不同商业模式对数据的使用也不相同,实证分析应当立足于个案。最后,探讨定向广告的市场界定问题,思考搜索引擎市场和社交网络市场之间的关系。
一、数据的多个维度
大数据发展之初,提到大数据,人们想到的往往只有“大量的数据”。后来,逐渐有了数据的3 “V”或者4“V”(Volume、Velocity、Variety和Value)甚至还有6“V”等等关于数据维度的说法。在不断地摸索和实践中,大家对大数据的认识逐渐深化和丰富。其中,“Volume”强调数据的多,“Velocity”强调数据的更新速度,“Variety”强调数据的来源多样,“Value”则强调数据的价值。
不过,我认为,数据类型(Data Types)也同样重要。结构化的数据(Structured data)和非结构化数据(Unstructured data)对于数据分析的影响不容小觑。如果将性别数据、年龄数据等等比作线条和点,结构化的数据可以帮助数据分析师更快、更精准地勾勒出用户画像。对于结构化数据来说,已经有相当多的数据分析工具和数据分析模型;而对于非结构化数据来说,目前已有的分析工具和分析模型还远远不够。不仅如此,结构化数据的分析成本远低于非结构化数据的分析成本。
因此,只谈数量的数据分析是有失偏颇的,我们永远不能准确评估数据分析的成本、数据对于市场进入障碍的影响。任何数据分析都应对所提供的数据类型进行分类,执法官员应了解公司如何使用不同类别的数据再进行适当的评估,对公司收购不同类型的数据也应当谨慎执法。
二、数据的规模效应
数据规模效应是什么?拿我们的讲座来举例,听讲座的同学越多,讲座的价值就越大。但教室的容纳人数是有上限,所以讲座的价值不可能无限增长下去,这就是边际递减效应。大数据经济亦是如此,我们在认识大数据的规模效应之外,还应当看到大数据规模经济的最高临界点。简言之,数据越多越好并不一直正确。关于这一点,我们可以看看Yahoo!和Amazon他们的做法。起初,Yahoo!搜索引擎使用非常庞大的数据库,后来他们调整策略,将数据的数量缩减至一半,但是用户的搜索质量却并没有下降。Amazon在调试个性化推荐分析数据库时发现:第一,上架时间越久的产品,推荐的准确率越高,但随着时间越来越往前,上架时间对准确率的提升会越来越小;第二,产品的种类增多,预测的准确性并不会随之提高。
有了上述两家公司提供的实证研究结果,Catherine Tucker、Neumann和Whitefield几位研究者也做了一个研究:利用网站浏览记录对数据经纪人(data broker)的用户画像分析进行了测试。他们得出三点研究结果:第一,数据多的数据经纪人并不会得出更精确的用户画像;第二,基于浏览记录分析得出的性别信息不如广告商凭借经验判断来的靠谱;第三,即便可以通过其它方式提高用户画像的精准度,企业为之付出的技术成本非常高昂,得不偿失。
基于以上实证分析,我们现在至少可以肯定,“big is bad”这一论断过于简单。换句话说,仅凭FANG、GAFA这些公司拥有的数据规模就简单认定它们具有相同的市场优势是缺乏严谨性的。因此,接下来我们要花更多的精力去研究下一个问题,即达到效率最高值的数据量到底是多少。
三、不同商业模式下的数据
人们对商业模式与大数据之间关系的认识经历了几个阶段。2014年,有许多学者通过文章指出,从数据中提取观点(extract insight from big data)并非易事。Brynjolfsson和McElheran在2016、Niebel在2018年分别以实证研究结果表明,成功的大数据分析离不开技术。2019年,Fetzer和Paulheim发现数据量和算法质量之间存在反比关系,这意味着,如果算法更先进,分析师需要的数据就越少。现实是,数据收集比数据提取(insight extraction)早十年,这十年缺乏的正是能够运用技术和算法对数据进行分析和提炼观点的技术人员。
从2019年的统计数据来看,大概有一半的公司缺乏必要的分析工具来实现具有产出效率的分析。缺乏合适的分析工具和专业分析师对于数据型企业来说几乎是致命的:首先,大量数据变得一无是处;其次,糟糕的算法直接影响企业的决策和运营以及广告推荐的质量。很多公司都犯过这样的错误,例如Pinterest曾向单身女性推送庆祝她们结婚的消息,高度依赖用户点击“Like Button”反馈的Facebook新闻推送算法的用户满意度并不高,乐高通过算法分析认为年轻一代更喜欢简单的任务和即时满足感的结论忽视了喜欢乐高游戏的年轻人往往比同龄人更具备热爱挑战和坚持的品质。
目前,互联网行业并没有一种通用的数据提取软件,因此,数据分析仍然十分依赖公司采取的商业模式。网上零售、在线广告商、网络社交的商业目的各不相同,采用的算法亦不相同,而且算法之间互不相通。比如,亚马逊的A9搜索算法将相关性定义为人们搜索后购买的东西,重点关注用户过往的购买行为。Google的搜索算法则将相关性定义为人们搜索后点击的内容,重点关注用户过往的研究行为。
从竞争的角度来看,数据处理技术更优的公司才可能拥有更强的竞争力,而那些仅仅拥有数据而不曾使用或者分析模型欠佳的公司则无须被纳入反垄断法的考察范围。而且,从效率的角度来看,一些表面看来是价格歧视的行为却能够通过吸引低消费意愿的用户来打开市场,这反倒可以促进市场竞争,应当值得鼓励。
四、定向广告的市场界定
最后,我想谈谈互联网广告的市场界定问题,这对于实证主义研究来说十分重要。美国联邦通信委员会(Federal Communications Commission)对2014年和2015年全国广告业和地方广告业的收入情况做过一个统计。无论是全国市场还是地方市场,数字广告(包括互联网和移动手机网)在全部广告类型中占比最高。到了2019年,数字广告的收入已经超过了其它传统广告收入的总和。其中,数字广告约1300亿,传统广告约1100亿,这也是数字广告收入首次超过传统广告。仅Facebook和谷歌母公司Alphabet两家公司就占据了数字广告市场近60%的份额,而Amazon的市场份额也在稳步增长。
数字广告市场如此迅速的成长和如此巨大的体量,不得不让人思考它与传统广告市场之间的关系。如果将传统广告市场排除在外,Facebook和Google两家公司高达60%的份额完全足以构成双寡头垄断(“Duopoly”);如果不区分传统广告与数字广告市场,传统广告市场的份额大概是46%,而Facebook(12%)和Google(20%)两家公司的总份额是32%。
我认为,广告业相关市场的界定要关注两个方面。第一,执法机构和法院在判断和界定相关市场的时候要看零售商的观点。如果零售商认为传统广告和数字广告可以互换,那么相关市场就应当包括上述两者;反之,如果零售商认为传统广告和数字广告截然不同,那么二者就应该被划分为两个不同的市场。第二,是否具有互为替代性应当以实证依据(Empirical Evidence)为准。
那么,零售商的态度到底如何呢?我们可以看看PROCTER & GAMBLE在广告运营上的调整和布局。2018年,P&G从数字广告拨出2亿美元投回到传统广告,这种变动意味着P&G将数字广告市场和传统广告市场视为互为替代品。这种说法也许不够严谨,那么我们再来看看这方面的实证文献。从实证主义的学术研究来看,如果数字广告市场和传统广告市场二者不是互为替代品,则解除传统广告的某些限制就不会对数字广告市场造成影响。比如Goldfarb和Tucker在2011年的研究表明,如果对酒类广告的广告限制不再区分线上线下,那么线上广告市场的受欢迎度就会下降,这意味着数字广告市场和传统广告市场二者之间的确存在互为替代的关系。Goldfarb和Tucker在2011年对律师广告的另一实证研究,也证明了这一结论,还有许多实证研究的结论亦是类似。
对于广告业相关市场的界定问题,我们需要更多的实证研究来正确评估和比较传统广告和数字广告的边际成本结构,帮助我们揭示数字广告市场和传统广告市场的关系。不过,从目前的研究结果来看,ACCC认为二者不存在互为替代关系的结论很可能是不太恰当的。
总结
我们需要做更多更扎实的研究,才能避免重蹈覆辙。我今天提到的四个方面的实证文献都有一个共同的命题,即数据收集和利用是否会不利于竞争。接下来,实证主义的研究任务应该着力于以下几点:(1)大数据多维度考察;(2)大数据发挥有效价值的最小规模以及大数据规模经济的最高临界点;(3)关注大数据运用的人才和技术投入;以及(4)线上广告和线下广告之间的替代性。
【点评与问答环节】
在点评与问答环节,中国人民大学法学院副院长杨东教授就市场主导力量及市场份额界定提出疑问。对此,Christopher S. Yoo教授先简要评价了美国、欧洲及中国就市场主导力量的法律规定情况,并指出美国认定企业拥有市场主导力量的法律相较而言更加严格,企业在实施定价方面拥有较多的自主权。欧盟法律有一条规定是集体主导(“collective dominance”),但这一法律规定在实际执法中并无用武之地。因此,Christopher S. Yoo教授强调,分析和界定市场主导力量还须立足个案,就每个企业的具体情况和对竞争市场的影响进行个案分析。此外,Christopher S. Yoo教授还指出,无论是过去还是今天,市场主导者都不是一成不变的,如今风头正盛的几大互联网巨头公司同样也面临着生存和发展方面的难题。
中国人民大学法学院教授孟雁北教授指出,有关电子平台和数据企业的反垄断法竞争问题的探讨存在不同的观点和不确定,比如相关市场的界定。Christopher S. Yoo教授回应,执法机制和执法机构的确无法排除政治影响,但确定的是执法机构必须承担举证责任。至于现任美国政府领导下的执法机构会走到哪一步,尚不可知。紧接着,孟雁北教授就中美在竞争执法机构方面的制度差异提出疑问。Christopher S. Yoo教授介绍道,在美国,除司法部外,FTC(Federal Trade Commission)也负有竞争执法的职能。他认为,这种分权体制确有不当,但同时也是典型的美国式“三权分立”下的司法与行政之间的较量与制衡。最后,孟雁北教授提出美国案例法上的“必要设施理论”制度。Christopher S. Yoo教授回答,美国法官们并不喜欢“必要设施理论”,该制度在美国实则已经过时。教授另指出,欧洲竞争执法机构在运用“必要设施理论”时存在很大的制度问题,法院并不实质审查执法机构的经济说理(“economic reasoning”)。因此,除非执法机构存在论证错误,法院一般都支持执法机构,这显然违背司法审查的“公平审判”原则。
中国人民大学法学院张吉豫副教授在提问之前,对Christopher S. Yoo教授的主旨讲座做了一番精彩的回顾和点评,并对法律应当如何应对企业的数据共享表达了自己的疑惑。就此,Christopher S. Yoo教授回应道,可以将企业的数据共享问题分成两个问题,首先是法律是否允许企业自发的共享数据行为,其次是法律是否强制企业共享数据。针对第一个问题,Christopher S. Yoo教授认为答案应该是肯定的,不过实践中自愿共享数据的企业应该并不多,因为这意味着主动放弃或让渡自己的竞争优势。教授还指出,由此行为引发的数据隐私问题不该成为反垄断法的执法目的。德国反不正当竞争局调查Facebook一案中,当局认为Facebook的行为侵害了消费者的数据权利构成反垄断法上的“滥用市场支配地位”,这是以反垄断法实现消费者保护法或者数据保护法目的的典型案例。然而,Christopher S. Yoo教授并不认为这是一种妥当的法律实现,反垄断法应当恪守其监督和惩罚“危害市场”行为的职责,不可越俎代庖。针对第二个问题,Christopher S. Yoo教授则简洁扼要地表示,强制企业共享数据并不可取,这意味着强制获得数据的企业与他人分享自己的成果,将极大挫伤企业投资、创新和发展的动力。
中国人民大学法学院副教授郭锐围绕着垂直兼并(Vertical Integration)进行提问。Christopher S. Yoo教授则以自己使用三星手机为例,幽默地回应道,苹果公司以高利润而非高销量取胜,有些人喜欢苹果手机系统有些人则不然。不管如何,有竞争的市场就是健康的市场。事实上,Margaret E. Slade等经济学家曾做过一场关于垂直兼并的经济学研究,其结论令人出乎意料:以往我们谈“vertical integration”色变,认为这种兼并会破坏市场竞争,但实证研究却表明垂直兼并似乎能创造很多经济价值。因此,Margaret E. Slade呼吁,我们的执法者应该更加宽容、审慎地看待企业的垂直兼并行为。其次,即使是拥有强大市场地位的在位者也同样面临着创新企业的冲击,每年都会涌现新的巨头企业,也并非所有的企业都会被收购。另一个有意思的问题是,如今硅谷的新兴企业,在面临IPO和被巨头企业收购两种选择面前,似乎越来越倾向于后者。如果我们阻止或者禁止垂直兼并,那么这些乐意被收购的小企业的利益如何来保证实现?当然,也会存在另一种不一样的市场表现,比如中国的电商市场的发展就很有意思,未来五年可以持续关注。
中国政法大学副教授沈伟伟围绕着主旨演讲中提到的数据经纪人(data broker)背后的隐私保护问题提出问题。就此,Christopher S. Yoo教授首先旗帜鲜明地表达了自己对数据经纪人乐见其成的态度。他认为,数据经纪人能够使小企业尽可能地摆脱对巨型企业的数据依赖,从而为小企业提供与大企业独立竞争的机会和能力。而且,从供需角度来看,作为数据市场的供给方,数据经纪人提供了另一种供给渠道,与提供数据的大企业构成替代品。其次,教授指出,单纯的数据对于消费者而言并非产品,数据只有经过企业的加工、利用才能成为消费者可以享用的产品或者服务。最后,数据集中或者说规模效应与消费者福利之间的关系目前并不明了,在出现更有力的研究结果之前,他更倾向于谨慎界定二者之间的联系。
京东研究院研究员付伟围绕着传统广告市场和线上广告市场的寡头垄断问题提问。Christopher S. Yoo教授指出,前提问题是寡头垄断的相关市场的选取与确定,问题之二是并不存在合谋协议,问题之三是如果是平行共谋,那就会面临如何确定“不合理要价”范围的问题。确定“不合理要价”对执法者来说是相当困难的,这也是因为不同的价格可能是因为选用的商业模式不同,比如美国HBO电视网只有CBS电视台五分之一的订阅者但收入却相差无几,这正是因为HBO的收入大部分来自订阅收费而非广告收入。
中国人民大学法学院丁晓东副教授就可携带权等数据权利及用户选择问题向Christopher S. Yoo教授进行了提问。Christopher S. Yoo教授认为,数据可携带权与数据保护问题密切相关,同时它与市场竞争也存在冲突。从技术层面来看,数据可携带权并非真正意味着“携带”,相反,它可能会造成一种格式标准化(standardization of form)。他认为,这可能并不是一件好事。而用户选择问题,Christopher S. Yoo教授指出,在美国语境下,这其实并不是一个问题——如果是用户自己的选择,那无论是否合理,美国法律将尊重和保护用户的选择。