网络法读书会第十六期:搜索引擎算法的中立性与法律责任
时间:2018-09-26未来法治研究院网络法第十六期读书会于2018年9月26日在中国人民大学明法楼708室举行。本次读书会上,老师和同学们围绕James Grimmelmann所作“Speech Engines”以及Geoffrey A. Manne 所作“The Problem of Search Engines as Essential Facilities: An Economic & Legal Assessment” 两篇论文进行了主题报告和讨论。以下是整理的主题报告和部分评议:
一、主题报告
二、自由讨论
【人大未来法治研究院副院长 丁晓东】
在一定程度上,Speech Engines这篇文章是对之前美国法中关于媒体讨论的继续。在对媒体的性质定位中,就存在两种争论,一种是将媒体视为一种类似“导管”的中介,媒体只传播信息,本身不是信息的产生者。另一种则将媒体视为类似“编辑”的发言者,媒体也介入信息生产。在某种程度上,搜索引擎和媒体的角色有类似性,搜索引擎可能也会被同时视为“导管”和“编辑”。但本文有意思的是,作者提出了一种“顾问”理论,认为搜索引擎应当介于这两者之间,搜索引擎应当对用户忠诚,为用户提供最相关的信息建议,就像律师、医生为顾客提供顾问一样。对于这种理论,我觉得首先是非常有意义的,和中国的监管理论也能很好的对接,而不至于完全陷入美国法的言论自由的讨论框架。另一方面,我觉得“顾问”理论仍然有一个需要进一步探讨的问题,就是这种顾问是相对中立的,只提供用户希望听到的相关信息,还是具有伦理取向的,也会考虑从伦理的角度给用户建议?作者显然是认同前者的。我觉得认同前者很重要,对于改进搜索引擎的用户体验尤其有帮助。但对于建立在伦理基础上的搜索引擎规制,可能也是一个值得探讨的问题。
【 北京粉笔未来科技有限公司(猿辅导) 研发工程师 彭旸】
从信息论角度看,信息传播各部分可分为信源(信息发布者)、信道(传播媒介)和信宿(信息接收者)三部分。文中“导管理论”建立于信道角度,认为搜索引擎本身不制造信息,仅仅作为信息传播媒介存在。“编辑理论”建立于信源角度,认为搜索引擎本身即信息发布者且仅是信源,文中“顾问理论”并非完全为文中声称的那样建立在信宿角度,而是在充分考虑了信息接收者的主观能动性的基础上,是信宿选择接收其感兴趣信源的信道,在该理论中,搜索引擎仍作为信道出现,但其不再是单向的单一的媒介,而是双向的多通道的,可根据作为信宿的用户兴趣选择不同信源的信道。
现实中的搜索引擎由于显著降低了混乱程度,从信息论角度看,其本身就是信息发布者。具体的说,搜索引擎给出对关键词的相关网页排序时,其本身已经将“关键词——网页排序”作为信息发布了出来,该信息的重要性亦不言而喻。又由于搜索引擎处理的是海量的其他数据或信息,其发布的信息“关键词——网页排序”中所包含的网页具体内容并不由搜索引擎产生,依据搜索引擎的工作原理,从技术上搜索引擎也无法完全掌握其网页的详尽具体内容,故搜索引擎仍具有媒介作用。故而,搜索引擎既是信源、也是信道,在看到搜索引擎的作用、归责及规制时,应将二者区别对待。
同理也适用于如“今日头条”类的算法推荐新闻平台,虽然其不直接撰写新闻稿,公司管理层声称算法中立,但其具体实施方式仍沿用传统媒体的“采——编——播”流程,即采集各已经完成撰写的新闻稿,使用相对通用的规则而非一事一议的方式进行信息流编辑,并通过网站或APP播出。用户看到的“信息流呈现方式”本身作为信息发布,这点上该类平台为信息发布者,与搜索引擎类似的,其技术上无法完全掌握“信息流”中“具体信息”的详尽内容,这点上它又是信道。
当我们试图用公正性要求搜索引擎时,实际上我们是从信道角度考虑,因为只有信道才有中立的可能,在制造的信息的信源本质上是不可能中立的。当搜索引擎试图适用避风港原则时,也是坚持信道立场。
当我们要求搜索引擎过滤虚假信息或各类禁忌信息时,又是从信源角度考虑,认为搜索引擎应当为其发布的“关键词——网页排序”负责,需要将公认信息作为前序,虚假信息、禁忌信息作为后序甚至不予陈列。
以上要求常常是矛盾的,但我认为更多时候造成误解的根源在于要求作为信源的搜索引擎对搜索结果负责是对“关键词——网页排序”负责而非对“关键词——网页排序”中网页本身内容负责,而现实语境中后者常常替代前者。
个人认为,对搜索引擎的认识和规制应当避免几个误区:
首先,不能抹杀搜索引擎的信源属性,其表现之一是认为存在天然、合理的网页排序方法,即认为当网页确定时,网页排序是不带有信息量的自然存在。从数学上看,排序问题本身是个多目标规划问题,相关性只是各个目标的单一综合指标,该指标没有也不能有确定的目标函数,这类规划问题的求解必然伴随目标的确定和目标在最终指标中权重选择的主观性问题,即使用黑盒特征提取算法如深度学习仍无法回避训练数据选择这一主观性问题。其必然伴随着信息的增加,这也是搜索引擎赖以存在的重要价值。直观上理解,对同一关键词下同一网页集的排序,例如有同学提到的搜索“小米”时,作为粮食的“小米”还是作为电子产品的“小米”更相关不同人、不同时期、不同情境下都会有不同的看法。
其次,不能否认搜索引擎对其发布的“关键词——网页排序”中网页本身内容的弱理解力和弱控制力。网页本身内容只能作为对“关键词——网页排序”评价的依据之一,而不能作为唯一。搜索引擎应对排序负责,而不应对网页本身的内容负责。
再者,接收者视角并不能解决搜索引擎作为发布者和媒介的矛盾。文中“顾问理论”作为“导管理论”和“编辑理论”的折中这点我是认同的,但引入接收者后仍无法解决文中所谓“到达性”和“忠诚度”的这些实际上为信源和信道矛盾而引发的问题。作者的在该视角下的有益尝试是摒弃信源信道争议,而仅以最终目标出发,以用户认可作为最终评判标准,但这只能是为“商业上成功的搜索引擎”增加注脚,最多从委托代理甚至更像是从消法角度对“商业上成功”进行了些许约束。
这个问题在读完文章和参加完讨论后个人仍很难得出结论,也不能给出理论及实务上的倾向性建议。归结起来,个人更倾向于对搜索引擎的规制采取审慎的态度,通过负面清单而非正面强制性或建议性标准约束其行为,但不能因为其在信源和信道中只选择对其有利的角度抗辩而放任其通过宏观上调整算法或微观上调整个别词条排序从事不正当竞争、侵犯知识产权或滥用市场支配地位的行为,同时对其通过上述行为发布的搜索结果违背公序良俗的判定应当克制。
【 中国人民大学法学专业 裴仁煜】
作为一名法学大一新生,我在这次的读书会中受益匪浅。很抱歉我一开始对如此之长的英文论文望而却步,没有读多少,但是很感谢刘仪鸿同学简练概括的分享,让我大致有了一个了解。
首先,我想将搜索引擎提供信息的性质分为两种类型。1.客观。2.非客观。
1.完全客观-保持中立-导管
今天两位老师和很多学姐学长都提出来了搜索引擎受主客观因素影响,不可能做到完全客观。所以我们的问题在于:是否应当用法律迫使它尽量客观。我的个人观点是,这是不可取的。在信息量如此众多的今天,不分轻重完整地提供信息的话,很难满足用户的需求,他们将花大量时间去提取有用信息,这虽提供更多视角,没有束缚性,但是无疑在浪费用户的时间,对于搜索引擎而言也会损失客流量。
2.①贴合利益-遵从客户-顾问
优点是,对于用户而言,缩短时间,提高体验;对于引擎而言,提高客流量,获得商业利益。缺点是,是否会导致低俗消息的传播和国家社会利益的损害。但是这就涉及到一个问题,搜索引擎是否有和媒体等同的社会责任。今日头条的张一鸣所说,教育民众不是这类企业的责任,他只是负责提供一个信息交流的平台。我认为这有一定的道理,但是确实会有为自己开脱的嫌疑。事实上,除了企业应有的社会责任,我认为无论是这种平台企业还是搜索引擎都还有责任,去进行基本的信息筛选和网络保护。另外,有猿辅导的小哥哥提出垄断问题,我认为正因为形成垄断,国家管理搜索引擎,可能效果会比管理媒体还要好。
②自行选择-言论自由-编辑
这种方法,可能在美国这样强调新闻自由的国家更为合适。林达的一本书«如彗星划过夜空»里曾谈论过美国的新闻媒体的事后追责制度,使我印象深刻。但是对于我国而言,这种过多的自由是不合适的,国家肯定要监管,只是如何把握分寸,找到平衡是关键。任由企业编辑是不利于社会的。
综上,我认为搜索引擎应该在国家监管的基础上,贴近用户,根据用户兴趣为其提供信息,同时尽可能排除引擎的主观因素。
【 中国人民大学法学院 张晶晶】
这是我第一次参加有关法律方面的读书会,非常感谢这个平台和机会,也谢谢刘仪鸿学姐的分享。我很震撼,但接触不多暂且写一点感受。
很明显的一点,我们往往在经历过重大打击之后才会回头思考我们的体制究竟出现了什么问题。就像魏则西事件引起搜索引擎方面的轩然大波。这是搜索引擎在非常敏感的地方出现的问题。好的一点是,当我们在特殊情形下思考时,可以考虑得更具体。
毫无疑问,搜索引擎正深深地影响着大多数的人的生活。我们依赖它,期望它提供给我们想要的答案。但整个过程存在一个问题,我们是希望搜索引擎完全中立地做一个信息的搬运工,把筛选信息的权力完全掌握在自己手里,还是省力一点,过度部分权力给搜索引擎,直接让它提供个性化、更有针对性的搜索结果。在做出后者的选择时,我们不可回避地要承担风险,即如何保证搜索引擎认为的个性化服务就是我们想要的。
结合第一篇文献中提到的三个理论:从提升用户的体验角度来看,我认为搜索引擎适合顾问理论。搜索引擎可以接触更广泛的信息源,对于一部分客户(财力、知识水平有限),它们毫无疑问是最经济的寻求官方、科学答案的方式。从这个角度来看,搜索引擎企业应该有意识:我是客户信赖的人,我不可以辜负这份信任。固然市场经济下追求利益不容置否,但对于搜索引擎这类极易形成垄断从而影响公众生活的企业,确实需要自我约束机制。有了自我约束,其实很多问题是不存在的。在外有司法层面的法律完善,在内,我们希望看到企业的自我管理和约束。在运行中,要自觉承担社会责任。内外双管齐下,效果会更好。
我认为,搜索引擎做到中立不是没有可能。从搜索结果的排序上看,我们可以联想一本书的编写组的成员的排列顺序,往往有“按姓氏笔画为序”这样的字眼出现。这类排列标准,是不带感情色彩的,公共也不会以重要性来看这些人名的先后顺序。所以,搜索引擎可以借鉴,寻找一种不带感情色彩的标准作为排列依据。还有一个思路,搜索引擎可以将规定排列顺序依据的权力给予公众,让公众自己选择他们更看重的标准。
搜索引擎的身后是广阔的信息海洋,这些信息错乱纷杂、良莠不齐。或许我们可以上溯一步,从规范信息源入手。当然这是一个相当庞大的命题。信息的数量之多决定总会有漏网之鱼出现。这就回到了信息素养这个问题上。
【中央民族大学硕士研究生 杨瑞琦】
顺着第二篇文献的思路,我个人比较赞同将搜索引擎归为的“基础设施“。因为无论是从用户主观选择的粘合程度还是客观引擎存在的可选择范围,拥有体量巨大的搜索引擎的涉及公共利益的方方面面。换句话说能力越大责任越大。
但是搜索引擎本质上的一种商业下、用于商人谋求利益的手段和工具。加上巨大的技术壁垒让监管者和业界人士之间巨大的技术能力不对等,决定不可能从外部进行搜索引擎以及类似技术媒介的监管。所以问题关键还是在于严格的法律规制,加大违规侵权成本,倒逼企业形成正确的价值观。完全做一个客观中立的“导管式”服务者,为社会输出更大的价值和善意。
【 中国人民大学15级法学新闻实验班 刘思麟 】
昨晚的读书会非常具有启发性,非常感谢能够有这样一个交流观点的平台。因为我同时学习了法学和新闻两个专业,我很乐于将这两个专业的知识结合起来进行思考,跳出纯粹法学的框架,用其他学科的视角进行思考或许能够碰撞出不一样的火花。昨天的读书会上大家对“算法没有价值观”以及“今日头条是否算媒体”这些观点做了一些讨论。我想运用一种类比的手法,将搜索引擎和媒体二者进行类比,或许有生搬硬套之嫌,在这里希望与大家多做交流。
这里我们先来看两个概念:
1. 搜索引擎:搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
2. 媒体:媒体是指传播信息的媒介。它是指人借助用来传递信息与获取信息的工具、渠道、载体、中介物或技术手段。也可以把媒体看作为实现信息从信息源传递到受信者的一切技术手段。媒体有两层含义,一是承载信息的物体,二是指储存、呈现、处理、传递信息的实体。
在某种程度上,“搜索引擎”和“媒体”的定义有着异曲同工之处。甚至可以说,搜索引擎可以包含在媒体的定义范围之内。这二者都是用户获取信息的中介,也都是承载信息、传递信息的方式。
而searching engine这篇文章中给出的三种模型也可以和媒体的分类进行类比。编辑理论可以类比“大众媒体”,大众媒体将信息采编后分发给大众,在这个过程中可以实现对于公众的“议程设置”。用户虽然可以选择不同的大众媒体实现信息的获取,但在这种模式之下,用户处于相对弱势的地位,尤其是当垄断发生时,用户的言论自由就受到了限制。
而导管理论则可以类比“社交媒体”,社交媒体的出现令用户能够自主发布和选择信息,社交媒体只作为一个承载信息的平台而存在,在应然层面,社交媒体是具有客观中立性的。但是在实然层面,社交媒体也收到了不同程度的商业、政治等因素的影响,也会对信息进行筛选。更为重要的是,在社交媒体上人们更倾向于获取自己想要的信息,这也导致了“分众化”的加剧,人们越来越被局限在自己的小圈子当中,从而更乐于接受令自己感到舒适的观点,但对于圈子之外的“不同”接受度越来越低。
顾问理论介于编辑理论和导管理论之间,采取更为中立的态度。搜索引擎应当对用户忠诚并提出相关建议,搜索引擎在这里发挥了一定的积极作用,也保持客观中立的属性,给用户提供了自由选择的空间。这种理论可以类比划分媒体的一种比较新兴的概念,即“融媒体”,传统的大众媒体在社交媒体平台上发挥作用,凭借其与生俱来的公信力,树立了一定程度上的“权威”。但它又不是完全至高无上的,它会受到来自自媒体不同程度的挑战。在二者的竞争中,用户成为了受益方,能够接收到越来越高质量的信息。
对于搜索引擎而言,纯粹的编辑理论和导管理论在现实中都无法完全实现,其作用是一种价值观念的指引。而顾问理论则给予了一种新的方式,平台有一定的责任,也要给予用户自由选择的空间。但这种顾问的责任应该如何界定?应该由谁界定?如何在保障言论自由的同时让用户获取更高质量的信息?如何引入政府监管并形成一种平衡?这些问题和大众媒体与社交媒体的争论一样,需要更多的思考。
【 18级法硕 孙浩 】
在论文speech engine中,作者将搜索引擎的角色归纳为两种——导管和编辑,同时还提出了较为理想化的第三种角色——顾问。导管意味着绝对中立客观,不带任何价值取向,只是向用户呈现信息。在我看来,搜索引擎是几乎不可能做到这点的。就像会中一位同学说的,信息是纷杂无序的,搜索引擎只是降低了信息的混乱程度。只要在信息抓取时有所选择,就必定会涉及算法自身的判断,有判断就有标准,标准背后就带有一定的权重和偏向,主观色彩隐于其中,这是其一。其二,即使搜索引擎能够做到客观中立,用户也不可能充分感受其客观所在。因为搜索引擎在罗列信息时会有搜索排位,无论对各路信息如何同等视之,排位都会赋予信息被获知的优先权。因此,在我看来导管理论是无法成立的。
相对而言,搜索引擎比较类似于编辑理论。正如传统新闻业会有选择地将文章搬上报纸一样,搜索引擎在一定程度上会对信息进行筛选排序,即使将网上相关信息全部呈现,但基于用户的惰性,最容易使人看到的还是排位靠前的信息。由另一篇论文The problem of search engines as essential facilities: an economic &legal assessment 以及现实中的魏则西事件可以知道,各个广告主一直在不遗余力地争夺搜索排位,从使用搜索引擎的实际情况来看,真正进入用户视野的一般不超过前三页搜索结果。而搜索引擎对将哪些信息放在第一页或第一个有几乎完全决定权的。从这一角度上可以看到搜索引擎与编辑的类似之处。至于作者提出的第三种更加理想化的顾问理论,窃以为在现实中很难实现。一是因为很难定义怎样的结果有利于用户,基于表达能力的差异,不同的用户提出相同的问题可能有不同诉求。搜索引擎如何能从相同问题中识别用户真正需求?而且如果用户抱着不良目的进行“咨询”,忠实解答会不会助纣为虐?二来搜索引擎作为一个商业产物,其逐利本质无法改变,这就决定它不能完全从用户角度出发(例如搜索排位),最多是兼顾用户感受的最大化。
我们都知道,经过多年角逐,国外的谷歌国内的百度在其地域范围内做到了市场垄断地位,其余的市场追随者和市场填补者的体量现阶段下无法与之匹敌。虽然它们是非国有的商事主体,但这样一个上网必备的庞然大物实质上已然扮演着公共基础设施的角色。无公共基础设施之名而行公共基础设施之实加上信息不对称很容易造成规制监管的难题。针对这一问题,罗列负面清单可能是相对可操作性较高的一种规制手段。技术的发展日新月异,从正面对这类互联网公司进行规范很难跟上其发展脚步,更加容易暴露法律的滞后性和局限性;而且信息不对称也很容易造成外行瞎指挥的乱象。负面清单一方面给予百度这样的互联网巨头更大的发展自由,同时明确行为红线;另一方面,随着技术的更新,清单可以适时做出调整,灵活性更大。而对于应以何种角色看待并规范搜索引擎,从前文可知,导管理论有帮助规避法律责任之嫌,顾问理论又显得有些求全责备。编辑理论可能更适合概括搜索引擎当下对信息呈现的干预程度。也就是说,在监管规范时,利用负面清单将搜索引擎约束在信息无显失客观和高相关性的程度上可能更容易实现。
【北京外国语大学17级国际法 郭中天 】
非常感谢此次读书会提供的机会,我有幸接触到了一些关于搜索引擎的观点。基于speech-engines以及The Problem of Search Engines as Essential Facilities这两篇论文的论述,以下是我个人的一些观点,希望与大家多多交流。
首先,论文中“导管论”、“编辑论”或是“代理论”这些理论的目的是为搜索引擎本身定性,还是在规范层面为搜索引擎指引发展方向,是含糊不清的。一般而言,先通过现有法律制度进行调整和规制,其次通过解释学弥补漏洞和不足,最后才是为适应实践需求提出新理论。前两步的研究可能是需要进一步加强的。
其次,针对“用户获取不到想要的信息”这一观点的评述也需要厘清。搜索引擎的本质是信息聚合,在不做特殊定制的前提下,尽可能满足大部分用户的信息需求是其商业属性和自身特点。以关键词“小米”为例,在2008年小米公司尚未成立之时,在任何一个搜索引擎是搜不到小米公司的,排在首位的应该是针对小米这种谷物的百科信息;而在2018年搜索“小米”关键词,第一位是小米公司的网站。倘若一个用户只想要小米这种谷物的信息,在2018年搜索“小米”关键字,搜索引擎给出的排序前几位自然不是谷物信息百科,对于这位特定用户,自然是得到了“用户获取不到想要的信息”的结论,但是对于大部分用户,他们得到的确实是想要的结果,搜索引擎并没有给出错误的、具有误导性的结果。那么“我想要的信息”和“大部分人想要的信息”的边界应当是需要加强论述的,即搜索引擎给出正确结果的结论应基于后者,不应被个别用户的主观认知而随意下结论。以此推进,个人认为,公共服务以及历史传统关键字应当推定为“大部分人想要的信息”,例如搜索“清华”两个字,首位是“清华大学”才应当是正确的结果,而首位是“清华不孕不育医院”是错误的结果。那么公共服务以及历史传统关键字以外的关键字需要如何定性,需要进一步分析。
最后,苛责搜索引擎给出错误的信息,这本身预设了一个前提:搜索引擎给出的结果是权威的。然而,搜索引擎一般都是商业公司的服务或产品(谷歌、必应、百度等),这仅以商业信用背书,从法律层面苛责严格的信息真实保障义务,缺乏必要的正当权利来源。搜索引擎的问题属于治理问题(公法问题)还是用户与搜索引擎之间的服务关系(私法问题)需要厘清,不宜混在一起讨论。在没有厘清公法问题还是私法问题之前,既有理论无法在实践层面落地,公法私法各自有不同的救济方法与角度,混在一起讨论自然很难得出有效结论。