荐文 | 张新宝:生成式人工智能服务语料的安全要求
时间:2024-04-02以下文章来源于教授加,作者张新宝:中国人民大学法学院教授 中国人民大学网络信息法中心主任。“新宝看法”是张新宝教授在教授加开设的独家专栏,栏目文章已经正式上线学习强国。同时,栏目文章还被今日头条官方号同步转发。
核心观点
●生成式人工智能服务自ChatGPT发布以来受到全球信息科技界、产业界和监管的重视。我国监管部门坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。
●生成式人工智能服务涉及的安全问题主要包括语料安全,模型安全,安全措施要求,测试题库、关键词库、分类模型,以及安全评估要求等内容。语料安全是生成式人工智能安全的起点。
●语料安全要求包括语料来源安全、语料内容安全和语料标注安全三个方面的要求。语料来源安全要求用于训练的语料合法、合规以及具有可追溯性;语料内容安全要求用于训练的语料充分过滤违法不良信息、尊重在先的知识产权、保护个人信息;语料标注安全要求对标注人员进行资质管理、职能管理和时间管理,强调标注规则以及标注的准确性等。
一、生成式人工智能服务及其安全监管概述
生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。生成式人工智能服务是指基于数据、算法、模型、规则,能够根据使用者提示生产文本、图像、音频、视频内容的人工智能服务。简而言之,以生成式人智能技术为基础向使用生成式人工智能服务生成内容的组织、个人提供的服务,谓之生成式人工智能服务。
新一代生成式人工智能的典型代表是美国人工智能研究实验室OpenAI 研发的聊天机器人程序ChatGPT,于2022年11月30日发布 。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。人们向ChatGPT 发出指令,通过人机对话获得语言回应、视频、文案、译稿等,即为得到生成式人工智能服务。
ChatGPT发布后,受到全球信息科技界、产业界和监管的重视。一些国家采取了谨慎的监管政策,一些国家则在禁用与解禁之间摇摆。针对国内大量互联网企业开发训练通用生成式人工智能模型和专用生成式人工智能模型,我国监管部门采取了稳健的产业政策和监管立场。2023年5月23日,国家互联网信息办公室2023年第12次室务会会议审议通过《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》),经过国家发展和改革委员会、教育部、科学技术部、工业和信息化部、公安部、国家广播电视总局同意,《暂行办法》于2023年7月10日公布,并自2023年8月15日起施行。为了配合《暂行办法》的施行,全国信息安全标准化技术委员会于2023年10月发布《生成式人工智能服务安全基本要求》(以下简称《基本要求》)国家标准征求意见稿。《暂行办法》坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。作为正在征求意见的国家标准《基本要求》,则聚焦于生成式人工智能服务的安全方面,包括语料安全,模型安全,安全措施要求,测试题库、关键词库、分类模型,以及安全评估要求等内容。本文主要讨论语料安全方面要求问题。
二、语料来源安全要求
语料,也称为训练语料,是指所有直接作为模型训练输入的数据,包括预训练、优化训练过程中输入的数据。作为语料的数据,可以以是文字、图片、音视频资料等。语料可能包含涉及他人知识产权或者个人信息权益的内容。用于训练的语料,有些是生成式人工智能服务提供者自行采集的,有些是其通过交易合同、合作协议等获得的商业语料。
《暂行办法》要求生成式人工智能服务提供者使用具有合法来源的数据和基础模型,要在语料来源源头预防各种歧视的发生。《基本要求》对此要求进行了细化阐述:
(1)语料来源管理方面,要求使用合法来源的语料,不使用违法来源的语料。对各来源语料进行安全评估,单一语料内容中含有违法不良信息超过5%的应将其加入黑名单;
(2)语料的多样性方面,要求对不同语言文字的语料保持多样性,文本、图片、音视频等均有多个语料来源。合理搭配境内外语料,除代码以外的每一种类型的语料,境外来源者不超过80%;
(3)在语料来源可追溯性方面,要求具有来源的开源授权协议或者相关授权文件,自采语料要求有采集记录,商业语料要求有合法的交易文件。
三、语料内容安全要求
语料内容安全,是指生成式人工智能服务提供者训练其人工智能所使用的语料不违反法律法规的规定,不存在侵害知识产权和他人的个人信息权益的情况。
《暂行办法》要求尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为。生成式人工智能服务提供者使用的训练语料涉及知识产权的,不得侵害他人依法享有的知识产权,涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形。生成式人工智能服务提供者对使用者的输入信息和使用记录应当依法履行保护义务,不得收集非必要个人信息,不得非法留存能够识别使用者身份的输入信息和使用记录,不得非法向他人提供使用者的输入信息和使用记录。生成式人工智能服务提供者应当依法及时受理和处理个人关于查阅、复制、更正、补充、删除其个人信息等的请求(《个人信息保护法》第45-47条)。《基本要求》进一步规定:
(1)在训练语料过滤方面,生成式人工智能服务提供者应当充分过滤全部语料中的违法不良信息。
(2)在知识产权保护方面,应当对语料中的知识产权风险进行研判,过滤高风险语料;使用商业语料的,应当取得不含侵害知识产权的证明材料;将生成式人工智能服务使用者的信息作为语料的,提供者应当充分告知其不输入含有知识产权争议的内容,识别并过滤其输入信息中高知识产权风险的部分。
(3)在个人信息保护方面,使用含有个人信息的语料,生成式人工智能服务提供者应当获得个人信息主体的授权同意或者满足其他合法使用个人信息的条件(如《个人信息保护法》第13条第1款第2-7项);涉及使用敏感个人信息的,需要得到个人的单独授权同意或者满足其他合法使用敏感个人信息的条件;实际使用人脸识别等生物识别信息作为语料的,应当获得对应个人的书面同意或者满足其他合法使用该生物识别信息的条件。
四、语料标注安全要求
语料标注一般用于说明语料作者和语料来源等相关信息,以及语料词性和句法特征等语言特征的信息。《暂行办法》对语料标注的安全方面提出了要求:在生成式人工智能技术研发过程中进行数据标注的,生成式人工智能服务提供者应当制定符合本办法要求的清晰、具体、可操作的标注规则;开展数据标注质量评估,抽样核验标注内容的准确性;对标注人员进行必要培训,提升遵法守法意识,监督指导标注人员规范开展标注工作。《基本要求》对标注人员的考核与资质、标注规则和标注内容的准确性等方面提出了具体要求,以保障语料标注的安全性。