大模型备案被拒? “致命伤” 让你的申请秒变 “废案”
训练数据要确保来源合法,不管是基于开源协议获取的数据,还是通过商业授权得到的数据,亦或是自行采集的数据,都需遵循相应的合规性要求。一旦语料中包含未授权的版权内容,比如在训练数据中使用了他人享有知识产权的作品,又或是涉及未获授权的个人信息,都会成为大模型备案被驳回的直接原因。在大模型的搭建过程中,如果使用了未备案的第三方基础模型,尤其是境外模型,或者没有对芯片、算力等供应链环节进行合规审查,那么就可
大模型备案成为相关企业和机构必须面对的重要环节。然而,不少申报在备案过程中遭遇驳回。深入剖析这些被驳回的原因,对相关主体顺利完成备案、合法合规开展业务具有重要意义。
一、语料安全不合规
1.语料来源未合法授权
训练数据要确保来源合法,不管是基于开源协议获取的数据,还是通过商业授权得到的数据,亦或是自行采集的数据,都需遵循相应的合规性要求。一旦语料中包含未授权的版权内容,比如在训练数据中使用了他人享有知识产权的作品,又或是涉及未获授权的个人信息,都会成为大模型备案被驳回的直接原因。
2.违法不良信息比例超标
依据《生成式人工智能服务安全基本要求》,若语料中违法不良信息比例超过 5%,该批次语料就需作废处理。不少企业由于在数据采集前未严格评估数据质量,或者在采集后未进行有效的核验,导致语料中违法不良信息混入且占比超标,最终因这一问题导致大模型备案失败。

3.语料标注规则不完善
一套完善的语料标注规则,应涵盖标注目标、标注方法、质量指标等多方面内容,同时,参与标注的人员也需经过专业培训和严格考核。若标注内容准确性不足,或者未建立有效的审核机制,那么标注质量就难以保证,这种情况下,大模型备案申请很可能因标注质量问题被驳回。

二、安全措施不达标
1.未建立用户数据管理机制
从用户数据管理角度来看,大模型需要为用户提供便捷的 “关闭数据训练” 功能,且操作路径一般不宜超过四次点击。同时,要明确告知用户数据的使用范围。
2.供应链安全风险
在大模型的搭建过程中,如果使用了未备案的第三方基础模型,尤其是境外模型,或者没有对芯片、算力等供应链环节进行合规审查,那么就可能因为供应链存在安全风险而导致备案申请被驳回。

大模型备案被驳回的原因是多方面的,涉及语料安全、内容风险、备案材料、主体信息、安全措施以及行业和属地等多个维度。相关企业和机构在进行备案申报前,务必全面梳理和自查,确保各项条件和材料符合要求,从而提高大模型备案的成功率,合法合规地推进大模型业务发展。
更多推荐

所有评论(0)