近期,上海市网信办依法约谈筑梦岛APP运营企业,指出其AI智能体内容生成环节存在低俗擦边等违规内容,这一事件引起了社会广泛关注。这起事件不仅反映了当前AI聊天软件在内容审核方面的普遍短板,更凸显了算法备案与合规管理在人工智能服务中的重要性。下面将从专业角度,对这起事件进行深入分析。
事件背景与违规性质分析
筑梦岛APP作为一款AI聊天软件,其核心功能是提供虚拟角色互动服务。根据报道,该平台AI智能体内容生成环节存在低俗擦边等违规内容,这些内容不仅违背了社会主义核心价值观,更对未成年人身心健康构成了潜在危害。上海市网信办在约谈中明确指出,该平台在AI生成合成内容审核机制上存在明显缺陷,技术把关能力不足,未能有效防范涉未成年人不良内容。
从专业视角看,这类违规行为主要违反了以下几方面规定:
首先,根据《生成式人工智能服务管理暂行办法》第四条的规定,提供和使用生成式人工智能服务应当遵守法律、行政法规,尊重社会公德和伦理道德,其中明确禁止生成"暴力、淫秽色情"等法律、行政法规禁止的内容。筑梦岛APP的虚拟角色互动生成低俗内容,显然直接违反了这一基本要求。
其次,该办法第五条要求在算法设计、训练数据选择、模型生成和优化等过程中,采取有效措施防止产生各种歧视,并尊重他人合法权益,不得危害他人身心健康。筑梦岛APP的低俗内容不仅可能对未成年人造成心理伤害,也侵犯了用户获得健康网络环境的合法权益。
再次,针对未成年人保护,《未成年人网络保护条例》明确规定网络产品和服务提供者应当履行未成年人网络保护义务,构建有利于未成年人身心健康的网络环境。筑梦岛APP未能有效识别和过滤可能影响未成年人身心健康的内容,显然未能落实这一法定责任。
算法合规管理的缺失
筑梦岛APP事件暴露了当前部分AI应用在算法合规管理上的几个关键问题:
(1)算法备案流程不完整。根据《生成式人工智能服务管理暂行办法》的要求,面向公众提供生成式人工智能服务的平台应当完成算法备案。虽然报道中未明确提及筑梦岛APP是否完成了备案,但可以推测其备案流程可能存在瑕疵,或者备案内容未能准确反映实际应用中的算法风险。
(2)训练数据审核机制不健全。《办法》第七条明确规定,生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型,并采取有效措施提高训练数据质量。筑梦岛APP的低俗内容很可能源于训练数据中包含不当内容,或者数据标注规则不清晰、标注质量评估不到位。办法第八条要求提供者制定清晰、具体、可操作的标注规则,开展数据标注质量评估,对标注人员进行必要培训,这些环节在筑梦岛APP上显然未能有效落实。
(3)内容审核技术不足。办法第十四条规定,提供者发现违法内容的,应当及时采取停止生成、停止传输、消除等处置措施,采取模型优化训练等措施进行整改。筑梦岛APP未能做到这一点,反映出其内容审核技术存在明显缺陷。有效的AI内容审核应当包括多层次的过滤机制,包括关键词过滤、图像识别、语义分析等,同时还需要人工审核作为补充。从备案角度看,算法设计阶段就应当充分考虑内容安全因素,将合规要求嵌入算法模型中。
(4)未成年人保护机制缺失。《未成年人网络保护条例》明确要求网络服务提供者要合理限制未成年人网络消费数额,防范和抵制流量至上等不良价值取向;网络游戏服务提供者要建立完善预防未成年人沉迷网络的游戏规则。对于AI聊天软件,同样需要建立未成年人识别机制和内容过滤机制,筑梦岛APP显然在这方面存在明显不足。
事件处理与整改要求的专业解读
上海市网信办对筑梦岛APP的处理措施体现了当前对AI服务监管的基本思路,这些措施从算法备案角度看,具有典型意义:
约谈整改是算法监管的第一道防线。约谈制度是网信部门对算法服务提供者进行日常监管的重要手段。对于发现问题的平台,网信部门通常会先进行约谈,要求其限期整改。筑梦岛APP被约谈后,企业负责人表示将"对照问题举一反三、全面整改",这种表态是合规的第一步。从备案角度看,约谈过程中通常会要求企业补充完善算法备案材料,明确算法风险点和应对措施。
技术把关能力提升是核心要求。约谈要求中特别提到要"提升技术把关能力",这直接指向算法设计和实现环节。根据《生成式人工智能服务管理暂行办法》,算法设计应当"采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视",并"尊重他人合法权益,不得危害他人身心健康"。筑梦岛APP需要从算法层面优化内容生成模型,增强对敏感内容的识别和过滤能力,这包括但不限于:
(1)优化关键词过滤系统,增加低俗、色情等敏感词库;
(2)改进图像识别模型,能够识别和过滤不适宜的图片内容;
(3)提升语义分析能力,避免通过隐喻、暗示等方式生成违规内容;
(4)建立用户反馈机制,将用户举报内容纳入算法优化数据集。
健全审核机制是备案审核的重点。约谈要求平台"健全AI生成合成内容审核机制",这与算法备案中的审核机制审查高度相关。在算法备案审核中,审核老师会重点关注平台的内容审核流程、审核人员配置、审核标准制定等情况。筑梦岛APP需要建立包括机器审核和人工审核在内的多级审核体系,明确审核标准和流程,确保所有生成内容都经过严格审核。备案材料中应当详细说明这些审核机制的具体内容和执行情况。
未成年人保护是备案的特殊关注点。约谈特别强调要"加强涉未成年人不良内容的整治清理,切实落实未成年人网络保护义务"。这反映了网信部门对未成年人网络保护的高度重视。《未成年人网络保护条例》明确要求网络产品和服务提供者应当遵守法律、行政法规和国家有关规定,尊重社会公德,遵守商业道德,诚实信用,履行未成年人网络保护义务,承担社会责任。在算法备案中,针对未成年人的保护措施是必报内容,包括但不限于:
用户年龄识别机制;
未成年人专属内容过滤规则;
防止未成年人沉迷的时长限制或消费限制;
针对未成年人的特殊内容推荐策略。
行业影响与合规建议
筑梦岛APP事件对整个AI聊天软件行业产生了深远影响,也为算法备案工作提供了重要启示:
行业合规意识将进一步提升。随着"清朗・整治AI技术滥用"专项行动的深入开展,上海市网信办聚焦利用AI技术制作发布谣言、不实信息、色情低俗内容、假冒他人、从事网络水军活动等突出问题。筑梦岛APP被约谈后,其他同类平台必然会更加重视合规问题,主动加强内容审核和算法管理。
算法备案工作将更加严格。筑梦岛APP事件表明,算法备案不仅是形式上的登记,更是实质性的合规承诺。审核老师在进行算法备案审核时,会更加关注平台的内容审核机制、技术把关能力、未成年人保护措施等实质性内容。平台在备案时需要提供更加详细、具体的算法风险点和应对措施,不能流于形式。备案后的监督检查也会更加严格,确保备案内容与实际应用一致。
针对同类AI聊天软件,仅对此次暴露的问题提供相关建议:
完善算法备案材料。在算法备案时,应当详细说明算法可能产生的风险点,特别是内容安全风险,并制定针对性的应对措施。备案材料中应当包括但不限于:
1.算法设计说明,包括模型架构、训练数据来源和筛选标准;
2.内容审核机制,包括机器审核和人工审核的流程和标准;
3.未成年人保护措施,包括年龄识别、内容过滤和时长限制等;
4.用户反馈机制,包括用户举报渠道和处理流程。
建立动态更新机制。算法备案不是一劳永逸的,应当根据技术发展和监管要求进行动态更新。平台应当建立算法更新后的备案材料补充机制,确保备案内容始终反映实际应用情况。特别是当算法产生的内容出现新的风险点时,应当及时更新备案材料,补充相应的风险防控措施。
加强备案后评估。平台应当定期对算法运行情况进行评估,特别是对内容生成情况进行抽样检查,评估算法风险防控措施的有效性。
积极参与行业自律。平台应当加入相关行业组织,参与制定行业自律规范,共同提高行业合规水平。例如,中国网络空间安全协会近期发布了《向未成年人提供生成式人工智能服务安全指引》,为行业提供了重要参考。平台应当积极学习这些行业规范,将其纳入自身合规体系。
筑梦岛APP事件是AI聊天软件行业在快速发展过程中遇到的一个典型问题,它反映了算法技术进步与内容合规管理之间的不平衡。这一事件既是对行业的一次警示,也是推动行业规范发展的契机。