注册

国家标准计划《智能技术政务应用 政务大模型应用效果评估规范》由 SWG35(全国智能技术社会应用与评估基础标准化工作组)归口 ,主管部门为国家标准委

主要起草单位 中国移动通信有限公司研究院清华大学大汉软件股份有限公司北京华宇信息技术有限公司中国标准化研究院等

目录

基础信息

计划号
20253240-T-469
制修订
制定
项目周期
18个月
下达日期
2025-08-06
公示开始日期
2025-06-12
公示截止日期
2025-07-12
标准类别
管理
国际标准分类号
35.240.01
35 信息技术、办公机械
35.240 信息技术应用
35.240.01 信息技术应用综合
归口单位
全国智能技术社会应用与评估基础标准化工作组
执行单位
全国智能技术社会应用与评估基础标准化工作组
主管部门
国家标准委

起草单位

目的意义

经济社会的发展离不开科技的进步与创新,以人工智能为代表的智能技术是引领新一轮科技革命和产业变革的重要驱动力量。

随着2022年底OpenAI公司打造的ChatGPT火遍全球,生成式人工智能作为新兴技术掀起了国内外对大模型的探索和应用,其在政务领域的应用已经发挥出巨大的价值并展现出不可估量的潜力。

政务大模型是智能技术应用于政务领域的重要工具载体,据统计,国内包括互联网企业、电信运营商、科研机构、高等院校、初创企业等在内至少 56 家大模型厂商在政务领域开展了布局,已广泛应用于政务服务“一网通办”、城市治理“一网统管”、政府办公“-网协同”,以及多样化的泛政务场景。

政务大模型的应用开启了数字政府创新发展的全新范式,逐步实现政府工作的智能化,政务大模型广泛应用时在信息处理效率、服务质量方面提升程度如何,是否满足使用者的需求,是否存在安全合规风险等,业界尚未形成统一的评估认识,亟需制定政务大模型的应用效果评估规范,实现政务大模型的健康发展及应用。

全球各国纷纷探索大模型在政府治理中的应用,包括美国、英国、澳大利亚、加拿大、新加坡、日本、韩国在内的 18 个国家或地区已将大模型应用在政府事务管理中,同时各国也在积极推动组织、人才、技术等变革以适应新的治理挑战,同时加快政务领域大模型应用规范。

2023 年以来,韩国、新加坡、美国、英国、澳大利亚、新西兰、日本、加拿大、丹麦等9个国家相继出台政府机关(公务员)使用生成式AI的临时指南,通过明确使用原则、框定场景范围、建立监管规范等规避技术风险,推动应用趋向合规。

从国内来看,国家层面持续推动智能技术的发展和在政务领域的应用。

2017年,国务院《新一代人工智能发展规划》提出打造智能政务,推进人工智能技术应用,推动社会治理智能化。

2021年“十四五”规划纲要提出,将数字技术广泛应用于政府管理服务,推动政府治理流程再造和模式优化,不断提高决策科学性和服务效率。

2022年,习近平总书记在中央全面深化改革委员会第二十五次会议上强调,要全面贯彻网络强国战略,把数字技术广泛应用于政府管理服务,推动政府数字化、智能化运行。

2022年发布的《国务院关于加强数字政府建设的指导意见》提出构建数字化、智能化的政府运行新形态,到2025年,政府履职数字化、智能化水平显著提升。

2024年发布的《国务院关于进一步优化政务服务提升行政效能推动“高效办成一件事”的指导意见》提出,加强人工智能等新技术在政务全流程应用,提升优化智能客服、智能问答、智能搜索、智能导办等服务。

实施《智能技术政务应用 政务大模型应用效果评估规范》相关标准,将为评估机构在政务大模型评估方案设计、评估指标制定等方面提供参标准遵循,为政务大模型的开发单位在大模型算法设计、模型优化、应用场景拓展等方面提供参考方案,为监管部门在监督管理、评估评价、整改指导等方面提供基本参考。

具有重要的经济、社会和生态效益: 在经济效益方面,该标准的实施有助于规范政务大模型的应用,提高政务服务自动化和智能化水平,从而显著提升政务处理效率,降低行政成本。

随着标准的普及和应用,将催生一批专注于智能技术研发和应用的企业,形成新的产业链和产业集群,推动相关产业的快速发展。

有助于探索新的商业模式和服务形态,如基于智能技术的个性化政务服务、智能决策支持等,为经济发展注入新动力。

在社会效益方面,通过开展政务大模型应用效果评估,可以提升政务大模型的服务能力,更加精准地满足公众需求,提高公共服务的针对性和有效性,增强人民群众的获得感和满意度。

该标准的实施有助于消除信息鸿沟,让更多人享受到智能化政务服务带来的便利,促进社会公平与正义。

通过推动智能技术在政务领域的广泛应用和规范化发展,有助于提升国家在全球数字化竞争中的地位和影响力。

在生态效益方面,该标准的实施有助于推动政务大模型向更加绿色、低碳的方向发展,为可持续发展贡献力量。

通过提高政务效率,减少纸质文件的使用和传输,有助于降低能源消耗和减少碳排放,实现节能减排的目标。

范围和主要技术内容

1、范围 本文件提供了政务大模型应用效果评估的原则及评估框架,提出了政务大模型应用效果评估的主要维度,提出了评估实施的方式及基本流程。 本文件适用于大模型开发、提供或使用方(如开发企业、研究机构、评估机构)开展政务大模型应用效果评估活动,并适用于有关部门开展政务大模型应用的监管评估。 2、主要技术内容 本标准技术部分主要包括以下内容。 (1)评估原则 评估原则包括客观公正、科学实用、动态适应、保密合规四条原则。 (2)评估方式 评估宜从定量评估、定性评估两种方式进行综合评估。 (3)评估维度 评估维度从业务体验维度、评价分析维度、效率效益维度、安全合规维度四个一级维度、14个二级维度、N个三级维度展开。 (4)评估流程 评估的基本流程宜包括但不限于确定评估目的及评估方、委托与受理、评估准备、评估执行、评估分析、形成评估结论及评估报告编制等关键环节。