分类 · 政策
“AI+政务”指引:4个场景×4个部署规范×6个安全措施
解读《政务领域人工智能大模型部署应用指引》,按场景、部署与安全要求给出落地清单。
2025/10/11 更新 2025/10/11 5 分钟阅读
“AI+政务”指引:4个场景×4个部署规范×6个安全措施
10月10日晚,中央网信办、国家发展改革委联合印发《政务领域人工智能大模型部署应用指引》,明确“四类场景、十三项应用”,提出“统筹集约、统管复用、持续迭代、安全先行”的总要求,并对内容审核、日志审计、提示注入拦截、保密与备案等提出刚性要求。本文按“看点—怎么做—如何评估”三步,给出可操作的落地清单。

▎要点速览
- **政策定位:**为各级政务部门提供部署与应用的工作导向与基本参照,动态更新。
- **四类场景:**政务服务、社会治理、机关办公、辅助决策,共计13个典型应用。
- **部署方式:**依托“东数西算”和一体化算力网,省级统筹、地市按省要求、县级复用,避免“模型孤岛”。
- **运行管理:**强调内容审核、风险标识、多模型交叉校验、日志审计、对抗检测,防“数字形式主义”。
- **合规底线:**算法备案与安全评估、保密要求(“涉密不上网、上网不涉密”)必须到位。
▎场景地图:四大场景13项应用*
| 应用 | 价值 | 核心能力 | 指标 |
|---|---|---|---|
| 场景一:政务服务 | |||
| 智能问答 | 提升咨询命中率 | RAG/知识图谱 | 准确率、召回率、无答案率 |
| 辅助办理 | 缩短办件时长 | 表单预填/规则引擎 | 平均办理时长、一次性通过率 |
| 政策服务直达快享 | “政策找人/找企” | 人群画像/匹配算法 | 触达率、转化率、精准度 |
| 场景二:社会治理 | |||
| 智能监测巡检 | 早发现早处置 | CV/多源感知 | 告警准确率、虚警率、处置时效 |
| 辅助执法监管 | 提质增效、留痕规范 | ASR/视频分析/知识图谱知识推理 | 证据完备率、法条检索时延 |
| 市场风险预测 | 经济波动预警 | 时间序列/异常检测 | 预测AUC、提前量(天) |
| 场景三:机关办公 | |||
| 辅助文书起草 | 降本增效 | 模板+本地知识库 | 成稿时间、修改轮次 |
| 资料检索 | 从“找得到”到“找得准” | 语义检索/知识图谱 | 平均检索时延、Top-k准确率 |
| 智能办公 | 自动分类与优先级 | NLP/多模态识别 | 分办准确率、平均等待时长 |
| 场景四:辅助决策 | |||
| 灾害预警 | 多源融合研判 | 遥感+地面感知 | 提前预警率、漏警率 |
| 应急处置 | 提高应急效率和速度 | 强化学习/数字孪生 | 推演耗时、资源调度效率 |
| 政策评估 | 政策优化 | 数据挖掘/推断分析 | 政策达成度、满意度 |
| 智能辅助评审 | 提高评审效率和科学性 | 多模态解析/类人推理 | 一致性得分、评审时长 |
▎部署与治理框架(“3+1”)
3:实施路径、集约部署、统管复用;1:数据基础。
实施路径
- 通用场景(如问答、起草):优先选用已备案的成熟产品/服务。
- 专业场景(如执法、预测):结合专家知识+专业数据定制垂直模型。
- 在确保不泄露国家/工作秘密与敏感信息前提下,可用互联网算力与模型资源。
- 鼓励探索政务智能体、具身智能等创新应用。
统筹集约
- 省级(含部委)统一部署算力与模型;
- 地市按省要求推进;
- 县级及以下原则上复用上级资源。
统管复用
- 省级搭建统一服务平台,与政务云、应用/组件管理平台融合,纳入算力/模型/数据集“一本账”,避免“模型孤岛”。
数据基础
- 高质量政务数据集/知识库建设
- 分类分级管理训练/微调/知识库数据
- 来源与规模台账可追溯。
▎运行与安全(六大必做项)
应用管理
- 坚持“辅助型”定位,在界面显著位置风险提示与输出标识;
- 面向公众的问答/办理类严格内容审核(人工+实时风控+多模型交叉校验)。
- 防数字形式主义。
持续迭代
- 建立常态化更新与用户反馈机制,数据清洗/标注/补录闭环。
安全管理
- 合规:算法备案与安全评估、合法来源数据与基础模型、服务协议厘清权责。
- 对抗:提示注入/资源消耗攻击检测拦截,多模态内容安全管控,代答/拒答机制。
- 运行:日志留存与定期审计、威胁情报共享与应急。
保密要求
- “涉密不上网、上网不涉密”,全流程(选型—部署—训练—使用—废止)保密管理,涉密系统稳妥推进。
监测评估
- 上线前做算法/内容/功能/环境/数据/漏洞充分测试;
- 上线后状态/时延/准确/安全实时监测与问题闭环。
组织与经费
- 探索企业建设运营、政府购买服务、按使用量结算的模式,打造可持续生态。
▎附录:CheckList
| 上线前后合规清单 |
|---|
| 上线前(Gate 0/1/2) □ G0 需求关:场景是否在13类内;是否“辅助型”定位与不强制使用声明。 □ G1 数据关:数据分级分域、来源台账、脱敏与水印、可追溯与最小化。 □ G2 算法关:基础模型与服务备案材料、安全评估报告、评测与红蓝对抗记录。 □ 工程关:RAG/知识库权威来源清单、输出标识、人审与风控联动流程、日志与审计策略、攻防规则(注入/越权/消耗)。 运行中(SLA/KPI) □ 可用性:P95响应时延、系统可用性、峰值QPS/并发。 □ 准确性:问答正确率、检索Top-k、事实自洽率、无答案率。 □ 安全性:越狱/注入检出率、违规召回率、误杀率、对抗样本拦截率。 □ 合规性:内容审核覆盖率、标识合规率、日志审计及时率、事件处置时效。 |
| 90天落地路线图 |
|---|
| 0–2周:评估与选型 ✔️ 明确3–5个高频场景; ✔️ 完成基础模型备案核验; ✔️ 梳理数据分级与台账模板。 |
| 3–6周:POC与对抗 ✔️ 建立小样本知识库(权威来源优先); ✔️ 上线输出标识、风控与人审; ✔️ 完成提示注入/消耗攻击对抗测试。 |
| 7–10周:平台化与复用 ✔️ 对接省级统一服务平台与电子政务外网; ✔️ 打通资源“一本账”; ✔️ 梳理县级复用清单。 |
| 11–13周:评估与推广 ✔️ 完成上线前全量测试与整改; ✔️ 发布监测评估月报模板与SLA; ✔️ 形成“一地建设、多地复用”示范。 |
| 政府侧 | 供应商侧 |
|---|---|
| 1、确立场景牵引和指标牵引双闭环; 2、把关内容审核、人审责任与留痕; 3、落实日志审计与应急演练。 | 1、提供合规齐备的备案/测评材料; 2、实现风险标识、交叉校验、风控联动; 3、输出检测拦截策略与月度监测报告模板。 |
<术语解释>
- RAG:检索增强生成,确保回答“有据可依”。
- 多模型交叉校验:用两个及以上模型互相核对,降低幻觉与偏差。
- 提示注入:恶意让模型违背既定规则的攻击方式(需策略拦截与沙箱)。
同专题推荐
查看专题全球AI治理的政治制度基础、治理逻辑、立法结构和治理工具
梳理全球AI治理的三条主路径,比较不同政治制度下的治理逻辑、立法结构与工具组合,并聚焦生成式AI、深度合成与算法透明度的差异化监管。
《国务院“人工智能+”行动意见》解读:六大领域八大支撑
解读《意见》的六大领域与八大支撑,梳理AI+国家级工程的逻辑、机遇与挑战。