首页关于项目经验影响力联系项目汇总
AI项目汇总 Docs

AI 审核系统

将设计审核从单张扩展到批量闭环,提升交付效率与复审可追溯性

编辑
版本: 1.0.0
更新: 2026-03-10
AI 质量与效率
资源读源

AI 视觉审核系统:从“多人串行轮审”到“AI 前置初筛”的工作流重构

一、落地与结果

我在这个项目中主要负责从 0 到 1 搭建视觉素材审核工作流,完成最小可用 Demo,并推动产品接入内部审核系统。上线后,原本需要 2-3 名跨部门同学轮值处理的高频看图任务,转为由 AI 前置过滤承接。

  • 效率提升:AI 可在秒级完成基础底线审核,显著缩短单张素材的审核等待时间。
  • 人力释放:首批接入 1 条核心业务线,当前日均自动处理约 50-60 张线上素材;按自然月估算,月处理量约 1500-1800 张。
  • 阶段性结果:经过设计内测与训练数据调优,模型审核精准度已提升至 80%(已实现)。

这让团队从机械的全量审核中解放出来,人力能够聚焦于高价值的异常判定与最终决策。

演示视频

二、背景与目标

当业务规模高速增长时,我们首先看到的是“人工串行审核”带来的效率瓶颈。传统的审核链路(上传 -> 产品初审 -> 设计复审 -> 运营终审)极其冗长。多环节流转不仅拖累了素材上线的实际上线速度,且审核尺度极易受个人经验和疲劳度影响,标准漂移严重。

我的破局目标非常清晰:与其继续增加人力投入或单纯地把大模型当做“外部提效工具”,我们更需要重构的是系统的流转心智。我决定拒绝“AI 外挂”的轻量做法,而是顶住工程落地的压力,将 AI 深度嵌入业务,化为真实的“第一道防线”。

三、关键挑战

在真实业务场景中引入多模态大模型(Vision LLM),远比跑通一个 Demo 复杂:

  1. AI 判定的“可解释性与可执行性”:黑盒输出无法指导后续流程。AI 必须输出精准对应业务规范的违规理由,否则人工复核无从下手。
  2. 模型输出的“标准稳定性”:如何控制大模型在视觉理解上的幻觉(Hallucination),确保同类素材在不同批次的审核尺度不发生漂移。
  3. 从 Demo 到生产环境的“工程化落地”:面对每天高并发的真实业务数据,系统必须解决批量处理、异常重试等稳定性难题。

四、策略与设计方法

01 链路重构:确立“人机协同”的新范式

这一阶段的核心不是追求 AI 识别的完美率,而是建立新旧流程的边界。 【取舍】:我一开始面临过业务方希望“AI 一步替代所有人工”的压力,但我坚决砍掉了“全自动免人工”的方案。因为现阶段模型无法保证 100% 不误判。我选择精准切分任务边界——由 AI 秒级承接高重复、低创意的基础违规筛查(尺寸、明显错别字、基础版式);人类专家的精力则全面转向争议样本的兜底。好设计的核心是知道机器该干什么,人该干什么。

AI审核系统流程图(竖向)

提交审核素材

上传小卡图片并进入批量审核任务。

识别元素

提取画面要素

AI逐项提取主标题、副标题和主要图形。

先检违规

执行违规初检

先检查颜色关系、元素重叠与风格禁项。

继续评估

评估设计规范

通过初检后评估布局、文案、视觉与设计规范。

输出结论

产出审核结论

输出通过或不通过,并给出具体原因。

提取导出

沉淀结构结果

结构化结论可快速提取并一键导出。

分发复核

协同人工复核

专家聚焦争议样本进行兜底判定。

反馈优化

迭代审核规则

根据复核反馈持续优化提示词与分析SOP。

反馈回路:协同人工复核 ↺ 执行违规初检;迭代审核规则 ↺ 提取画面要素

AI审核流程设计:素材输入 -> AI识别 -> 图文匹配 -> 综合审核 -> 审核结果

02 视觉提示词工程(V-Prompt):将主观口径转化为强约束规则

针对大模型容易“过度发散”的问题,我重构了对话逻辑,将原本随意的提示词变为一套强约束的分析 SOP。 我把方案拆成三层:

  • 解构层:强制模型先精准识别并提取画面关键元素。
  • 规则层:将提取的元素与我们预设的业务规则库做严格比对。
  • 输出层:强制按规定格式输出带原因的违规结论。

这让团队的审核标准从“因人而异的宽泛感知”迁移到了“高度一致的客观结论”。

03 实战调试:从“大一统评分”到“先判否、后细审”

【转折】:为了让模型在真实业务里稳定可用,我们做了三轮连续调试。一开始我想一步到位,第一轮采用了综合评分制,结果发现同一类素材出现了难以解释的分值波动。第二轮改成了“扣分制”,遵从性有了,但由于多维度耦合,仍有漏检漂移。 这迫使我推翻了原思路,在第三轮改为“严重违规先判否 + 通过后再做细节审查”的分步逻辑。这种将复杂决策拆解为串行防线的做法,让结果稳定性得到了显著提升。

调试起点:从首页大卡线上素材开始内测 三轮迭代:v1.0评分版 -> v1.1扣分方向 -> v1.2严重违规先检 判否优先:先做颜色一致性、背景关系与禁项筛查 细节审查:通过初筛后再做布局/文案/视觉/设计规范检查 豁免规则固化:品牌吉祥物与同色系深浅差异单独定义

04 基础设施建设:全栈工程化交付与数据闭环

为了让 AI 从“尝鲜玩具”蜕变为“日常基建”,我主导交付了【AI 审核工作台】。我们没有停留在简单的接口调用,而是支持了海量图片的异步批量处理、可视化进度和自动重试。 同时,我建立了“数据反馈 -> 模板更新 -> 模型微调 -> 再验证”的长期闭环体系。在内测复盘中,我们通过分析内测样本中的具体误判原因(如关联度不足),反向驱动了业务规则模板的二次迭代。

内测结果看板:识别准确案例与错误案例并行对比 案例复盘:单卡判定结果与违规原因逐条对照 小卡专项总览:项目进展、样本规模与问题分布 小卡案例明细:逐卡展示识别结果、语义分析与审核结论 模型训练说明:按模块与设计风格分层训练,复用统一评分框架 长期调优流程:线上反馈反哺模板,再驱动模型持续微调

五、复盘与下一步

真正优秀的 AI 效率产品,其终局绝不是消灭人类,而是重塑业务的投入产出比(ROI)。

复盘这个项目,它不仅是一次技术接口的调用,更是对传统跨部门协作模式的一次“系统性手术”。我深刻意识到,在 AI 时代,产品与设计的核心壁垒恰恰在于**“定义系统边界感”**。当我们用工程化的思维管住了 AI 的幻觉,用自动化的工作台取代了人肉搬运,我们不仅提升了审核时效,更把团队最宝贵的创造力,还给了真正需要思考的业务环节。

下一步,我们将把这套人机协同的审核底座,从单条业务线推广至全平台的视觉资产管理中。

On this page