AI 视觉审核系统：从“多人串行轮审”到“AI 前置初筛”的工作流重构

一、落地与结果

我在这个项目中主要负责从 0 到 1 搭建视觉素材审核工作流，完成最小可用 Demo，并推动产品接入内部审核系统。上线后，原本需要 2-3 名跨部门同学轮值处理的高频看图任务，转为由 AI 前置过滤承接。

效率提升：AI 可在秒级完成基础底线审核，显著缩短单张素材的审核等待时间。
人力释放：首批接入 1 条核心业务线，当前日均自动处理约 50-60 张线上素材；按自然月估算，月处理量约 1500-1800 张。
阶段性结果：经过设计内测与训练数据调优，模型审核精准度已提升至 80%（已实现）。

这让团队从机械的全量审核中解放出来，人力能够聚焦于高价值的异常判定与最终决策。

二、背景与目标

当业务规模高速增长时，我们首先看到的是“人工串行审核”带来的效率瓶颈。传统的审核链路（上传 -> 产品初审 -> 设计复审 -> 运营终审）极其冗长。多环节流转不仅拖累了素材上线的实际上线速度，且审核尺度极易受个人经验和疲劳度影响，标准漂移严重。

我的破局目标非常清晰：与其继续增加人力投入或单纯地把大模型当做“外部提效工具”，我们更需要重构的是系统的流转心智。我决定拒绝“AI 外挂”的轻量做法，而是顶住工程落地的压力，将 AI 深度嵌入业务，化为真实的“第一道防线”。

三、关键挑战

在真实业务场景中引入多模态大模型（Vision LLM），远比跑通一个 Demo 复杂：

AI 判定的“可解释性与可执行性”：黑盒输出无法指导后续流程。AI 必须输出精准对应业务规范的违规理由，否则人工复核无从下手。
模型输出的“标准稳定性”：如何控制大模型在视觉理解上的幻觉（Hallucination），确保同类素材在不同批次的审核尺度不发生漂移。
从 Demo 到生产环境的“工程化落地”：面对每天高并发的真实业务数据，系统必须解决批量处理、异常重试等稳定性难题。

这一阶段的核心不是追求 AI 识别的完美率，而是建立新旧流程的边界。 【取舍】：我一开始面临过业务方希望“AI 一步替代所有人工”的压力，但我坚决砍掉了“全自动免人工”的方案。因为现阶段模型无法保证 100% 不误判。我选择精准切分任务边界——由 AI 秒级承接高重复、低创意的基础违规筛查（尺寸、明显错别字、基础版式）；人类专家的精力则全面转向争议样本的兜底。好设计的核心是知道机器该干什么，人该干什么。

AI审核系统流程图（竖向）

提交审核素材

上传小卡图片并进入批量审核任务。

识别元素↓

提取画面要素

AI逐项提取主标题、副标题和主要图形。

先检违规↓

执行违规初检

先检查颜色关系、元素重叠与风格禁项。

继续评估↓

评估设计规范

通过初检后评估布局、文案、视觉与设计规范。

输出结论↓

产出审核结论

输出通过或不通过，并给出具体原因。

提取导出↓

沉淀结构结果

结构化结论可快速提取并一键导出。

分发复核↓

协同人工复核

专家聚焦争议样本进行兜底判定。

反馈优化↓

迭代审核规则

根据复核反馈持续优化提示词与分析SOP。

反馈回路：协同人工复核 ↺ 执行违规初检；迭代审核规则 ↺ 提取画面要素

AI审核流程设计：素材输入 -> AI识别 -> 图文匹配 -> 综合审核 -> 审核结果

02 视觉提示词工程（V-Prompt）：将主观口径转化为强约束规则

针对大模型容易“过度发散”的问题，我重构了对话逻辑，将原本随意的提示词变为一套强约束的分析 SOP。我把方案拆成三层：

解构层：强制模型先精准识别并提取画面关键元素。
规则层：将提取的元素与我们预设的业务规则库做严格比对。
输出层：强制按规定格式输出带原因的违规结论。

这让团队的审核标准从“因人而异的宽泛感知”迁移到了“高度一致的客观结论”。

03 实战调试：从“大一统评分”到“先判否、后细审”

【转折】：为了让模型在真实业务里稳定可用，我们做了三轮连续调试。一开始我想一步到位，第一轮采用了综合评分制，结果发现同一类素材出现了难以解释的分值波动。第二轮改成了“扣分制”，遵从性有了，但由于多维度耦合，仍有漏检漂移。这迫使我推翻了原思路，在第三轮改为“严重违规先判否 + 通过后再做细节审查”的分步逻辑。这种将复杂决策拆解为串行防线的做法，让结果稳定性得到了显著提升。

调试起点：从首页大卡线上素材开始内测三轮迭代：v1.0评分版 -> v1.1扣分方向 -> v1.2严重违规先检判否优先：先做颜色一致性、背景关系与禁项筛查细节审查：通过初筛后再做布局/文案/视觉/设计规范检查豁免规则固化：品牌吉祥物与同色系深浅差异单独定义

04 基础设施建设：全栈工程化交付与数据闭环

为了让 AI 从“尝鲜玩具”蜕变为“日常基建”，我主导交付了【AI 审核工作台】。我们没有停留在简单的接口调用，而是支持了海量图片的异步批量处理、可视化进度和自动重试。同时，我建立了“数据反馈 -> 模板更新 -> 模型微调 -> 再验证”的长期闭环体系。在内测复盘中，我们通过分析内测样本中的具体误判原因（如关联度不足），反向驱动了业务规则模板的二次迭代。

内测结果看板：识别准确案例与错误案例并行对比案例复盘：单卡判定结果与违规原因逐条对照小卡专项总览：项目进展、样本规模与问题分布小卡案例明细：逐卡展示识别结果、语义分析与审核结论模型训练说明：按模块与设计风格分层训练，复用统一评分框架长期调优流程：线上反馈反哺模板，再驱动模型持续微调

五、复盘与下一步

真正优秀的 AI 效率产品，其终局绝不是消灭人类，而是重塑业务的投入产出比（ROI）。

复盘这个项目，它不仅是一次技术接口的调用，更是对传统跨部门协作模式的一次“系统性手术”。我深刻意识到，在 AI 时代，产品与设计的核心壁垒恰恰在于“定义系统边界感”。当我们用工程化的思维管住了 AI 的幻觉，用自动化的工作台取代了人肉搬运，我们不仅提升了审核时效，更把团队最宝贵的创造力，还给了真正需要思考的业务环节。

下一步，我们将把这套人机协同的审核底座，从单条业务线推广至全平台的视觉资产管理中。

AI 视觉审核系统：从“多人串行轮审”到“AI 前置初筛”的工作流重构

一、落地与结果

演示视频

二、背景与目标

三、关键挑战

四、策略与设计方法

01 链路重构：确立“人机协同”的新范式

02 视觉提示词工程（V-Prompt）：将主观口径转化为强约束规则

03 实战调试：从“大一统评分”到“先判否、后细审”

04 基础设施建设：全栈工程化交付与数据闭环

五、复盘与下一步

On this page