AI 视觉审核系统:从“多人串行轮审”到“AI 前置初筛”的工作流重构
一、落地与结果
我在这个项目中主要负责从 0 到 1 搭建视觉素材审核工作流,完成最小可用 Demo,并推动产品接入内部审核系统。上线后,原本需要 2-3 名跨部门同学轮值处理的高频看图任务,转为由 AI 前置过滤承接。
- 效率提升:AI 可在秒级完成基础底线审核,显著缩短单张素材的审核等待时间。
- 人力释放:首批接入 1 条核心业务线,当前日均自动处理约 50-60 张线上素材;按自然月估算,月处理量约 1500-1800 张。
- 阶段性结果:经过设计内测与训练数据调优,模型审核精准度已提升至 80%(已实现)。
这让团队从机械的全量审核中解放出来,人力能够聚焦于高价值的异常判定与最终决策。
演示视频
二、背景与目标
当业务规模高速增长时,我们首先看到的是“人工串行审核”带来的效率瓶颈。传统的审核链路(上传 -> 产品初审 -> 设计复审 -> 运营终审)极其冗长。多环节流转不仅拖累了素材上线的实际上线速度,且审核尺度极易受个人经验和疲劳度影响,标准漂移严重。
我的破局目标非常清晰:与其继续增加人力投入或单纯地把大模型当做“外部提效工具”,我们更需要重构的是系统的流转心智。我决定拒绝“AI 外挂”的轻量做法,而是顶住工程落地的压力,将 AI 深度嵌入业务,化为真实的“第一道防线”。
三、关键挑战
在真实业务场景中引入多模态大模型(Vision LLM),远比跑通一个 Demo 复杂:
- AI 判定的“可解释性与可执行性”:黑盒输出无法指导后续流程。AI 必须输出精准对应业务规范的违规理由,否则人工复核无从下手。
- 模型输出的“标准稳定性”:如何控制大模型在视觉理解上的幻觉(Hallucination),确保同类素材在不同批次的审核尺度不发生漂移。
- 从 Demo 到生产环境的“工程化落地”:面对每天高并发的真实业务数据,系统必须解决批量处理、异常重试等稳定性难题。
四、策略与设计方法
01 链路重构:确立“人机协同”的新范式
这一阶段的核心不是追求 AI 识别的完美率,而是建立新旧流程的边界。 【取舍】:我一开始面临过业务方希望“AI 一步替代所有人工”的压力,但我坚决砍掉了“全自动免人工”的方案。因为现阶段模型无法保证 100% 不误判。我选择精准切分任务边界——由 AI 秒级承接高重复、低创意的基础违规筛查(尺寸、明显错别字、基础版式);人类专家的精力则全面转向争议样本的兜底。好设计的核心是知道机器该干什么,人该干什么。
AI审核系统流程图(竖向)

02 视觉提示词工程(V-Prompt):将主观口径转化为强约束规则
针对大模型容易“过度发散”的问题,我重构了对话逻辑,将原本随意的提示词变为一套强约束的分析 SOP。 我把方案拆成三层:
- 解构层:强制模型先精准识别并提取画面关键元素。
- 规则层:将提取的元素与我们预设的业务规则库做严格比对。
- 输出层:强制按规定格式输出带原因的违规结论。
这让团队的审核标准从“因人而异的宽泛感知”迁移到了“高度一致的客观结论”。
03 实战调试:从“大一统评分”到“先判否、后细审”
【转折】:为了让模型在真实业务里稳定可用,我们做了三轮连续调试。一开始我想一步到位,第一轮采用了综合评分制,结果发现同一类素材出现了难以解释的分值波动。第二轮改成了“扣分制”,遵从性有了,但由于多维度耦合,仍有漏检漂移。 这迫使我推翻了原思路,在第三轮改为“严重违规先判否 + 通过后再做细节审查”的分步逻辑。这种将复杂决策拆解为串行防线的做法,让结果稳定性得到了显著提升。

04 基础设施建设:全栈工程化交付与数据闭环
为了让 AI 从“尝鲜玩具”蜕变为“日常基建”,我主导交付了【AI 审核工作台】。我们没有停留在简单的接口调用,而是支持了海量图片的异步批量处理、可视化进度和自动重试。 同时,我建立了“数据反馈 -> 模板更新 -> 模型微调 -> 再验证”的长期闭环体系。在内测复盘中,我们通过分析内测样本中的具体误判原因(如关联度不足),反向驱动了业务规则模板的二次迭代。

五、复盘与下一步
真正优秀的 AI 效率产品,其终局绝不是消灭人类,而是重塑业务的投入产出比(ROI)。
复盘这个项目,它不仅是一次技术接口的调用,更是对传统跨部门协作模式的一次“系统性手术”。我深刻意识到,在 AI 时代,产品与设计的核心壁垒恰恰在于**“定义系统边界感”**。当我们用工程化的思维管住了 AI 的幻觉,用自动化的工作台取代了人肉搬运,我们不仅提升了审核时效,更把团队最宝贵的创造力,还给了真正需要思考的业务环节。
下一步,我们将把这套人机协同的审核底座,从单条业务线推广至全平台的视觉资产管理中。