AI取代测试工程师前得先学会背锅

2026年5月3日 78点热度 0人点赞 0条评论

📖导读

AI越强大,测试工程师越不可或缺——因为AI可以干活,但无法承担责任。理由如下:
  1. 责任不可让渡:所有AI替代论忽略的根本问题是——谁为AI的失误负责?法律上,签字放行的人才承担法律责任,AI只是工具。

  2. 测试的本质不是找Bug,而是质量背书:测试工程师的核心价值在于“专业判断+承担责任”,这包含大量隐性知识和业务直觉,无法被训练数据替代。

  3. AI带来新风险:非确定性与幻觉:大模型的概率性输出颠覆了传统测试的确定性思维,需要人类专家做最终验证和审计。

  4. 测试工程师的升维路径:从“执行者”升级为“背书者”,从“技术工种”转变为“风险责任岗位”。核心能力转向:审计AI、判断业务伦理、承担决策风险。

AI测试工具越来越普遍,但谁为AI的测试失误承担责任?


领测老贺认为所有讨论AI将取代测试工程师的文章都忽略了一个根本问题:谁为AI的测试失误背锅?

mabl(云原生、AI驱动的测试自动化平台)的报告说,完全采用DevOps的组织中,70%已经在测试中使用AI。Testlio的数据显示,功能测试自动化率达到了66.5%。这些数字看起来很漂亮,但它们只回答了"AI能不能干活"的问题,完全没有触及另一个问题:当AI干砸了,谁来承担后果?

我见过太多测试经理对着AI工具生成的测试报告点头称赞,然后毫不犹豫地签字放行。他们没意识到一个残酷的事实:那个签字的人,才是法律意义上的"测试工程师",AI不过是你的工具,就像你手里的键盘

被忽略的测试责任黑洞

去年有个做金融风控的朋友跟我聊起一件事。他们公司引入了AI测试工具,覆盖率从60%飙到92%,看起来很美好。但上线后出了一个边界条件的漏测,导致一笔异常交易没有被拦截,损失了七位数。事后追责,公司想甩锅给AI工具供应商,律师告诉他们:没戏。合同写得清清楚楚,AI工具只提供"辅助决策",最终放行签字的是测试负责人。AI可以帮你干活,但不会帮你背锅

这就是所有AI替代论的逻辑终点——你可以把执行交给机器,但你无法把责任交给机器。当自动驾驶测试漏掉一个关键场景导致车祸,当AI招聘工具产生系统性歧视被起诉,当算法推荐导致用户隐私泄露,被告席上坐着的永远是人类:产品负责人、测试经理、公司高管。从来没有一个法官会判决"AI系统有期徒刑三年"。

有人可能会反驳:未来法律会不会赋予AI法律人格?老实说,老贺不关心这个。因为即使AI有了法律人格,公司依然需要有人为"选择使用这个AI工具"这个决策负责。你选的工具,你签的字,你放行的版本,这个链条不会因为AI工具变聪明了就断裂。

测试的本质不是找Bug

大多数人对测试工程师的理解存在一个根本误区:认为测试就是找bug。这个认知太浅了。测试的真正本质是为质量背书——用专业判断告诉你,这个版本可以发布了,如果出了问题,我来承担专业责任。

这个"背书"动作包含大量无法被显性化的隐性知识。比如,你知道这个功能涉及用户资金,必须重点测;那个功能只是展示优化,可以适当降低优先级。你知道这个开发最近状态不好,他写的代码要格外小心;那个开发很靠谱,他说测过了你就可以放心。你知道这个上线时间卡得太死,必须有人拍板说"够好了,上吧"。这些判断没有教科书,没有训练数据,只有几十年摸爬滚打积累下来的直觉

CT-GenAI测试大纲里有个概念叫"幻觉"(Hallucination)。当大语言模型生成的内容存在事实性错误或与任务不相关时,就会出现幻觉。大纲给出的检测方法包括交叉验证、领域专家咨询、一致性检验。但你发现没有,所有这些方法都需要一个人类专家来做最终判断。AI可以生成测试用例,AI可以执行测试流程,但当AI说"这个测试通过了"时,谁来验证AI没有产生幻觉?还必须是人类。

Katalon的报告说,实现质量目标的最大挑战是测试时间不足(55%)和高工作量(44%)。AI确实可以解决这些问题,但解决的是"效率问题",不是"责任问题"。你用AI把测试时间从10天压缩到1天,但你签字放行那一刻承担的责任,一点都没少。

非确定性带来的新风险

GenAI大纲第3章还有个概念让我重新思考了测试的定义:非确定性行为。即使输入相同,大语言模型的输出也可能不同。原因很简单,推理过程中采用的是概率采样方法。你可能听过"温度参数"这个词,温度越高,输出越随机。

这对传统测试思维是颠覆性的。传统测试中,同一个输入两次运行结果不同,那就是bug。但在AI系统中,这可能是正常行为。大纲给出的缓解方法是调整温度参数或设置随机种子。但更深层的问题是:你怎么定义AI系统的"正确性"?你不能期望它100%正确,你只能期望它在某个置信区间内表现符合预期

这带来了一个新的风险:当AI测试工具本身产生偏差时,谁来发现?谁来审计AI的审计?答案只能是具备测试思维的人类。测试工程师正在从"测试执行者"变成"AI审计员"——不是去和AI比拼谁发现的bug多,而是去监控AI有没有在正确地测试。

这个转变比大多数人想象的要深刻。它要求测试工程师掌握新的技能:理解AI模型的局限性,识别AI测试工具的盲区,建立对AI测试结果的复核机制。更重要的是,它要求测试工程师承担新的责任:当AI测试漏掉了关键问题,你不是受害者,你是责任人——因为是你选择相信AI的判断。

测试工程师的升维

所以测试工程师会消失吗?不会。但他们会变。

未来的测试工程师,不再是那个写用例、跑脚本、报bug的人。AI可以做得更快更全面。未来的测试工程师,是那个看着AI生成的测试报告说"等等,这里有问题"的人;是那个在AI信心满满地说"测试通过"时追问"你确定覆盖了边界条件吗"的人;是那个在上线前最后一刻拍板签字,把职业生涯押在这个版本上的人。

这是一个从"执行者"到"背书者"的升维,从"技术工种"到"风险责任岗位"的转变

有数据显示:超过一半的测试者让最终用户参与测试过程,只有非常少的从业者从不这样做。这说明什么?说明测试从来不是闭门造车,它需要理解用户场景,需要判断业务风险,需要做出伦理决策。AI可以模拟一万个用户场景,但它无法理解为什么这个场景涉及用户隐私需要特别保护,为什么那个功能可能伤害弱势群体需要伦理审查。这些判断,只能由人类完成。

我见过一些年轻的测试工程师对这个趋势感到恐慌。他们担心AI会抢走自己的工作。我的建议是:别和AI比效率,那是你赢不了的战场。去学习AI无法替代的东西——对业务伦理的判断,对用户风险的直觉,对灰色地带的质量决策,以及最重要的一点:为你的判断承担责任的勇气。

一个不太舒服的问题

写到这里,我想问每一个正在使用AI测试工具的测试人一个问题:

下次AI告诉你"测试通过,可以发布"的时候,你敢在放行单上签上自己的名字吗?

如果你的答案是"敢",恭喜你,你已经是合格的"AI时代的测试工程师"了。如果你的答案是"凭什么让我签,明明是AI测的"——那你可能需要重新理解一下软件测试这个职业的本质。

测试从来不是找bug那么简单,测试是为质量背书,而这个背书,AI做不到

领测老贺

30年软件测试老兵 | ISTQB CT-GenAI测试本地化工作组组长

专注AI时代的软件测试方法论与实践

AI测试,自动化测试,质量保障

领测老贺

领测软件测试网站长,ISTQB认证高级培训师,TMMi认证咨询师。深耕软件测试行业20余年,领测老贺聊软件测试制造者。

文章评论