当AI能穷举一切,测试工程师准备好扯掉“测试思维”这块遮羞布了吗?

2026年5月8日 67点热度 0人点赞 0条评论

导读

曾被奉为测试工程师核心竞争力、被视为神秘“直觉”或“天赋”的“测试思维”,实际上是一个从未被清晰定义的空洞概念。当AI技术能够以毫秒级速度穷举传统测试依赖的“边界值直觉”时,这一模糊概念的脆弱性暴露无遗。测试工程师的“护城河”瞬间瓦解,引发了前所未有的身份认同危机。

领测老贺指出,问题的核心并非AI是否具有“思维”,而是因为“测试思维”被过度神秘化,成为掩盖组织能力建设不足(如缺失质量标准、可复用资产、知识库)的借口。真正的挑战来自AI系统本身的“非确定性”行为,它彻底颠覆了基于确定性输入-输出模型的传统测试方法论基础。

最终的出路在于,测试工程师的价值主张必须实现根本性转变:从“发现别人发现不了的Bug”的个人英雄主义,转向“构建AI与人类协同工作的测试系统”的组织者角色。测试工程师的价值不再依赖于不可言传的“思维”,而应建立在两大支柱上:1)将自身可编码的工作流程显性化、工具化,赋能AI和新人;2)承担起AI无法替代的、基于风险的“质量决策责任”。

简而言之,“测试思维”的终结,是测试行业从依赖个人“黑箱”走向构建组织“基础设施”的新生。

 

寻找不存在的测试思


那个让老陈失重的问题

老陈盯着屏幕上AI生成的测试用例,光标在"删除"按钮上悬停了许久,最终还是按了下去。

那是他引以为傲的"边界值直觉"——二十年来,他总能一眼看出哪里会出问题。0和1之间、空和非空之间、权限的有和无之间,这些边界曾是他的护城河。但现在,代码在0.1秒内把它们穷举殆尽。

会议室里,新来的产品经理问他:"陈工,除了这些AI想不到的'神来之笔',你的测试思维到底体现在哪里?"

那一刻,老陈感到一种前所未有的失重感。

他说不上来。

不是说不清楚,是根本说不上来。他赖以生存二十年的"测试思维",似乎在这一刻变成了一句无法自证的空话。

我是领测老贺,在测试这行摸爬滚打二十年。老陈的故事不是个案,它正在这个行业里悄悄发生。当AI逼迫我们将那些"只可意会不可言传"的东西显性化时,我们才发现——

如果不曾被定义,又何谈被替代?

边界值直觉的消亡

老陈那天晚上没睡好。

他躺在那儿翻来覆去,脑子里全是产品经理那句"你的测试思维到底体现在哪里"。不是嘲讽,就是单纯的好奇,像问一道菜为什么好吃。

可这道菜,老陈做了二十年,从没想过要写菜谱。

第二天,他试着把自己的"边界值直觉"拆解开。第一步是什么?看需求文档。然后呢?脑子里会跳出来一些"感觉不对"的地方。再然后?再然后就开始写用例了。

他发现自己根本说不清"感觉不对"是怎么来的。

"就是经验嘛。"老陈跟自己解释,"做多了自然就有感觉。"

但这个解释说服不了他。如果只是经验,为什么有些新人做三年就有这种直觉,有些老人做十年还是不行?如果可以传授,为什么他带过的徒弟里,真正"开窍"的不到三分之一?

更关键的问题是——如果AI也能穷举边界,那他的"直觉"还剩什么?

mabl发布的《Testing in DevOps Report 2025》显示,在完全采用DevOps的组织中,70%的测试工作已经在使用AI。老陈看到的不是数字,是浪潮。

他开始意识到,自己引以为傲的"测试思维",可能从来就不是某种神秘的认知能力,而是一套从未被显性化的工作方法。

当直觉无法被翻译成代码,它就只是特权,而非能力。

说不清的"测试思维"

说实话,"测试思维"这四个字,我在行业里听了十五年。

每次开会,总有人说"我们要培养测试思维"。每次面试,总有人问"你怎么理解测试思维"。每次写文章,总有人强调"测试思维是核心竞争力"。

但你有没有发现一件事——

从来没有人能清晰地定义它。

我有次参加一个行业峰会,台上坐了五个资深测试专家,主持人问:"什么是测试思维?"

五个人给了五个答案。有人说是对风险的敏感度,有人说是发现问题的能力,有人说是系统性思考的习惯,有人说是质疑精神,还有人说是一种"站在用户角度"的同理心。

都对,也都错。因为如果这个概念真的存在,为什么二十年没人能说清楚?

我回去翻了翻资料。从2000年测试行业在中国起步,到今天,"测试思维"这个词出现的频率越来越高,但定义始终模糊。它像一个被不断填充的抽屉,什么都能往里塞——细心是测试思维,逻辑是测试思维,想象力是测试思维,甚至"较真"也是测试思维。

测试思维不是答案而是问题本身——它被用来回避组织能力建设的真正挑战。

当一家公司说"我们缺有测试思维的人"时,它可能真正缺的是:清晰的质量标准、可复用的测试资产、能够传承的知识库、或者干脆就是足够的人手。

但承认这些太难了。承认这些,就要花钱、花时间、花精力去建设。而说"缺测试思维",只需要招一个"有经验的人"。

老陈就是这样被招进来的。二十年来,他一直是那个"有测试思维的人"。

直到AI把他的工作拆解成代码。

非确定性带来的颠覆

老陈后来跟我聊,说最让他震动的不只是AI能穷举边界。

是他发现,有些东西连"穷举"这个概念都不适用了。

我给他讲了讲CT-GenAI大纲里的一个概念——非确定性行为。简单说,就是同一个输入,大语言模型的输出可能不同。原因在于推理过程中的概率采样。有个参数叫"温度",温度越高,输出越随机。

老陈愣了一下。

在传统测试里,同一个输入两次运行结果不同,那就是bug。但在AI系统里,这可能是正常行为。

"那你怎么定义'正确'?"老陈问。

对啊,怎么定义?

你不能期望AI系统100%正确。你只能期望它在某个置信区间内表现符合预期。这个思维转变,可能是测试工程师在AI时代需要完成的最重要转变。

老陈说他突然意识到,自己引以为傲的"测试思维",其实是一套建立在确定性系统上的方法论。输入确定,输出可预期,他才能用"直觉"去判断哪里会出问题。

但AI系统的行为取决于训练数据的分布,取决于概率采样,取决于你没法完全预测的因素。

他的"边界值直觉",在这个世界里,可能连前提都不存在了。

我们曾以为"测试思维"是最后的防线,回头看,它不过是拒绝进化的掩体。

Agent的现实:实习生般的无力

老陈后来试了试用Agent做测试自动化。

期望是美好的:一个能自己分析需求、自己写用例、自己执行、自己报Bug的智能体,像一个独立工作的测试工程师。

现实是骨感的:Agent更像一个"需要监督的实习生"。

你得告诉它每一步做什么。做完一步,你得检查结果。不对,要立刻纠正。对了,才能继续下一步。

老陈说,他原本以为Agent缺的是"测试思维"。

但用了一段时间,他发现不是这么回事。

Agent能执行指令,但它不能自主判断"这个场景有没有风险,应该多测一轮"。它能穷举边界值,但它不知道哪个边界值值得重点关注。它能生成用例,但它分不清哪些用例是冗余的,哪些用例真正增加了信息量。

Testlio的《Test Automation Statistics 2025》显示,目前最自动化的测试类型是功能测试(66.5%)、API测试(54.2%)和回归测试(50.5%)。这些都是规则明确、预期清晰的测试。

而那些需要判断的、模糊的、依赖上下文的测试,Agent还差得远。

老陈突然明白了一件事——

他一直以为"测试思维"是一种神秘的认知能力。但现在他发现,这套东西其实可以拆成两部分:一部分是可以编码的逻辑(穷举边界、生成用例、执行脚本),另一部分是没法编码的判断(评估风险、决定优先级、承担责任)。

Agent缺的不是"测试思维",是判断力。

而判断力,从来就不是什么神秘的"思维",它是决策责任。

在算法的显微镜下,所谓"艺术"往往只是尚未被解构的"技术"。

转型的真相

老陈后来换了种方式工作。

他不再试图证明自己有"测试思维",而是开始做两件事。

第一,把能编码的东西都编码出来。他开始认真记录自己的工作方法,把那些"只可意会不可言传"的步骤显性化、结构化、工具化。他发现,很多他以为是"直觉"的东西,其实是可以被拆解成流程的。

第二,把不能编码的东西承担起来。他开始在团队里明确自己的角色——不是"发现最多Bug的人",而是"做最终质量决策的人"。当AI生成的测试结果有歧义,当业务需求有冲突,当发布决策需要拍板,他站出来做那个承担责任的人。

mabl的报告里有个数据:完全采用DevOps的组织中,65%的开发工作和70%的测试工作已经在使用AI。这个趋势不可逆。

但老贺我想说的是,AI替代的不是技能,是测试工程师的价值证明体系。

过去,测试工程师的价值证明体系是"我能发现别人发现不了的问题"。这个体系建立在两个前提上:第一,发现问题需要特殊能力;第二,发现问题需要人工成本。现在,这两个前提都被打破了。

新的价值证明体系是什么?

不是"我有测试思维",而是"我能构建让AI和人类协同工作的系统"。不是"我能发现问题",而是"我能在AI发现问题的基础上,做出正确的质量决策"。

测试工程师的真正价值正从执行测试转向设计测试系统和质量决策。

老陈说他现在睡得比以前好。

不是因为工作变轻松了,是因为他知道自己在做什么了。过去他总觉得自己在守护一个神秘的"测试思维",生怕别人学会了,自己就没价值了。现在他发现,没有什么神秘的。可编码的,交给AI和工具;不可编码的,是决策责任,这东西没法被替代,只能被承担。

你可以怎么做

写到这里,我想给你一个今天的动作。

不是去捍卫"测试思维"这个概念,而是开始记录——

那些你无法向新人解释的"那一刻我是怎么想到的"。

当你把那些"神来之笔"记录下来,拆解开,结构化,你可能会发现两件事。

第一,大部分你以为的"直觉",其实是有迹可循的逻辑。只是你从来没把它显性化。这部分,可以交给AI,可以教给新人,可以变成工具。

第二,小部分你以为是"思维"的东西,其实是"判断"。是你在信息不完整时做的决定,是你在风险和成本之间做的权衡,是你在没人敢拍板时站出来说"我来担"。这部分,不是能力,是责任。

当你发现那个"神来之笔"其实有迹可循时,是感到了解脱,还是某种丧失?

我不知道。

但老贺我可以说的是——

测试行业的历史,就是一部不断将"需要判断的活动"转化为"可执行规程"的历史。从手工测试到自动化测试,从探索式测试到脚本化测试,AI只是这一逻辑的延续。

测试思维的神秘化,是对这一历史趋势的短暂抵抗。

但抵抗的方向错了。

不是保卫某种不可言传的个人能力,而是加速推动测试判断的组织化、工具化、可审计化。使"测试思维"从个人黑箱变为组织基础设施。

这才是测试工程师对AI时代的真正适应。

至于那些还在强调"测试思维"的文章和培训——

你看看就好。

领测老贺

30年软件测试老兵 | ISTQB CT-GenAI测试本地化工作组组长

专注AI时代的软件测试方法论与实践

AI测试,自动化测试,质量保障

领测老贺

领测软件测试网站长,ISTQB认证高级培训师,TMMi认证咨询师。深耕软件测试行业20余年,领测老贺聊软件测试制造者。

文章评论