当AI能穷举一切，测试工程师准备好扯掉“测试思维”这块遮羞布了吗？

2026年5月8日 212点热度 0人点赞 0条评论

导读

曾被奉为测试工程师核心竞争力、被视为神秘“直觉”或“天赋”的“测试思维”，实际上是一个从未被清晰定义的空洞概念。当AI技术能够以毫秒级速度穷举传统测试依赖的“边界值直觉”时，这一模糊概念的脆弱性暴露无遗。测试工程师的“护城河”瞬间瓦解，引发了前所未有的身份认同危机。

领测老贺指出，问题的核心并非AI是否具有“思维”，而是因为“测试思维”被过度神秘化，成为掩盖组织能力建设不足（如缺失质量标准、可复用资产、知识库）的借口。真正的挑战来自AI系统本身的“非确定性”行为，它彻底颠覆了基于确定性输入-输出模型的传统测试方法论基础。

最终的出路在于，测试工程师的价值主张必须实现根本性转变：从“发现别人发现不了的Bug”的个人英雄主义，转向“构建AI与人类协同工作的测试系统”的组织者角色。测试工程师的价值不再依赖于不可言传的“思维”，而应建立在两大支柱上：1）将自身可编码的工作流程显性化、工具化，赋能AI和新人；2）承担起AI无法替代的、基于风险的“质量决策责任”。

简而言之，“测试思维”的终结，是测试行业从依赖个人“黑箱”走向构建组织“基础设施”的新生。

寻找不存在的测试思维

那个让老陈失重的问题

老陈盯着屏幕上AI生成的测试用例，光标在"删除"按钮上悬停了许久，最终还是按了下去。

那是他引以为傲的"边界值直觉"——二十年来，他总能一眼看出哪里会出问题。0和1之间、空和非空之间、权限的有和无之间，这些边界曾是他的护城河。但现在，代码在0.1秒内把它们穷举殆尽。

会议室里，新来的产品经理问他："陈工，除了这些AI想不到的'神来之笔'，你的测试思维到底体现在哪里？"

那一刻，老陈感到一种前所未有的失重感。

他说不上来。

不是说不清楚，是根本说不上来。他赖以生存二十年的"测试思维"，似乎在这一刻变成了一句无法自证的空话。

我是领测老贺，在测试这行摸爬滚打二十年。老陈的故事不是个案，它正在这个行业里悄悄发生。当AI逼迫我们将那些"只可意会不可言传"的东西显性化时，我们才发现——

如果不曾被定义，又何谈被替代？

边界值直觉的消亡

老陈那天晚上没睡好。

他躺在那儿翻来覆去，脑子里全是产品经理那句"你的测试思维到底体现在哪里"。不是嘲讽，就是单纯的好奇，像问一道菜为什么好吃。

可这道菜，老陈做了二十年，从没想过要写菜谱。

第二天，他试着把自己的"边界值直觉"拆解开。第一步是什么？看需求文档。然后呢？脑子里会跳出来一些"感觉不对"的地方。再然后？再然后就开始写用例了。

他发现自己根本说不清"感觉不对"是怎么来的。

"就是经验嘛。"老陈跟自己解释，"做多了自然就有感觉。"

但这个解释说服不了他。如果只是经验，为什么有些新人做三年就有这种直觉，有些老人做十年还是不行？如果可以传授，为什么他带过的徒弟里，真正"开窍"的不到三分之一？

更关键的问题是——如果AI也能穷举边界，那他的"直觉"还剩什么？

mabl发布的《Testing in DevOps Report 2025》显示，在完全采用DevOps的组织中，70%的测试工作已经在使用AI。老陈看到的不是数字，是浪潮。

他开始意识到，自己引以为傲的"测试思维"，可能从来就不是某种神秘的认知能力，而是一套从未被显性化的工作方法。

当直觉无法被翻译成代码，它就只是特权，而非能力。

说不清的"测试思维"

说实话，"测试思维"这四个字，我在行业里听了十五年。

每次开会，总有人说"我们要培养测试思维"。每次面试，总有人问"你怎么理解测试思维"。每次写文章，总有人强调"测试思维是核心竞争力"。

但你有没有发现一件事——

从来没有人能清晰地定义它。

我有次参加一个行业峰会，台上坐了五个资深测试专家，主持人问："什么是测试思维？"

五个人给了五个答案。有人说是对风险的敏感度，有人说是发现问题的能力，有人说是系统性思考的习惯，有人说是质疑精神，还有人说是一种"站在用户角度"的同理心。

都对，也都错。因为如果这个概念真的存在，为什么二十年没人能说清楚？

我回去翻了翻资料。从2000年测试行业在中国起步，到今天，"测试思维"这个词出现的频率越来越高，但定义始终模糊。它像一个被不断填充的抽屉，什么都能往里塞——细心是测试思维，逻辑是测试思维，想象力是测试思维，甚至"较真"也是测试思维。

测试思维不是答案而是问题本身——它被用来回避组织能力建设的真正挑战。

当一家公司说"我们缺有测试思维的人"时，它可能真正缺的是：清晰的质量标准、可复用的测试资产、能够传承的知识库、或者干脆就是足够的人手。

但承认这些太难了。承认这些，就要花钱、花时间、花精力去建设。而说"缺测试思维"，只需要招一个"有经验的人"。

老陈就是这样被招进来的。二十年来，他一直是那个"有测试思维的人"。

直到AI把他的工作拆解成代码。

非确定性带来的颠覆

老陈后来跟我聊，说最让他震动的不只是AI能穷举边界。

是他发现，有些东西连"穷举"这个概念都不适用了。

我给他讲了讲CT-GenAI大纲里的一个概念——非确定性行为。简单说，就是同一个输入，大语言模型的输出可能不同。原因在于推理过程中的概率采样。有个参数叫"温度"，温度越高，输出越随机。

老陈愣了一下。

在传统测试里，同一个输入两次运行结果不同，那就是bug。但在AI系统里，这可能是正常行为。

"那你怎么定义'正确'？"老陈问。

对啊，怎么定义？

你不能期望AI系统100%正确。你只能期望它在某个置信区间内表现符合预期。这个思维转变，可能是测试工程师在AI时代需要完成的最重要转变。

老陈说他突然意识到，自己引以为傲的"测试思维"，其实是一套建立在确定性系统上的方法论。输入确定，输出可预期，他才能用"直觉"去判断哪里会出问题。

但AI系统的行为取决于训练数据的分布，取决于概率采样，取决于你没法完全预测的因素。

他的"边界值直觉"，在这个世界里，可能连前提都不存在了。

我们曾以为"测试思维"是最后的防线，回头看，它不过是拒绝进化的掩体。

Agent的现实：实习生般的无力

老陈后来试了试用Agent做测试自动化。

期望是美好的：一个能自己分析需求、自己写用例、自己执行、自己报Bug的智能体，像一个独立工作的测试工程师。

现实是骨感的：Agent更像一个"需要监督的实习生"。

你得告诉它每一步做什么。做完一步，你得检查结果。不对，要立刻纠正。对了，才能继续下一步。

老陈说，他原本以为Agent缺的是"测试思维"。

但用了一段时间，他发现不是这么回事。

Agent能执行指令，但它不能自主判断"这个场景有没有风险，应该多测一轮"。它能穷举边界值，但它不知道哪个边界值值得重点关注。它能生成用例，但它分不清哪些用例是冗余的，哪些用例真正增加了信息量。

Testlio的《Test Automation Statistics 2025》显示，目前最自动化的测试类型是功能测试（66.5%）、API测试（54.2%）和回归测试（50.5%）。这些都是规则明确、预期清晰的测试。

而那些需要判断的、模糊的、依赖上下文的测试，Agent还差得远。

老陈突然明白了一件事——

他一直以为"测试思维"是一种神秘的认知能力。但现在他发现，这套东西其实可以拆成两部分：一部分是可以编码的逻辑（穷举边界、生成用例、执行脚本），另一部分是没法编码的判断（评估风险、决定优先级、承担责任）。

Agent缺的不是"测试思维"，是判断力。

而判断力，从来就不是什么神秘的"思维"，它是决策责任。

在算法的显微镜下，所谓"艺术"往往只是尚未被解构的"技术"。

转型的真相

老陈后来换了种方式工作。

他不再试图证明自己有"测试思维"，而是开始做两件事。

第一，把能编码的东西都编码出来。他开始认真记录自己的工作方法，把那些"只可意会不可言传"的步骤显性化、结构化、工具化。他发现，很多他以为是"直觉"的东西，其实是可以被拆解成流程的。

第二，把不能编码的东西承担起来。他开始在团队里明确自己的角色——不是"发现最多Bug的人"，而是"做最终质量决策的人"。当AI生成的测试结果有歧义，当业务需求有冲突，当发布决策需要拍板，他站出来做那个承担责任的人。

mabl的报告里有个数据：完全采用DevOps的组织中，65%的开发工作和70%的测试工作已经在使用AI。这个趋势不可逆。

但老贺我想说的是，AI替代的不是技能，是测试工程师的价值证明体系。

过去，测试工程师的价值证明体系是"我能发现别人发现不了的问题"。这个体系建立在两个前提上：第一，发现问题需要特殊能力；第二，发现问题需要人工成本。现在，这两个前提都被打破了。

新的价值证明体系是什么？

不是"我有测试思维"，而是"我能构建让AI和人类协同工作的系统"。不是"我能发现问题"，而是"我能在AI发现问题的基础上，做出正确的质量决策"。

测试工程师的真正价值正从执行测试转向设计测试系统和质量决策。

老陈说他现在睡得比以前好。

不是因为工作变轻松了，是因为他知道自己在做什么了。过去他总觉得自己在守护一个神秘的"测试思维"，生怕别人学会了，自己就没价值了。现在他发现，没有什么神秘的。可编码的，交给AI和工具；不可编码的，是决策责任，这东西没法被替代，只能被承担。

你可以怎么做

写到这里，我想给你一个今天的动作。

不是去捍卫"测试思维"这个概念，而是开始记录——

那些你无法向新人解释的"那一刻我是怎么想到的"。

当你把那些"神来之笔"记录下来，拆解开，结构化，你可能会发现两件事。

第一，大部分你以为的"直觉"，其实是有迹可循的逻辑。只是你从来没把它显性化。这部分，可以交给AI，可以教给新人，可以变成工具。

第二，小部分你以为是"思维"的东西，其实是"判断"。是你在信息不完整时做的决定，是你在风险和成本之间做的权衡，是你在没人敢拍板时站出来说"我来担"。这部分，不是能力，是责任。

当你发现那个"神来之笔"其实有迹可循时，是感到了解脱，还是某种丧失？

我不知道。

但老贺我可以说的是——

测试行业的历史，就是一部不断将"需要判断的活动"转化为"可执行规程"的历史。从手工测试到自动化测试，从探索式测试到脚本化测试，AI只是这一逻辑的延续。

测试思维的神秘化，是对这一历史趋势的短暂抵抗。

但抵抗的方向错了。

不是保卫某种不可言传的个人能力，而是加速推动测试判断的组织化、工具化、可审计化。使"测试思维"从个人黑箱变为组织基础设施。

这才是测试工程师对AI时代的真正适应。

至于那些还在强调"测试思维"的文章和培训——

你看看就好。

领测老贺

30年软件测试老兵 | ISTQB CT-GenAI测试本地化工作组组长