AI时代，“只可意会”的测试思维是皇帝的新衣吗？

2026年5月3日 240点热度 0人点赞 0条评论

导读：

测试思维的真正含义是什么？当一种测试能力只能靠“悟”来传承时，它离失传也就不远了。“测试思维”并非神秘玄学或不可言传的“悟”，而是可以、也必须被结构化管理、显性化拆解和有效传承的能力。在AI时代，固守“只可意会”的经验主义是一种知识管理的失败，真正有竞争力的测试工程师是那些能将隐性判断转化为可执行步骤、可量化指标的人。

小北把笔记本电脑合上的时候，手有点抖。

那是去年冬天的一个下午，北京写字楼的暖气烧得人脸发烫。小北是三年前参加过我测试培训课程的学员，刚升了中级测试工程师，正面临他职业生涯的第一次“大考”——给新来的实习生讲清楚，什么叫“好的测试用例”。

他在会议室坐了一下午，憋红了脸，最后只憋出一句：“你们多跟着项目跑跑，慢慢就悟出来了。”

实习生眼神里的光，就是这么暗下去的。

那天晚上，小北找我喝酒。三杯下肚，这个平时挺机灵的小伙子突然问我：“贺老师，咱们这行是不是都在装神弄鬼？那个传说中的‘测试思维’，是不是根本就不存在？”

当一种能力只能靠“悟”来传承时，它离失传也就不远了。

这话听得我心里一咯噔。

说实话，我也被这个问题卡住过好几次。

记得二十多年前我刚入行那会儿，我的导师也是这么拍着我肩膀说的：“小贺啊，这测试思维嘛，就在代码里，就在 Bug 里，你得自己去感受。”

那时候我觉得特高深，觉得自己笨，不够格。

可现在回头想想，如果连我们这些“老法师”都说不清这东西到底是啥，怎么教给新人？难道真像某些人说的，这就该是个只可意会不可言传的玄学？

那个说“悟”字的下午

咱们把时间轴拉回到小北困惑的那个下午。

他其实很努力。为了准备那次分享，他翻了市面上几乎所有讲测试思维的书，从经典的《软件测试艺术》到各种大厂的内部培训文档。

结果呢？

他给我看他的笔记，上面密密麻麻记满了比喻：“要有破坏性思维”、“要像用户一样思考”、“要像黑客一样攻击”。

听起来都特对，真要用起来，全是大雾。

小北跟我说：“贺老师，我发现我能一眼看出这个接口设计有风险，那个流程走不通。但我没法告诉实习生，我是怎么看出来的。我只能给他看我以前的案例，告诉他‘上次这儿出了问题，所以这次要注意’。但这能叫方法论吗？这叫经验主义吧？”

大多数人以为专家是靠某种神秘的直觉在工作，但真相是，他们只是把无数次试错后的隐性判断，内化成了本能。

问题就在于，这个“内化”的过程，没法复制。

你看现在的行业现状，多有意思。

Katalon 在《State of Software Quality Report 2025》里给了个数据：82% 的 QA 从业者认为 AI 在未来 3-5 年内将变得无比重要。大家都在喊狼来了。

可 JetBrains 同年的报告却显示，73% 的受访者在 CI/CD 工作流里完全不用 AI。

为啥？

因为大家都在等一个“标准答案”，等一个能像说明书一样告诉他“第一步做什么、第二步做什么”的指南。

可“测试思维”这事儿，偏偏给不出说明书。

于是，行业里就出现了一种奇怪的现象：越是资深的人，越喜欢把简单的事情说玄乎；越是新人，越觉得这行水深不可测，得靠天赋。

这难道不是知识管理的巨大失败吗？

当“确定性”崩塌的时候

小北的困惑，其实还有一个更深层的背景，就是他最近正在研究的 GenAI 测试。

这事儿挺讽刺的。

传统测试里，我们最恨什么？恨“不确定性”。

输入 A，必须输出 B。如果今天输 B，明天输 C，那就是 Bug，就是事故，就是要半夜起来修的火警。

但在大语言模型时代，规则变了。

ISTQB CT-GenAI 大纲里有个概念特别扎心，叫“非确定性行为”。

哪怕是同一个 Prompt（输入），因为温度参数（Temperature）的设置，因为概率采样的机制，大模型的输出就是会不一样。

你想想，这对小北这种习惯了“非黑即白”的测试工程师来说，简直是世界观崩塌。

“贺老师，如果输入相同，输出不同，我该怎么定义‘正确’？”小北那天晚上问我，眼神里全是迷茫，“我还能用以前的思维去测它吗？”

在暴雨中修屋顶，你没法要求每一块瓦都严丝合缝，你只能追求在风暴中不漏雨。

这就是测试思维需要进化的地方。

以前我们说测试思维，是找茬，是证伪，是追求 100% 的确定性。

现在呢？

现在的测试思维，是管理概率，是定义置信区间，是在“可能正确”和“可以接受”之间做权衡。

你不能指望 AI 每次都答对，你只能期望它在 95% 的情况下表现符合预期。

这个转变，比学任何自动化工具都难。

因为它要求的不是技术，而是认知层面的重构。

而最要命的是，这种重构，没人教。

学校不教，培训班不教，连我们这些老家伙，也大多是在项目里摔跟头摔出来的。

别让你的测试经验成为黑盒

去年有个行业峰会，场面特别热闹。

台上有个演讲者，语出惊人：“五年内，80% 的手工测试岗位将被 AI 替代。”

台下瞬间就炸了。有人鼓掌，有人骂娘，更多人是一脸茫然。

我当时没忍住，上台怼了几句。

我说："AI 确实能替代‘测试执行’。你让它跑一万个用例，它眨都不眨。但你让它判断‘这个功能在春节大促高并发下会不会崩’、‘这个数据迁移脚本会不会把用户的存款搞错’、‘这个界面对老年人友不友好’，它行吗？”

它不行。

因为这些判断背后，是业务理解，是风险意识，是对人性的洞察。

测试的价值不在于你执行了多少用例，而在于你发现了多少有价值的信息。

可问题是，如果我们连什么是“测试思维”都定义不清楚，怎么把这些价值传递下去？

如果小北只能告诉测试实习生“你要有风险意识”，却说不清风险意识具体包含哪几个维度的检查清单，那这种能力永远只是他一个人的“黑盒”。

一旦他离职了，或者 AI 真的能通过某种方式模拟这种“黑盒”了，他的价值还剩多少？

这才是最让我后背发凉的地方。

我们一直在讨论 AI 会不会替代测试工程师。

其实，真正会被替代的，是那些无法将自己的隐性判断显性化的人。

不管测试思维是不是个伪命题，不管它是不是皇帝的新衣，有一点是确定的：

谁能把自己脑子里那些“只可意会”的判断，拆解成可执行的步骤、可量化的指标、可协作的协议，谁就能在 AI 时代活下来。

不是 AI 替代人，而是“会用 AI 放大自己判断力的人”，替代“只会闷头干活的人”。

我们还需要“悟”吗？

酒喝到最后，小北问我：“贺老师，那你觉得，我们以后还要不要教新人去‘悟’？”

我愣了一下。

说实话，我也没完全想清楚。

有些东西，可能真的需要一点“悟性”。就像骑自行车，你平衡感那一下，确实得自己去找。

但是，我们不能把“需要练习”等同于“无法教学”。

如果测试行业继续用“悟”这个字来掩盖我们在测试方法论提炼上的懒惰，那才是真正的危机。

Capgemini 的《World Quality Report》里提到过，未来的测试重心会从“验证功能正确性”转向“验证系统可信性”。

这词儿听着挺大，说白了就是：别光盯着功能好不好使，多看看这系统公不公平、透不透明、安不安全。

这种高阶的测试思维，更需要被拆解。

比如，怎么定义“公平”？是不是要检查训练数据的分布？是不是要测试极端场景下的偏见？

这些都不是靠“悟”能悟出来的，得靠科学的方法论，靠严谨的软件工程实践。

小北走的时候，跟我说他想通了一件事。

他说：“贺老师，我不纠结‘测试思维’存不存在了。从明天开始，我要试着把我做判断的过程录下来，每一步为什么这么想，为什么觉得这里有风险，全记下来。就算最后发现这就是一堆废话，至少我知道我废在哪儿了。”

听到这话，我挺欣慰的。

最大的技能不是给别人找 Bug，而是给自己的思维找 Bug。

也许，测试思维的真相，从来不是一个高深莫测的概念。

它就藏在我们每一次对“理所当然”的质疑里，藏在每一次试图把模糊的感觉变成清晰逻辑的尝试中。

至于它是不是皇帝的新衣？

重要吗？

只要你敢把衣服脱下来，把里面的逻辑亮出来给大家看，是不是新衣，大家一眼便知。

哪怕最后发现，咱俩都是光屁股的，那又何妨？

至少，我们知道冷在哪儿了，不是吗？

“如果你对如何将测试思维显性化有独特见解，或者正面临同样的困境，欢迎在评论区分享你的故事。”

领测老贺

30年软件测试老兵 | ISTQB CT-GenAI测试本地化工作组组长|专注AI时代的软件测试方法论与实践

AI测试、自动化测试、质量保障

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可

AI时代，“只可意会”的测试思维是皇帝的新衣吗？

那个说“悟”字的下午

当“确定性”崩塌的时候

别让你的测试经验成为黑盒

我们还需要“悟”吗？

文章评论