测试思维的真正含义是什么?当一种测试能力只能靠“悟”来传承时,它离失传也就不远了。“测试思维”并非神秘玄学或不可言传的“悟”,而是可以、也必须被结构化管理、显性化拆解和有效传承的能力。在AI时代,固守“只可意会”的经验主义是一种知识管理的失败,真正有竞争力的测试工程师是那些能将隐性判断转化为可执行步骤、可量化指标的人。
小北把笔记本电脑合上的时候,手有点抖。
那是去年冬天的一个下午,北京写字楼的暖气烧得人脸发烫。小北是三年前参加过我测试培训课程的学员,刚升了中级测试工程师,正面临他职业生涯的第一次“大考”——给新来的实习生讲清楚,什么叫“好的测试用例”。
他在会议室坐了一下午,憋红了脸,最后只憋出一句:“你们多跟着项目跑跑,慢慢就悟出来了。”
实习生眼神里的光,就是这么暗下去的。
那天晚上,小北找我喝酒。三杯下肚,这个平时挺机灵的小伙子突然问我:“贺老师,咱们这行是不是都在装神弄鬼?那个传说中的‘测试思维’,是不是根本就不存在?”
当一种能力只能靠“悟”来传承时,它离失传也就不远了。
这话听得我心里一咯噔。
说实话,我也被这个问题卡住过好几次。
记得二十多年前我刚入行那会儿,我的导师也是这么拍着我肩膀说的:“小贺啊,这测试思维嘛,就在代码里,就在 Bug 里,你得自己去感受。”
那时候我觉得特高深,觉得自己笨,不够格。
可现在回头想想,如果连我们这些“老法师”都说不清这东西到底是啥,怎么教给新人?难道真像某些人说的,这就该是个只可意会不可言传的玄学?
那个说“悟”字的下午
咱们把时间轴拉回到小北困惑的那个下午。
他其实很努力。为了准备那次分享,他翻了市面上几乎所有讲测试思维的书,从经典的《软件测试艺术》到各种大厂的内部培训文档。
结果呢?
他给我看他的笔记,上面密密麻麻记满了比喻:“要有破坏性思维”、“要像用户一样思考”、“要像黑客一样攻击”。
听起来都特对,真要用起来,全是大雾。
小北跟我说:“贺老师,我发现我能一眼看出这个接口设计有风险,那个流程走不通。但我没法告诉实习生,我是怎么看出来的。我只能给他看我以前的案例,告诉他‘上次这儿出了问题,所以这次要注意’。但这能叫方法论吗?这叫经验主义吧?”
大多数人以为专家是靠某种神秘的直觉在工作,但真相是,他们只是把无数次试错后的隐性判断,内化成了本能。
问题就在于,这个“内化”的过程,没法复制。
你看现在的行业现状,多有意思。
Katalon 在《State of Software Quality Report 2025》里给了个数据:82% 的 QA 从业者认为 AI 在未来 3-5 年内将变得无比重要。大家都在喊狼来了。
可 JetBrains 同年的报告却显示,73% 的受访者在 CI/CD 工作流里完全不用 AI。
为啥?
因为大家都在等一个“标准答案”,等一个能像说明书一样告诉他“第一步做什么、第二步做什么”的指南。
可“测试思维”这事儿,偏偏给不出说明书。
于是,行业里就出现了一种奇怪的现象:越是资深的人,越喜欢把简单的事情说玄乎;越是新人,越觉得这行水深不可测,得靠天赋。
这难道不是知识管理的巨大失败吗?
当“确定性”崩塌的时候
小北的困惑,其实还有一个更深层的背景,就是他最近正在研究的 GenAI 测试。
这事儿挺讽刺的。
传统测试里,我们最恨什么?恨“不确定性”。
输入 A,必须输出 B。如果今天输 B,明天输 C,那就是 Bug,就是事故,就是要半夜起来修的火警。
但在大语言模型时代,规则变了。
ISTQB CT-GenAI 大纲里有个概念特别扎心,叫“非确定性行为”。
哪怕是同一个 Prompt(输入),因为温度参数(Temperature)的设置,因为概率采样的机制,大模型的输出就是会不一样。
你想想,这对小北这种习惯了“非黑即白”的测试工程师来说,简直是世界观崩塌。
“贺老师,如果输入相同,输出不同,我该怎么定义‘正确’?”小北那天晚上问我,眼神里全是迷茫,“我还能用以前的思维去测它吗?”
在暴雨中修屋顶,你没法要求每一块瓦都严丝合缝,你只能追求在风暴中不漏雨。
这就是测试思维需要进化的地方。
以前我们说测试思维,是找茬,是证伪,是追求 100% 的确定性。
现在呢?
现在的测试思维,是管理概率,是定义置信区间,是在“可能正确”和“可以接受”之间做权衡。
你不能指望 AI 每次都答对,你只能期望它在 95% 的情况下表现符合预期。
这个转变,比学任何自动化工具都难。
因为它要求的不是技术,而是认知层面的重构。
而最要命的是,这种重构,没人教。
学校不教,培训班不教,连我们这些老家伙,也大多是在项目里摔跟头摔出来的。
别让你的测试经验成为黑盒
去年有个行业峰会,场面特别热闹。
台上有个演讲者,语出惊人:“五年内,80% 的手工测试岗位将被 AI 替代。”
台下瞬间就炸了。有人鼓掌,有人骂娘,更多人是一脸茫然。
我当时没忍住,上台怼了几句。
我说:"AI 确实能替代‘测试执行’。你让它跑一万个用例,它眨都不眨。但你让它判断‘这个功能在春节大促高并发下会不会崩’、‘这个数据迁移脚本会不会把用户的存款搞错’、‘这个界面对老年人友不友好’,它行吗?”
它不行。
因为这些判断背后,是业务理解,是风险意识,是对人性的洞察。
测试的价值不在于你执行了多少用例,而在于你发现了多少有价值的信息。
可问题是,如果我们连什么是“测试思维”都定义不清楚,怎么把这些价值传递下去?
如果小北只能告诉测试实习生“你要有风险意识”,却说不清风险意识具体包含哪几个维度的检查清单,那这种能力永远只是他一个人的“黑盒”。
一旦他离职了,或者 AI 真的能通过某种方式模拟这种“黑盒”了,他的价值还剩多少?
这才是最让我后背发凉的地方。
我们一直在讨论 AI 会不会替代测试工程师。
其实,真正会被替代的,是那些无法将自己的隐性判断显性化的人。
不管测试思维是不是个伪命题,不管它是不是皇帝的新衣,有一点是确定的:
谁能把自己脑子里那些“只可意会”的判断,拆解成可执行的步骤、可量化的指标、可协作的协议,谁就能在 AI 时代活下来。
不是 AI 替代人,而是“会用 AI 放大自己判断力的人”,替代“只会闷头干活的人”。
我们还需要“悟”吗?
酒喝到最后,小北问我:“贺老师,那你觉得,我们以后还要不要教新人去‘悟’?”
我愣了一下。
说实话,我也没完全想清楚。
有些东西,可能真的需要一点“悟性”。就像骑自行车,你平衡感那一下,确实得自己去找。
但是,我们不能把“需要练习”等同于“无法教学”。
如果测试行业继续用“悟”这个字来掩盖我们在测试方法论提炼上的懒惰,那才是真正的危机。
Capgemini 的《World Quality Report》里提到过,未来的测试重心会从“验证功能正确性”转向“验证系统可信性”。
这词儿听着挺大,说白了就是:别光盯着功能好不好使,多看看这系统公不公平、透不透明、安不安全。
这种高阶的测试思维,更需要被拆解。
比如,怎么定义“公平”?是不是要检查训练数据的分布?是不是要测试极端场景下的偏见?
这些都不是靠“悟”能悟出来的,得靠科学的方法论,靠严谨的软件工程实践。
小北走的时候,跟我说他想通了一件事。
他说:“贺老师,我不纠结‘测试思维’存不存在了。从明天开始,我要试着把我做判断的过程录下来,每一步为什么这么想,为什么觉得这里有风险,全记下来。就算最后发现这就是一堆废话,至少我知道我废在哪儿了。”
听到这话,我挺欣慰的。
最大的技能不是给别人找 Bug,而是给自己的思维找 Bug。
也许,测试思维的真相,从来不是一个高深莫测的概念。
它就藏在我们每一次对“理所当然”的质疑里,藏在每一次试图把模糊的感觉变成清晰逻辑的尝试中。
至于它是不是皇帝的新衣?
重要吗?
只要你敢把衣服脱下来,把里面的逻辑亮出来给大家看,是不是新衣,大家一眼便知。
哪怕最后发现,咱俩都是光屁股的,那又何妨?
至少,我们知道冷在哪儿了,不是吗?
“如果你对如何将测试思维显性化有独特见解,或者正面临同样的困境,欢迎在评论区分享你的故事。”
领测老贺
30年软件测试老兵 | ISTQB CT-GenAI测试本地化工作组组长|专注AI时代的软件测试方法论与实践
AI测试、自动化测试、质量保障


文章评论