导读 曾被奉为测试工程师核心竞争力、被视为神秘“直觉”或“天赋”的“测试思维”,实际上是一个从未被清晰定义的空洞概念。当AI技术能够以毫秒级速度穷举传统测试依赖的“边界值直觉”时,这一模糊概念的脆弱性暴露无遗。测试工程师的“护城河”瞬间瓦解,引发了前所未有的身份认同危机。 领测老贺指出,问题的核心并非AI是否具有“思维”,而是因为“测试思维”被过度神秘化,成为掩盖组织能力建设不足(如缺失质量标准、可复用资产、知识库)的借口。真正的挑战来自AI系统本身的“非确定性”行为,它彻底颠覆了基于确定性输入-输出模型的传统测试…

2026年5月8日 0条评论 175点热度 0人点赞 领测老贺 阅读全文

文末附PPT下载地址: 在当今软件开发的快速迭代和高度竞争的环境中,敏捷方法已成为推动项目高效交付的关键力量。而随着敏捷实践的深入,如何在大规模团队和复杂项目中保持高效的测试质量,成为了许多组织面临的重大挑战。为应对这一需求,ISTQB® Agile Test Leadership at Scale(以下简称ISTQB®ATLaS)大规模敏捷测试领导力认证应运而生,专为那些在大规模敏捷环境中担任领导职务的测试专业人士设计。这一认证不仅帮助测试领导者提升敏捷测试管理的战略视野,还能够优化团队协作、提升测试效率,为组织…

2026年5月5日 0条评论 324点热度 0人点赞 领测老贺 阅读全文

📖 导读 当前软件测试行业盛行的“测试思维不可替代”论调,本质上是行业无法向管理层证明自身商业价值而催生的一种集体防御性叙事。领测老贺认为,这是一种危险的认知陷阱,会麻痹软件测试从业者,使其回避真正的职业转型。 领测老贺用“AI测试系统”的假设场景,刺破“测试思维”的神话光环,点明其无法被度量的致命缺陷。接着,通过揭示测试工程师、测试经理、测试培训机构、AI测试工具供应商等各方在“测试思维神化”叙事中的利益关系,构建了一个“集体幻觉”的图景。 随后,回溯历史,类比纺织工、银行柜员被技术替代的过程,指出所有被替代的职…

2026年5月4日 0条评论 209点热度 0人点赞 领测老贺 阅读全文

📖 本文导读 AI质量保障不应局限于传统的"测试左移"(Shift-Left),而必须向外扩展(Shift-Out),构建覆盖全生命周期的"认知缓冲区"。AI系统的输出天然是不确定的,用传统"找Bug"的思维去测试AI,就像用尺子量海水——工具和对象根本不匹配。所以:AI质量保障的核心不是发现缺陷,而是持续构建信任。具体分三步走——用黄金验证集锚定基础正确性,用评分卡对齐团队认知,用信任衰减曲线监控演化风险。三道防线逐层递进,从"点"的校验到"面"的共识再到"线"的持续追踪,最终形成人机之间的认知缓冲区。 一年前,…

2026年4月29日 0条评论 236点热度 0人点赞 领测老贺 阅读全文

导读 测试工程师将自身测试经验和技能封装成企业推行的 Skill(技能资产),看似能通过版税、积分等激励获取短期收益,实则陷入企业精心设计的 “慢性裁员” 陷阱:Skill 的高复用性会让 AI 逐步替代人工测试,企业将 Skill 包装为 “知识资产化”,本质是把测试工程师的工作量化为可削减的成本;Skill 激励背后藏着版税衰减、无成本维护、虚假转型通道三大谎言,工程师失去规则制定、风险决策等核心话语权后,最终会因自己贡献的 Skill 成为企业优化名单上的目标。唯有掌握业务因果链解读权、风险决策否决权、人机协…

2026年4月22日 0条评论 442点热度 0人点赞 领测老贺 阅读全文

AI Agent测试失败越频繁,你的团队越危险 导读 我认识一个测试工程师,姑且叫他老周吧,在一家中型互联网公司干了八年,简历写出来很漂亮——主导过多次架构重构的测试工作,带过团队,经历过项目从零到一。 去年他们公司上了AI测试平台,号称能让测试效率提升十倍。老周一开始很兴奋,觉得终于可以从繁琐的手工用例里解脱出来了。 半年后我问他效果怎么样,他说很好,效率确实高了。 我又问他:那你现在主要做什么? 他愣了一下,说:审核AI生成的测试用例,看看对不对,然后执行。 我再问他:那些用例,你觉得不对的情况多吗? 他又愣了…

2026年4月17日 0条评论 1263点热度 0人点赞 领测老贺 阅读全文

让智能体具备实用价值的能力,同时也让它们难以评估。适用于多场景部署的评估策略,需结合多种技术,以匹配所测系统的复杂程度。 原文:Demystifying evals for AI agents \ Anthropic 翻译:领测老贺机翻 文章摘要 本文由 Anthropic 工程团队发布,系统拆解了 AI Agent(智能体)评估的核心难点与实践方法。文章解释了为何评估对智能体研发至关重要,介绍了代码型、模型型、人工三类评分器,以及针对编码、对话、研究、计算机操作等不同智能体的评估方案。同时给出了从零搭建评估体系的…

2026年4月14日 0条评论 519点热度 0人点赞 领测老贺 阅读全文

导读: 你的AI测试工具,可能正成为系统中最危险的“安全漏洞”。 每天生成数百个用例,产出绿得发亮的报告,你是否觉得高枕无忧?本文撕开了这层假象:当前盛行的AI测试,本质是“通过率”的合谋者,它擅长复制历史成功路径,却对真正的系统性风险视而不见。当AI只学习如何让测试“通过”,而非学习如何让系统“失败”时,每一次上线都像是在堆积木的顶端再添一块。 老贺将揭示了一个颠覆性的真相:那些将AI用作“红队指挥官”、主动设计极端破坏性测试的团队,才构建了无法被击穿的真实可靠性。如果您的AI测试报告连续三个月零失败,这绝不是庆…

2026年4月13日 0条评论 356点热度 0人点赞 领测老贺 阅读全文