📖导读 软件测试人员的核心价值已从“执行效率”转向“决策质量”。传统的量化指标(如测试用例数、覆盖率)已经无法体现测试人员在风险预判、复杂决策中的关键作用,甚至可能让团队陷入“用数据证明存在”的误区。在AI时代,测试人员真正的护城河是记录并复盘自己的“决策日志”,将模糊的直觉和经验转化为可追溯、可进化的逻辑链条,从而在AI擅长执行的低维任务之上,构建起不可替代的高维决策优势。   测试思维的价值锚点已从执行效率转向决策质量 一根针,扎破了十年的信仰 会议室里空调开得很足,老周却觉得后背发汗。投影仪的光打在…

2026年5月12日 0条评论 22点热度 0人点赞 领测老贺 阅读全文

导读 曾被奉为测试工程师核心竞争力、被视为神秘“直觉”或“天赋”的“测试思维”,实际上是一个从未被清晰定义的空洞概念。当AI技术能够以毫秒级速度穷举传统测试依赖的“边界值直觉”时,这一模糊概念的脆弱性暴露无遗。测试工程师的“护城河”瞬间瓦解,引发了前所未有的身份认同危机。 领测老贺指出,问题的核心并非AI是否具有“思维”,而是因为“测试思维”被过度神秘化,成为掩盖组织能力建设不足(如缺失质量标准、可复用资产、知识库)的借口。真正的挑战来自AI系统本身的“非确定性”行为,它彻底颠覆了基于确定性输入-输出模型的传统测试…

2026年5月8日 0条评论 67点热度 0人点赞 领测老贺 阅读全文

文末附PPT下载地址: 在当今软件开发的快速迭代和高度竞争的环境中,敏捷方法已成为推动项目高效交付的关键力量。而随着敏捷实践的深入,如何在大规模团队和复杂项目中保持高效的测试质量,成为了许多组织面临的重大挑战。为应对这一需求,ISTQB® Agile Test Leadership at Scale(以下简称ISTQB®ATLaS)大规模敏捷测试领导力认证应运而生,专为那些在大规模敏捷环境中担任领导职务的测试专业人士设计。这一认证不仅帮助测试领导者提升敏捷测试管理的战略视野,还能够优化团队协作、提升测试效率,为组织…

2026年5月5日 0条评论 111点热度 0人点赞 领测老贺 阅读全文

📖 导读 当前软件测试行业盛行的“测试思维不可替代”论调,本质上是行业无法向管理层证明自身商业价值而催生的一种集体防御性叙事。领测老贺认为,这是一种危险的认知陷阱,会麻痹软件测试从业者,使其回避真正的职业转型。 领测老贺用“AI测试系统”的假设场景,刺破“测试思维”的神话光环,点明其无法被度量的致命缺陷。接着,通过揭示测试工程师、测试经理、测试培训机构、AI测试工具供应商等各方在“测试思维神化”叙事中的利益关系,构建了一个“集体幻觉”的图景。 随后,回溯历史,类比纺织工、银行柜员被技术替代的过程,指出所有被替代的职…

2026年5月4日 0条评论 87点热度 0人点赞 领测老贺 阅读全文

📖 本文导读 AI质量保障不应局限于传统的"测试左移"(Shift-Left),而必须向外扩展(Shift-Out),构建覆盖全生命周期的"认知缓冲区"。AI系统的输出天然是不确定的,用传统"找Bug"的思维去测试AI,就像用尺子量海水——工具和对象根本不匹配。所以:AI质量保障的核心不是发现缺陷,而是持续构建信任。具体分三步走——用黄金验证集锚定基础正确性,用评分卡对齐团队认知,用信任衰减曲线监控演化风险。三道防线逐层递进,从"点"的校验到"面"的共识再到"线"的持续追踪,最终形成人机之间的认知缓冲区。 一年前,…

2026年4月29日 0条评论 115点热度 0人点赞 领测老贺 阅读全文

导读 测试工程师将自身测试经验和技能封装成企业推行的 Skill(技能资产),看似能通过版税、积分等激励获取短期收益,实则陷入企业精心设计的 “慢性裁员” 陷阱:Skill 的高复用性会让 AI 逐步替代人工测试,企业将 Skill 包装为 “知识资产化”,本质是把测试工程师的工作量化为可削减的成本;Skill 激励背后藏着版税衰减、无成本维护、虚假转型通道三大谎言,工程师失去规则制定、风险决策等核心话语权后,最终会因自己贡献的 Skill 成为企业优化名单上的目标。唯有掌握业务因果链解读权、风险决策否决权、人机协…

2026年4月22日 0条评论 304点热度 0人点赞 领测老贺 阅读全文

AI Agent测试失败越频繁,你的团队越危险 导读 我认识一个测试工程师,姑且叫他老周吧,在一家中型互联网公司干了八年,简历写出来很漂亮——主导过多次架构重构的测试工作,带过团队,经历过项目从零到一。 去年他们公司上了AI测试平台,号称能让测试效率提升十倍。老周一开始很兴奋,觉得终于可以从繁琐的手工用例里解脱出来了。 半年后我问他效果怎么样,他说很好,效率确实高了。 我又问他:那你现在主要做什么? 他愣了一下,说:审核AI生成的测试用例,看看对不对,然后执行。 我再问他:那些用例,你觉得不对的情况多吗? 他又愣了…

2026年4月17日 0条评论 1115点热度 0人点赞 领测老贺 阅读全文

让智能体具备实用价值的能力,同时也让它们难以评估。适用于多场景部署的评估策略,需结合多种技术,以匹配所测系统的复杂程度。 原文:Demystifying evals for AI agents \ Anthropic 翻译:领测老贺机翻 文章摘要 本文由 Anthropic 工程团队发布,系统拆解了 AI Agent(智能体)评估的核心难点与实践方法。文章解释了为何评估对智能体研发至关重要,介绍了代码型、模型型、人工三类评分器,以及针对编码、对话、研究、计算机操作等不同智能体的评估方案。同时给出了从零搭建评估体系的…

2026年4月14日 0条评论 362点热度 0人点赞 领测老贺 阅读全文