导读: 核心观点:体验指标(满意度、任务完成度等),正在成为AI测试中最危险的“系统性毒药”。它并非无用,但行业正在用一个极其危险的姿势使用它。 逻辑脉络: 第一层:体验指标为什么会让人上瘾? 因为它太舒服了。在AI这个概率黑盒面前,传统断言测试失效,转向用户感觉似乎是一种“顺势而为”。但这种“舒服”是有代价的——体验指标只看结果、不看路径。用户点“满意”的背后,模型可能正在用3倍的算力、充满幻觉的推理链路去“作弊”达成目标。 第二层:这种依赖正在导致什么后果? GitLab全球宕机8小时的案例说明:体验指标天然回…

2026年6月29日 0条评论 78点热度 0人点赞 领测老贺 阅读全文

导读 在人工智能高速渗透软件开发与测试的今天,当AI自动化测试工具宣称达到99.8%的代码覆盖率时,一个更深层次的危机正在悄然发生:测试人员的直觉——“bug嗅觉”——正在消失。老贺通过测试工程师张磊的亲身经历,揭示了一个被行业忽视的真相:AI工具在接管重复性测试、提升效率的同时,也在无形中“驯化”了人类专家,导致他们从“主动怀疑”的探索者退化为“被动接收报告”的审查员。 老贺并非否定AI的价值,而是警示一种危险的“能力让渡”。当AI生成的测试用例专注于覆盖所有“已知路径”时,那些潜藏在业务逻辑边缘、时序竞态、数据…

2026年6月29日 0条评论 76点热度 0人点赞 领测老贺 阅读全文

📌 导读 在AI代码生成日益普及的今天,“测试全通过”已不再是代码质量的唯一标准。代码的“认知可维护性”——即是否易于被人类工程师理解、修改和演进——正成为比测试通过率更重要的护城河。 你的代码测试全部通过,但你盯着屏幕,手心全是汗——因为你根本读不懂自己写了什么。这不是你一个人的困境。当AI生成的「完美代码」成为常态,软件工程正遭遇一场前所未有的认知危机。本文揭示一个令人不安的真相:统计模型生成的代码,通过测试,却可能背叛逻辑。 凌晨两点,办公室里只剩陈默一个人。空调停了,空气闷得发黏,只有机箱风扇沉闷的嗡嗡声。…

2026年6月13日 0条评论 150点热度 0人点赞 领测老贺 阅读全文

让智能体具备实用价值的能力,同时也让它们难以评估。适用于多场景部署的评估策略,需结合多种技术,以匹配所测系统的复杂程度。 原文:Demystifying evals for AI agents \ Anthropic 翻译:领测老贺机翻 文章摘要 本文由 Anthropic 工程团队发布,系统拆解了 AI Agent(智能体)评估的核心难点与实践方法。文章解释了为何评估对智能体研发至关重要,介绍了代码型、模型型、人工三类评分器,以及针对编码、对话、研究、计算机操作等不同智能体的评估方案。同时给出了从零搭建评估体系的…

2026年4月14日 0条评论 684点热度 0人点赞 领测老贺 阅读全文

原文链接:Humans and Agents in Software Engineering Loops 是martinfowler近期提出的一个清晰的框架,将 AI 时代的软件开发分为三种模式:人在回路外、人在回路内、人在回路上。 作者认为最理想的位置是第三种:开发者的核心工作从编写代码转变为构建和维护 Agent 运行所依赖的"harness",即规格、质量检查和工作流指引的集合。 文章还进一步描述了"agentic flywheel"的演化路径,让 Agent 不仅执行任务,还能持续改进驱动自身的 harne…

2026年3月21日 0条评论 596点热度 0人点赞 领测老贺 阅读全文

核心概览:本文聚焦2026年前软件工程领域的5个关键议题,每个议题均呈现两种对立发展场景,剖析AI普及、市场环境变化对行业的深层影响。内容涵盖初级开发者职业困境、从业者技能演变、开发者角色重塑、专家与通才的路径抉择及教育模式变革,最终给出不同群体的应对策略,核心主线为“以变化为常量,通过技能更新与能力多元化立足行业”。 软件行业正处于特殊的转折期。AI编程已从“超级自动补全工具”进化为可自主执行开发任务的智能体;曾经驱动行业大规模招聘的经济繁荣,如今已让位于效率至上的导向——企业更看重盈利能力而非增长速度,更青睐有…

2026年1月15日 0条评论 2372点热度 0人点赞 领测老贺 阅读全文

随着AI大模型技术的成熟,软件工程领域正经历从流程到工具、从角色到方法论的全方位变革。领测老贺整合“AI重塑软件工程”系列公众号文章核心内容,沿着“需求工程变革→逆向建模突破→实践工具落地→方法论优化”的逻辑脉络,系统拆解AI驱动软件工程的关键环节,分析其对传统体系的冲击,并展望未来发展方向。 一、AI驱动的软件工程核心变革环节 (一)需求工程与开发流程的重构:结构化规范先行 传统软件工程遵循“需求→设计→开发→测试→部署”的线性或迭代流程,而AI技术的介入首先推动了需求工程的结构化转型,并重塑了全流程的协作模式。…

2025年12月28日 0条评论 2924点热度 0人点赞 领测老贺 阅读全文

在公众号《人月聊IT》看到《AI重塑软件工程》系列文章,感觉不错,所以在此集合一下这些文章的链接,方便日后查看。 AI重塑软件工程01-需求工程和软件开发过程的大阶段拆 AI重塑软件工程02-从DeepWiki源代码知识库到逆向建模工程 AI重塑软件工程03-基于ClaudeCode开发完整商业应用软件项目实践指南 AI重塑软件工程04-Spec Coding-基于Kiro AI IDE的周报系统开发01 AI重塑软件工程04-Spec Coding-基于Kiro AI IDE的周报系统开发02 AI重塑软件工程0…

2025年12月28日 0条评论 865点热度 0人点赞 领测老贺 阅读全文