另一个关于持续集成和版本分支的故事

发表于:2013-12-18来源:酷勤网作者:不详点击数: 标签:持续集成
另一个关于持续集成和版本分支的故事.经典书籍《持续交付》[1]的作者曾就分支合并和代码演化等问题详细地讨论过滥用分支对持续集成的负面影响。而我今天要说的是这样一个故事,一个只能申请到非常有限的硬件设备的团队,他们是如何在多分支策略下实践持续集成的。

  经典书籍《持续交付》[1]的作者曾就分支合并和代码演化等问题详细地讨论过滥用分支对持续集成的负面影响。而我今天要说的是这样一个故事,一个只能申请到非常有限的硬件设备的团队,他们是如何在多分支策略下实践持续集成的。

  一个团队接手了一个项目,需要在开发新特性的同时维护几个发布分支。团队计划实践持续集成,但手头的硬件资源严重不足,无法满足所有分支的部署流水线同时运转。

  流水线分为三个阶段,分别是:

  commit编译、单元测试和部分集成测试并打包

  at部署应用程序并运行自动化验收测试

  uat部署应用程序并由测试工程师执行手工验收测试

  这里我们略去了性能测试阶段和发布阶段,它们一般需要额外安排硬件设备,与这个故事关系不大。流水线的每一个阶段都可能依赖于某些外部服务,比如Web容器、数据库等。为防止不必要的干扰,每个阶段通常会尽可能地使用专用的外部服务,测试工程师在uat阶段做手工测试时可不喜欢Web容器由于at阶段被触发而被重启。

  长生命周期的分支同主干一样也需要部署流水线,也就需要更多的外部服务。如果主干的at阶段依赖于数据库,那么某个发布分支的at阶段也同样需要依赖于数据库。而通常你得为它们准备不同的数据库实例以防互相干扰。外部服务的安装和运行是需要硬件资源的,在资源拮据时,分支无疑加剧了这个问题。由于一些特殊情况,在好几个项目中我们只申请到了一台破旧的PC server作为团队的测试设备。但我们并不打算因此放弃持续集成,所以让我们看看能不能在螺蛳壳里做道场吧。

  相对其他外部服务,数据库是一个吃硬件资源的大户。这个项目的生产环境将使用Oracle数据库,如果流水线的每个阶段都是用独立的Oracle实例,那么一个主干和两个发布分支就需要9个Oracle实例。

  在流水线的某些阶段,可以使用一些替代方案,比如commit阶段,可以把持久化测试运行在embedded的hsqldb上,这样可以去除此阶段对数据库实例的需求,而且这样commit阶段的构建时间应该会有所减少[2]。

  后续at和uat的功能验收测试最好运行在与生产环境相同类型的数据库上。我们曾考虑过采用增量式的数据库开发策略[3],那么不同阶段、不同分支的数据库模式(schema)应该是兼容的,这样就只需要一个数据库实例。不过这个技术门槛比较高,而且不同分支的流水线的测试可能由于清理和准备测试数据而互相干扰。于是我们决定利用数据库用户[4]来隔离不同的环境,比如主干的at环境使用用户at_trunk,而分支的at环境使用at_branch_0816。

  这对应用程序的代码和架构有更高的要求,由于数据库用户名变为环境相关配置了,就必须去除硬编码,例如在SQL语句中不能有明确的用户名

  select * from billing.t_order where .....

  改为

  select * from t_order where .....

  其实这种限制也有其好处,减少了团队不经意地使用数据库集成[5](比如直接操作另一个用户中的数据)的机会,从而更谨慎地设计系统边界和集成方案。不过,若要改造使用数据库集成的遗留系统,还得曲线救国,先把其置入部署流水线的反馈循环再做改动,这时对于跨数据库用户操作可以采用数据库同名来处理,比如Oracle支持将另外一个用户的数据库对象映射到本用户的一个同名对象:

  -- Create the synonym

  create or replace synonym t_billing_order for billing.t_order;

  记得将这个脚本参数化,可以使用Ant和占位符替换,在执行脚本前,替换相应环境的用户名。

  Web中间件是另一个大头,不过这里目前团队也没发现有什么特别的办法。可以考虑在部署脚本中使用参数化的contextPath,这样在同一个 Tomcat或是Weblogic中可以部署多个环境的应用程序,但是这样一来加大了配置难度,二来节约的资源有限,所以基本上还是通过一个环境一个 Tomcat或是一个Weblogic的一个Domain来实现的。

  如果应用程序还依赖消息组件,那么还应该准备流水线各阶段专用的消息中间件。不像数据库,共享消息中间件而引发的问题比较隐蔽。有一次,我们正在为一个应用程序做发布前的回归测试,此前都没有发现问题,正当我们认为高枕无忧时,这个环节的测试却由于应用程序无法收到消息而失败。当时距离发布截止期的时间紧迫,我们被迫暂时放弃了异步消息的方案,改用同步处理。后来,我们发现问题的原因在于多个Consumer监听同一个消息队列,而一个意料之外的 Consumer“抢走”了我们的消息。

  如你所见,我们只有一台server模式的ActiveMQ,而手工测试环境和试生产环境都监听其中同一个消息队列,手工测试环境的应用程序消费了试生产环境的应用程序发出的消息。于是我们另外搭建了一台server模式的ActiveMQ,让它们分别监听,问题就解决了。这件事让我意识到,作为一个有状态的组件,消息中间件也是环境敏感的。当然,一个好消息是消息中间件需要的硬件资源一般没有数据库那么多(多安装一个ActiveMQ和多安装一个 Oracle实例相比),所以最简单的做法就是再装一个。但如果你的环境比较多(从而导致ActiveMQ比较多)时,也是很头疼的。一是由于消息是需要持久化的,所以每个ActiveMQ是需要一些自定义的配置的。如果你使用数据库作为消息存储,还得让不同的ActiveMQ依赖于不同的数据库实例,或至少是不同的用户,如果是文件存储,那么需要指定不同的目录,总之需要细心的配置。二是团队成员有可能被这些broker地址搞的晕头转向。有一段时间,我经常听到这样的对话:

原文转自:http://www.kuqin.com/shuoit/20131215/336973.html