大规模项目团队持续集成历程

Elsa ·

更新时间:2024-11-13

· 753 次阅读

　　这篇文章是我在两年前写的，记录了一个150+人的软件团队(多时近200人)如何在一个庞大的遗留系统上，通过逐步建立一个持续交付部署流水线，从而达到频繁发布的状态。终在该团队的持续交付基础设施中，共有260台服务器用于构建、测试和部署(几乎全部是虚拟机)。而这个产品也可以每六周发布一次。

　　在大规模项目团队中可能遇到的问题

　　对于小规模、短周期的项目来说，团队与持续集成会相处地非常融洽。而对于大规模、长周期项目的初期来说，也不会有太多的问题。此时常见的也是基本的持续集成模式是：Build->test->package。然而，只要时间稍长一点儿，持续集成会发出坏味道了。此时的症状包括：

　　1. 作为开发人员

　　要等很长时间才能知道是否可以提交代码了。如果你遵守“频繁提交”的原则，那么百人团队不间断的提交，会使集成服务器一直处于繁忙状态，而你不得不等待他人的build过了以后，才能看到自己提交的结果。

　　要等很长时间才能知道我的提交是否通过了;

　　如果build失败了，要花很长时间才能知道是否和自己的修改相关;

　　既使提交了fix，也不知道自己的提交是否真的修复了这次构建;

　　构建经常处于失败状态。

　　2. 作为测试人员

　　测试人员不知道到哪里拿哪一次的构建产物来进行测试;

　　发布经理不知道当前各种各样的测试部署环境中，到底部署了哪个版本，包括哪些新功能或修改的bug;

　　不确定在同一个构建里，所有组件的版本是否都是正确的;

　　3. 作为项目经理

　　不确定各个测试部署环境中的配置是否都与其上运行的构建相一致;

　　不确定测试人员测试的是否在正确的运行环境上运行了正确的版本;

　　4. 其他方面的问题

　　所有的安装部署都需要手工操作。

　　以上这些问题会给你的发布管理带来无限的问题和风险。那么，是否因为这种“持续闹心”放弃持续集成呢?回答当然是否定的。Do it more if it hurts you. 不要因问题的暴露而放弃，相反，应该欢呼。因为这反映了发布过程中的问题与风险，是时候解决它们了。

　　如何解决大规模项目中的持续交付问题

　　由于大项目本身的复杂性，其解决方案也不能一概而论。下面以某大型项目为例，介绍其中的几个解决方法。

　　1、项目基本信息描述

　　该项目初试图建立一个好的持续集成环境和基础。由于是一个遗留系统，费了很大劲儿，才能够得到可工作的软件。然而，由于队伍不断壮大，而且环境也在不断变化，持续集成很快无法达不到其预期目标了。怎么办呢?

　　项目背景:

　　项目是一个具有可配置性的Web 门户产品，面向不同行业的市场，可自己定制门户。该项目有一个遗留的代码库，而且可以肯定的说，在今后的一年半之内是无法摆脱这个遗留代码库的。而且，很多紧耦合的、不必要的臃肿代码，同时根本不存在有价值的测试代码。现在我们在逐步地重写代码，但还是不能删除它们，因为某些网站还要依赖于旧代码。事实上，这是一个.NET平台上基于SOA的网站。

　　开发团队情况：

　　团队是一个敏捷分布开发团队(三地协作，均有开发人员，且有时差)。整个团队有150多人，分成十几个团队，每个团队都有一个完成的结构(BA/DEV/QA)，其中有一个是项目持续集成团队(项目之初，大约有五六个人，工作负荷很大，项目运行一段时间后只要两个人足够了)。使用SVN做版本管理工具，在Windows2003上使用NAT， MSbuild和batch脚本进行构建管理，初使用CC.NET做为持续集成服务器，后来使用Cruise(Go)。

　　初始的持续集成环境：

　　上面所述的持续集成问题在项目一开始出现了，因为该项目有一个庞大的遗留代码库，而且使用的基本持续集成方式(build->test->package)而且测试人员手工部署进行各类测试。

　　其初始的持续集成环境如下所示：