浅谈自动化测试中的数据管理


1.听说自动化测试是活的文档

倡导测试驱动开发(TDD)的人常说,自动化测试不仅仅是测试,它们还是活的文档(Living Document)。这样的说法是激动人心的,让人颇有“超值”的感觉。

但在实践中,我在不少项目中看到的却是脆弱的、可读性糟糕的自动化测试。糟糕的自动化测试代码最多能实现测试的目标,但它不容易随着生产代码演进(想象一下修改刚才那个测试有多痛苦)更不可能成为活的文档。

并不是TDD倡导者在说谎,而是想要提升自动化测试的效能,需要遵循最佳实践。这些实践大致可以分类为:

  • 对测试友好的生产代码
  • 分层的测试策略
  • 良好的测试数据准备和管理

这是一个很大的话题,在本文中,我将主要讨论关于测试数据准备和管理的实践。

2 测试数据准备和管理是提升自动化测试效能的重要实践

我推荐的测试数据准备和管理实践:

  1. 使用Test Data Builder模式:隐藏测试数据准备的细节,在测试代码中只显示地对测试专有数据赋值,这有助于提升测试代码可读性,并有效降低测试数据准备代码变更时的副作用。
  2. 尽量为每个测试设计独立的测试数据:例如使用随机或自增长的ID,而不是固定值;这在需要数据库的测试中尤其有用,它可以显著降低由于测试数据冲突导致的假报警(False Alarm)
  3. 尽量使用生产代码来准备测试数据:尽量不要绕过生产代码,这在需要数据库的测试中特别有用,以免生产代码中的Schema变更后,还需要绞尽脑汁地修改测试数据准备脚本。

接下来,我们来谈谈这些实践是为了解决什么问题。

2.1 使用Test Data Builder模式

在编写自动化测试代码时,我发现并不是所有的数据都在当前测试中起到关键作用。在OrderTest案例中,虽然订单(Order)有很多属性,但在该测试中真正起到区别作用的是状态(status),但我却不得不花费大量时间来准备其他数据,这令人非常沮丧。

public class OrderTest {

    @Rule
    public ExpectedException thrown = ExpectedException.none();

    @Test
    public void it_should_reject_when_cancel_given_order_is_taken() {
        //given
        Order order = new Order(Order.Identity.next());

        // 它们和测试结果不产生影响,但却浪费了大量的精力
        order.with(Location.TAKE_AWAY);
        order.setAmount(100.0);

        Customer customer = new Customer();
        customer.setSurname("周");
        customer.setTitle(Customer.Title.MALE);
        customer.setMobile("1391XXXXXX63");
        order.setCustomer(customer);

        // 在实际项目中,setter会更多

        order.taken();

        //when
        order.canel();

        //then
        thrown.expect(IllegalStateException.class);
    }
}

当然,有一种取巧的方式,即跳过不需要的属性赋值,但这种方法在复杂项目中,随着生产代码变更,极易造成空指针异常(NullPointerException),所以只是一种治标不治本的方法。

在阅读了一些文章后,我发现在设计测试时,可以对测试数据进行分类:

1.应用引用数据(Application reference data):它们是测试无关数据,但它们是应用程序或测试启动所必需的,这些数据往往是指一些基础数据。大部分单元测试并不需要应用引用数据。

2.测试引用数据(Test reference data):指那些和测试相关,但是对测试行为没有多大影响的数据。例如OrderTest案例中,除了状态(status)的其他数据。

3.测试专用数据(Test specific data):真正影响测试行为的特征数据。例如OrderTest案例中的订单状态(status)

显然,我们应该在测试中尽可能降低准备测试引用数据的存在感,这时我找到了Nat Pryce提出的Test Data Builder模式。简而言之,Test Data Builder是为测试定制化的Builder,在Builder的基础上指定了测试数据默认值。

如果使用Test Data Builder来重构OrderTest,其可读性会显著提升:

import static com.github.hippoom.tdb.OrderTestDataBuilder.anOrder;

public class OrderTest {

    @Rule
    public ExpectedException thrown = ExpectedException.none();

    @Test
    public void it_should_reject_when_cancel_given_order_is_taken() {
        //given
        Order order = anOrder().taken().build();

        //when
        order.canel();

        //then
        thrown.expect(IllegalStateException.class);
    }
}

2.2 尽量为每个测试设计独立的测试数据

2.2.1 尽可能使用随机值作为默认测试数据

在依赖数据库的测试中,经常会遇到假警报(False Alarm),如果你排查了半天,却发现是由于测试数据冲突,而不是被测试组件造成的,一定会恼怒不已。为了缓解这个现象,最有效的方式是为每个测试设计专有的测试数据集。例如,在测试更新订单状态这个持久化操作时,我们希望被测试订单的生命周期只由该测试控制,从而避免测试数据冲突。利用Test Data Builder,我们可以将用随机生成的字符串来作为测试订单的默认ID,这样绝大多数测试都不会因为ID冲突而失败了。

public class OrderTestDataBuilder {

    private Order target = new Order(Order.Identity.next());

    public static OrderTestDataBuilder anOrder() {
        return new OrderTestDataBuilder()
            //随机的ID作为测试订单的默认ID,可以降低测试数据冲突概率
            //对于需要指定ID的场景,
            // 可以调用OrderTestDataBuilder.with(Identity.of(3))的方式来实现
            .with(nextId())
            .with(IN_STORE)
            .with(aCustomer())
            .withTotal(100.0);
    }

    public OrderTestDataBuilder with(Order.Identity value) {
        target.setId(value);
        return this;
    }

    private static Order.Identity nextId() {
        return Order.Identity.of(UUID.randomUUID().toString());
    }
}

进一步的,如果订单里面持有客户(Customer)的ID,我也建议进一步将CustomerTestDataBuilder的ID默认值也设置为随机值,这可以防止为了构造测试订单而衍生构造出的客户,不容易和其他涉及客户的测试产生冲突。

除了ID之外,还有不少属性也是可以使用随机值的,例如电话、住址等。你可以找到一些开源库来帮助你,比如binarywang同学的java-testdata-generator

2.2.2 集中记录测试中必须使用固定值

这是衍生自尽可能使用随机值作为默认测试数据的实践,因为肯定会遇到不方便使用随机值,而必须用固定值的测试。这时,推荐使用一份一页纸文档,将它们集中记录起来,以便在设计其他测试的数据时,作为参考。以下是一个例子

JdbcTest:
    Order, SCOPE
    //以ORDER_作为前缀进行ID登记,方便搜索
    ORDER_1, Insert测试
    ORDER_2, 更新测试

2.3 尽量使用生产代码来准备测试数据

让我们从一个例子开始:如果你想测试一个基于SQL的订单查询实现,那么就需要准备一批订单。一个显而易见的数据准备方法是,在测试执行前使用SQL脚本向数据库插入数据。最初我也使用这种方法,甚至尝试去扩展了DBUnit,见spring-test-dbunit-template。但我渐渐发现,这个方法在复杂项目中有个致命的缺陷:同一张表经常会被用在多个测试中,而为了遵循“尽量为每个测试设计独立的测试数据”,往往会有多份该表的测试数据文件。当该表随着功能演进而发生变更时,测试数据文件的修改工作量非常大。究其原因,其实还是由于测试数据准备过程使用了Hack的方式绕过了生产代码,自成一系。

因此,我推荐尽量使用生产代码来准备测试数据。回到例子里,假如我们要测试订单的持久化操作,建议用OrderTestDataBuilder和JdbcOrderRepository配合来准备数据:

public class JdbcOrderRepositoryTest {

    @Test
    public void it_should_handle_update() {
        //given
        OrderTestDataBuilder orderBuilder = anOrder();

        Order order = orderBuilder.build();

        jdbcOrderRepository.save(order);

        Order before = jdbcOrderRepository.findBy(order.getId());
      assertThat(after.getStatus(), is(PENDING)); //确保前置条件正确

        //when
        before.taken();

        jdbcOrderRepository.update(order);

        //then
        Order after = jdbcOrderRepository.findBy(order.getId());
        assertThat(after.getStatus(), is(TAKEN));
    }
}

当然,采用这种方式可能会造成测试准备数据篇幅较大,这里可以采用分层测试、自适应断言、Helper Method以及Test Data List Builder来缓解。前几个方法已经有很多文章介绍,Test Data List Builder我会在文章末尾进一步介绍。

3 测试数据准备和管理的支撑工具还不多

有了实践之后,自然想到的是用一些工具来提升效率,甚至将它们固化下来。但遗憾的是,这方面的工具还不多,以下是我的一些脑洞:

3.1 自动生成TestDataBuilder

实际上手工编写TestDataBuilder并不难,但我就是懒。如果能有一个lombok式的Annotation自动生成TestDataBuilder就好了。

3.2 Test Data List Builder

在准备批量数据时,逐个使用TestDataBuilder构造还是比较麻烦的。为此,我设计了一个Test Data List Builder,以更简洁的方式准备批量数据,以下这个例子中,使用GenericTestDataListBuilder.listOfSize可以一次性构造5个订单,并且指定每个订单的特征。

import static com.github.hippoom.tdb.GenericTestDataListBuilder.listOfSize;
import static com.github.hippoom.tdb.Location.IN_STORE
import static com.github.hippoom.tdb.Location.TAKE_AWAY

List<Order> orders = listOfSize(5, sequence -> new OrderBuilder())
   .theFirst(2, builder -> builder.is(TAKE_AWAY)) // (1)
   .number(3, builder -> builder.is(IN_STORE))    // (2)
   .theLast(2, builder -> builder.paid())         // (3)
   .build();

//(1) declaring the first two elements apply a Function<OrderBuilder, OrderBuilder> that customizes the element
//(2) declaring the third element in the list applies a Function<OrderBuilder, OrderBuilder>
//(3) declaring the last two elements apply a Function<OrderBuilder, OrderBuilder>

该项目已经开源,并可以在Maven Central上找到。

3.3 测试数据冲突自动提示

2.2.2 集中记录测试中必须使用固定值中手工记录固定值的方法要求团队有很高的自律性,而且手工更新确实很麻烦。如果有一个工具,可以帮助我们自动监测测试集中的数据,并提示存在冲突就好了

4.写在最后

以上多来自于我项目中的实践经验,个人视野限制,有诸多不足。希望借此机会,也听听诸位的见解。


Published on 07 February 2020.
Comments
Category: Ramblings


条件型业务规则的抽象与实现——从Spring Profile得到的灵感


最近,有幸参与了一个平台型的项目,该平台支持多种类型的产品预订,并且对于不同的产品类型,支持不同的预订规则。开发团队想尽可能地将主流程实现得更通用,以便在将来更快速地支持新的产品类型。因此,团队决定在主流程中,以产品类型作为条件,决定是否应用某个给定的预订规则。

例如其中有一个对于配送地址的验证规则,它只对特定产品类型(火车票)生效:

(经过简化的用户故事——火车票预订)

作为用户,当我预订火车票时,我应该被告知配送地址无法送达,以便我调整配送地址或选择上门取票

该平台还支持预订酒店,不过由于没有凭据需要配送,所以并不需要检查配送地址是否可达。于是有了以下实现:

public class AddressIsAvailableToDelivery implements PlaceOrderRule {

    @Override
    public void verify(PlaceOrderCommand command) { 
        if (command.getProduct().isTypeOf(RAILWAY)) {
            // check if the adress is available for delivery the ticket
        } else {
            // hotel, makes no sense of deliering tickets
        }
    }
}

预订主流程会依次执行所有的PlaceOrderRule,并由各个PlaceOrderRule的实现决定需要对哪些产品生效。

几个迭代过后有了新的产品需要支持:观光景点,需要配送门票给用户,所以一个类似的用户故事诞生了:

(经过简化的用户故事——门票预订)

作为用户,当我预订景点门票时,我应该被告知配送地址无法送达,以便我调整配送地址或选择上门取票

于是,团队修改了条件表达式,增加了对门票景点的判断:

public class AddressIsAvailableToDelivery implements PlaceOrderRule {

    @Override
    public void verify(PlaceOrderCommand command) { 
        if (command.getProduct().isTypeOf(RAILWAY) || command.getProduct().isTypeOf(SIGHTSEEING)) {
            // check if the adress is available for delivery the ticket
        } else {
            // hotel, makes no sense of deliering tickets
        }
    }
}

到这里,我们闻到到了一些”坏味道”:随着需要验证地址是否达的产品类型增加,代码的圈复杂度会随之升高,意味着需要更多的测试用例来保护。如果将来再有一个新的类型需要检查配送地址是否可达,可以预见此处还会修改;如果系统中有越来越多的条件型业务规则使用当前的方式实现,系统将会越来越脆弱。

找到稳定的抽象

那么问题出在哪里?我认为这是由于没有找到正确的抽象,对于条件型的业务规则,其实是有稳定的步骤的:

  1. 检测当前情况是否需要验证给定的业务规则
  2. 如需要,执行验证;如不需要则略过

如果将AddressIsAvailableToDelivery修改为:

public class AddressIsAvailableToDelivery implements PlaceOrderRule {

    @Override
    public void verify(PlaceOrderCommand command) { 
        if (command.getProduct().isDeliverableAddressRequired()) {
            // check if the adress is available for delivery the ticket
        } else {
            // hotel, makes no sense of deliering tickets
        }
    }
}

这样,条件表达式依赖了稳定的抽象。代码不需要再关心产品类型了,当新的产品加入平台时,只需要知道该产品是否需要验证配送地址就行了。这样就做到了当新产品加入时,核心的规则验证逻辑不需要变更,系统更加稳定。

但这样好难用

工程师对这个重构感到满意,于是找到了BA(业务分析师),尝试对用户故事做一些变化

(经过简化的用户故事——产品预订)

  1. 作为用户,当我预订需要检查配送地址是否可达的产品时,我应该被告知配送地址无法送达,以便我调整配送地址或选择上门取票
  2. 作为运营人员,我可以设置产品在预订时是否需要检查配送地址,以避免预订后无法配送凭证的情况

BA对此提出了担心:

  1. 在这个实现方案中,平台运营团队需要为不同的产品设置不同的规则吗?如果规则数量很多,配置起来是不是很麻烦?因为对于某个产品类型,几乎不需要做规则的调整,要求运营团队去配置这些功能在现阶段反而使他们的工作变复杂了
  2. 平台运营团队在平时的工作中,还是按照产品类型的思维在工作的,他们更习惯于”如果产品类型是火车,那么。。。”这样的沟通方式,想要改变这样的思维方式不是那么容易
  3. 修改后的用户故事似乎太抽象了,这样能否帮助团队有效地理解真实的业务场景?

product-configuration

当有大量规则的时候,细粒度的产品配置方式确实有些繁琐,可能需要”配置专家”才能搞定

这些担忧不无道理,团队一下子陷入了两难的境地。

意外的灵感

我在阅读该项目一段配置代码的时候发现了这样一个细节:

if (isSmsEnabled()) {
   //enable sms sending
}

if (isEmailEnabled()) {
   //enable email sending
}



// application.properties
sms.enabled: false
email.enabled: false

// application-dev.properties
sms.enabled: false
email.enabled: false
  
// application-qa.properties
sms.enabled: false 
email.enabled: true
  
// application-prod.properties
sms.enabled: true 
email.enabled: true


这段代码表示,在不同的环境中,通过细粒度的配置项,可以精确地控制某个特定功能是否起效。配置项的控制范围很小,而且可能会有许多这样的配置项,但团队根据各个环境上的测试约定,将这些配置项归拢到以环境命名的配置文件中,这是spring boot提供的Profile机制。在启动应用的时候,并不需要一一指定各个配置项的值,而是指定粗粒度的profile即可: --spring.profiles.active=prod

这个方案给了我一个灵感:能否将之前的预订规则表达式类比为配置项,产品类型类比为Profile呢?

在这个思路下,我们保持AddressIsAvailableToDelivery依赖稳定的isDeliverableAddressRequired

public class AddressIsAvailableToDelivery implements PlaceOrderRule {

    @Override
    public void verify(PlaceOrderCommand command) { 
        if (command.getProduct().isDeliverableAddressRequired()) {
            // check if the adress is available for delivery the ticket
        } else {
            // hotel, makes no sense of deliering tickets
        }
    }
}

而在实例化Product时,注入预先设置的配置项,将产品类型和配置项的转换从核心的规则校验中剥离出去。

# railway
placeOrderRule.RAILWAY.deliverableAddressRequired=true
placeOrderRule.RAILWAY.anotherConstraint1=false
placeOrderRule.RAILWAY.anotherConstraint2=false
# sightseeing
placeOrderRule.SIGHTSEEING.deliverableAddressRequired=true
placeOrderRule.SIGHTSEEING.anotherConstraint1=false
placeOrderRule.SIGHTSEEING.anotherConstraint2=true

这样,既能让核心的规则校验依赖稳定的抽象,在变化时保持结构稳定,又暂时避免了给运营团队带来繁琐的配置工作。

遗留的问题

回顾这个过程,实在有些偶然,而且我认为我们只是用了最熟悉的技术手段暂时缓解了之前BA提出的第一点担心。

  1. 平台运营团队在平时的工作中,还是按照产品类型的思维在工作的,他们更习惯于”如果产品类型是火车,那么。。。”这样的沟通方式,想要改变这样的思维方式不是那么容易
  2. 修改后的用户故事感觉太抽象了,这样能否帮助团队有效地理解真实的业务场景?

而2、3则涉及到项目团队和干系人对产品的思考方式,当我们更倾向于使用具体的场景沟通的时候,团队更不容易意识到需要从中寻找稳定的抽象。那么我们需要花费精力去改变用户的思维方式吗,如果需要又应该使用什么样的方式?又或者我们需要使用更抽象的方式来撰写用户故事吗?在这里,想听听大家的意见。


Published on 05 June 2019.
Comments
Category: Ramblings


© Copyright2014-2021