记得初中的时候,有阵网吧查得特别严,规定未成年人不能入内,需要身份证原件或复印件验明真身。 我那时还不到年龄,在007的启发下,复印了自己的身份证,把复印件改大了两岁,再复印了一份淡化修改痕迹,大摇大摆地走进网吧,结果被赶出来了。 我怎么会知道早我两年出身的人的身份证只有15位呢……
最近接手的一个遗留项目要上线了,也发现了一件和identity有关的趣事。 该产品的终端用户可以通过产品的UI管理一种业务对象,我们假设它叫Foo。 产品内部集成了一个第三方系统,在两个限界上下文中存在一对映射关系,即每个Foo都对应该第三方系统中的一个对象Bar。 在试生产环境中,终端用户已经把上线时需要的数据都录入好了,在之后的测试中也一直运行得不错。 现在生产环境已经安装完毕,为了减少终端用户的工作量,我们试着导入试生产环境的数据,结果发现了意想不到的问题: 生产环境中Foo和Bar的对应关系失效了!当用户编辑Foo并由此借修改Bar时,系统总是提示找不到对应的Bar。
最后问题被找到了,该第三方系统的导出功能并不会导出Bar的identity,其导入功能会原封不动的恢复导出的数据,但是id除外! 它会根据内部规则生成一个新的id,因此原先保存的对应关系失效了。 我们编写了一个小脚步为生产环境修复了这个问题,但是有一个小细节引起了我的注意。 有几个编辑Foo的功能,其底层并未交互第三方系统,但也神奇的失败了,提示找不到对应的Foo。 原来虽然Foo有自己的id,但是所有操作的Foo的功能实现,从UI到底层都在使用Bar的id作为标识……
在这个例子中,Bar的id虽然也是全局唯一的,但并不适合作为识别Foo的标识,因为它只是实现Foo的技术细节,最好尽可能地隐藏这个概念。 尤其当这个标识是开发组织不可控时(比如由购买的第三方产品管理),它可能因为一些意想不到的原因而改变。 虽然通过数据变更脚步可以修复问题,但是如果这个标识被传播到了系统的各个角落,修复的难度和风险就大大增加了。 因此,只要有可能,id最好由自己把控,可别为了图方便而借用他人的。
但这并不意味着每个系统都一定要自己搞一套id,比如一个企业可能将业务分解到有若干的子系统中,那是不是每个系统都需要建立自己的用户id呢? 显然这是不必要的。我觉得只要产生id的系统组件是开发组织可控的,并且所有团队都能达成使用该identity的共识和约束,那借一借也无妨。
不少团队会进行代码走查来促进代码质量,代码走查的目标可以是设计或实现的缺陷,这往往依赖于走查者的个人经验和技术功底;也有对照代码规范的专项走查,这时需要的是细致和耐心。比如团队决定使用slf4j来作为日志api,以便将系统和日志实现解耦。有时因为疏忽,开发者可能会意外地导入别的日志库,比如log4j。即使团队有良好的代码走查实践,要发现如此琐碎的问题还是挺费功夫的。计算机更适合完成这类重复的工作,我们只要找到合适的工具就行了。
比如刚才的日志依赖问题,可以交给classycle,它支持自定义类之间的依赖规则,并依此检查代码库:
list-1 检查代码库不依赖于log4j,保存在src/test/resources/classycle-dependency-definition中
show allResults
[log4j] = org.apache.log4j.*
[root] = your.project.root.*
check [root] independentOf [log4j]
如果是Maven项目,可以很方便的执行检查:
list-2 使用classycle:check执行检查
如果classycle找到了不符合规则的依赖,会输出到target/classycle目录下的报告中。
show onlyShortestPaths allResults
check [root] independentOf [log4j]
Unexpected dependencies found:
sample.bar.Bar
-> org.apache.log4j.Logger
###如果发现不良的依赖就让构建失败
静态检查工具使得团队可以把更多时间投入到推敲代码上,去发现新的问题,而不是枯燥地查找已知的缺陷。既然已经有了廉价的检查手段,本着越早发现问题越容易解决的原则,不妨把检查任务集成到项目的构建过程中。如果团队已经建立了部署流水线,可以让流水线来执行检查,如果classycle发现有违反规则的依赖会使构建失败。
list-3 将检查任务绑定到maven verify中执行
最后记得让持续集成服务器把classycle生成的报告保存下来,方便团队排问题。
如果团队有幸可以从头构建代码库,那么最好从一开始就将依赖检查加入到流水线中,并逐步按需调整。如果接手的是遗留项目,最好谨慎一些,随着重构逐步丰富检查规则。无论是哪种情况,都要根据项目的实际情况定义检查规则,如果流水线因为检查不通过而长期处于失败状态,就失去意义了。
可能你会觉得如果依赖检查不通过就终止构建太严格了,不过这招往往很有效,尤其是当项目的周期较长,并有新的成员加入时,依赖检查可以帮助团队保护架构原则。比如,一个采用port & adapter架构(onion)的系统,可以检查domain不依赖于任何适配组件。
list-4 确保domain是onion架构中的“核心”
show allResults
[root] = your.project.root.*
[port] = your.project.root.domain.*
[adapters] = [root] excluding [port]
check [port] independentOf [adapters]
另一方面,重视依赖检查也可能反过来促进制定合理的架构约束。以下两种划分package的方案,你更倾向于哪种呢?
list-5 方案一:按职责划分
repositories/
UserRepository
TransactionRepository
ShipmentRepository
serializers/
UserSerializer
TransactionSerializer
ShipmentSerializer
models/
User
Transaction
Shipment
list-6 方案二:按领域划分
user/
UserRepository
UserSerializer
User
transaction/
TransactionRepository
TransactionSerializer
Transaction
shipment/
ShipmentRepository
ShipmentSerializer
Shipment
假设user不应该依赖transaction的话,第一种方案需要将检查规则定义到类的级别,而第二种方案能以较粗的粒度(package)来管理依赖关系,这样更为经济高效。
classycle-maven-plugin还支持把依赖规则嵌入到pom.xml中,但我更推荐使用单独的规则文件。一方面,随着项目的衍化,需要检查的规则可能会增长,一大段堆规则文本会使得pom.xml变得很臃肿,另一方面,单独的规则文件方便团队对比规历史版本,查看其修订记录及原因。
对于gradle项目,我暂时还没有找到现成的插件,不过classycle本身支持ant task,所以可以用gradle ant插件来集成。
directory per domain model or directory per layer, role