研发运营一体化(DevOps)为传统大型商业银行带来新的机遇
随着金融科技的不断发发展,传统的研发模式和运维管理体系不再适应新的商业形态下的新变化、新要求(快速响应、快速实现、高质量交付)。在尝试研发运营一体化转型之前,农行应用支持团队面临着人才转型及技术架构改革双重压力。人员密集型开发和维护体系已经不堪重负,运维工具建设亟待升级,救火式运维、经验式运维也已逐渐捉襟见肘。
为此,农行应用支持团队积极践行“主动运维”,将DevOps理念应用于工作实际,探索一种最适合自己的发展之路。
对研发运营一体化的探索与实践
自2015年始,应用支持团队通过探索建立“组织有序、主动全面、智能高效”应用支持体系,将研发与运维紧密结合,持续提升一体化运行和业务连续性保障水平。
❂ 建平台
农行应用支持团队内成立运维自动化研发团队,牵头规划并负责智能运维平台的搭建,应用支持团队整体参与研发及推广,形成“研发团队+运维团队”相融合的组织模式。
经过近两年的探索实践,智能运维平台(星云)基础框架已初见成效,实现京沪两地应用支持工具的统一,通过推进日常应用支持工作的自动化、标准化,为研发运营一体化提供工具支撑。
❂ 管数据
为实现“事前预测、事后分析、运维管理”的运行质量分析目标,推动运维到运营的转型,星云平台以农业银行应用系统服务目录为基础,通过生产运维数据的集中管理,搭建起应用系统运维数据集市,现已将运行数据、运维数据、配置数据、操作文档等纳入平台统一管理。同时,结合运行质量分析系统建设,探索实践《应用分析指标规范》,形成运维及运行数据的统一视图,实现应用的运行及运维指标统一管理和数据扎口,推动运维数据的可视化、智能化、便捷化。
❂ 定规范
实践应用运维自动化,规范先行。在建设星云平台的同时,我们结合行内应用系统非功能需求,制定了监控中心、操作中心、交付中心、分析中心等相应应用支持工作规范,通过提供丰富的场景案例,为相关应用尽快了解及纳入智能运维管理平台提供指导依据。
我们从运维成熟度和运行健康度两个角度,建立了运行质量指标分析体系,定期评测应用系统在运维自动化执行、日志完整性、资源使用是否合理、变更及问题执行情况、应急处理能力等。
❂ 建团队
应用支持团队以科技部门职能调整为契机,整合应用支持服务资源(组织、人员、信息等),统一组织、角色、用户、流程等管理,实现应用支持团队工作的整体性和一致性管理;积极推动支持团队转型涉足开发领域,深入理解部署交付链条每个步骤,摆脱人工介入自动化流程,将冗杂、繁复的运维操作变成页面操作,实现运维向运维开发转型。
厘清研发运营工作职责,将研发运营一体化理念深入人心,通过常态化、全员化、自组织的微学习、微创新和微分享活动,推动研发运营协同工作,促进团队间协作关系的改善;同时,采用敏捷管理模式,星云智能运维平台作为最早一批使用TFS做任务管理的试点应用,目前已将本部门所有在研项目纳入TFS做任务管理,开发小伙伴们也已经早已习惯使用电子看板反馈任务完成情况,项目经理也通过电子看板即时了解整体工作进度和速度。每天早上,项目成员习惯性围到项目经理屏幕前,快速介绍昨日工作进展,今日工作计划,当前遇到问题。随着敏捷开发、快速交付的思想深入人心,目前星云平台各模块基本都是以两周一个版本的速度快速迭代,迅速不断地丰富完善平台功能,平台三视图、应用操作,数据自助查询等功能就在这种背景下快速开发完成。
星云智能运维平台助力农行DevOps新蓝图
2018年6月,星云平台经过新一轮重组,形成了“一平台四中心”的组织架构,朝着更高效、更便捷的应用运维自动化方向不断前进。
星云平台大事纪
1、2016年8月
推出应用运维门户、应用基础信息管理、应用性能管理、变更查询工具模块
2、2017年5月
增加数据变更查询工具,实现了应用数据操作的工具化
3、2017年10月
增加流程中心,实现日常运维管理的流程化
4、2017年11月
将应用迁移到太行平台,优化平台技术架构,大幅度提高应用响应速度
5、2018年1月
增加运行质量分析模块,提供运行视图、运维视图,实现运维可视化
6、2018年2月
增加对接ulog,实现运维日志查询和监控的功能
7、2018年5月
增加开发者、运维者、管理者的三视图功能,进一步优化用户体验
8、2018年9月
持续交付流水线试点系统在灰度环境的投产试运行,实现了开发、测试、投产的一体化自动部署
THE END
星云平台是农行为进一步提升应用运维保障能力,践行主动运维理念,实现应用支持一二线协同运维的重要成果。它将为农行应用支持一体化工作提供强大的工具支撑,使研发与运维团队深入融合,引领全体农行科技人向高效运维不断迈进,开创应用运维新格局。