运维咖啡吧

享受技术带来的乐趣,体验生活给予的感动

运维自动化之作业系统分享

任务系统的上线,帮助我们实现了发布部署等日常任务的自动化,但仍然有相当一部分日常运维操作大家会登录系统控制台处理,并不会借助于任务系统来执行,究其原因,其一是任务系统还有局限性,没有打通所有的终端主机,想要批量操作目标主机尤其是目标主机在不同云上内网的情况下实现起来较为苦难,其二是任务系统使用较为复杂,想要执行一些临时性的操作,需要先创建子任务,再创建模板,最后创建任务,过程繁琐效率不高

鉴于此开发上线了作业系统,作业系统作为任务系统的扩展与补充,主要用来实现系统命令或脚本的便捷执行,以轻量易用为目标,直接触达终端主机并实时获取结果反馈。作业系统深度集成了大家使用最为广泛的自动化工具Ansible,可以方便的批量执行命令或模板,同时与我们的多云系统相融合,选择业务节点即可批量选择主机,通过网关代理打通网域内网,解决网络互通问题,作业操作直达目标主机,实时获取结果反馈,并能随时主动中断作业执行。为了尽量保证作业执行的安全,还引入了危险命令过滤机制,自动过滤危险命令,提升作业安全性,配合完善的审计日志,能够做到操作有记录,过程可追踪

同时在这个阶段,还将整个自动化运维平台做了移动端兼容,优化了页面设计和操作方式,以保证整个自动化运维平台在移动端下也能有良好的使用体验,上线之后广受好评,解决了大家随时随地应对紧急需求还要打开电脑处理的问题

这篇文章就记录一下作业系统上线之后给大家的公开分享,介绍作业系统的由来、设计和使用