首页 > 代码库 > 筑一座五军集结的长城:保障运维世界
筑一座五军集结的长城:保障运维世界
近期,张艺谋导演执导的电影《长城》在国内火热上映,且不说电影中的故事设定和剧情如何,屹立于山巅上的万里长城和觊觎于长城外的无餍饕餮却着实令人震撼。笔者不禁思考:在我们运维领域,不也存在这样一群“饕餮”吗?它们时而神出鬼没,导致系统故障,却又难以定位;时而无影无形,在平静下暗藏隐患;时而兵临城下,集中式爆发,导致业务崩溃。
运维,我们也需要这样一座“长城”,集结“鹤、鹰、虎、熊、鹿”五军,共同抵御和消灭随时到来的“饕餮”。优云Automation正是这样一道不断完善的大型“工事”,集结各方军队,共同为运维世界筑起坚实的长城,快捷自动地解决运维工作中出现的问题,让运维世界里的我们过上幸福祥和的日子。
鹤军——信息总览界面
鹤军,如鹤般优雅灵动,俯视全局。Automation的总览界面能够让我们轻松地了解全局,能查看所有被管主机、服务和编排的数量,可了解最近24小时作业执行汇总、最近30天的作业执行情况等,能够直观了解运维全局。拥有“鹤军”,我们就能够统领全局。
我们可以点击具体的状态分类(如“执行成功”),或者某次具体的作业,了解作业的详细执行过程和结果,从而做进一步的判断和处理。
鹰军——巡检和故障自愈
鹰军,目光如鹰般敏锐,时刻提防远处的敌人。Automation内置系统巡检和故障自愈功能,恰如苍鹰一般时时刻刻扫描可能出现的指标异常、运行崩溃、未按预期工作等突发状况,进行预定策略自动修复。
在巡检方面,Automation内置了常见的巡检项,也可以根据需求编写更多巡检操作。然后将这些操作任意组合,形成一个巡检编排,就可以对大批量的主机进行定期检查。每当巡检完成后,可以自动生成一份报告,发送给指定人员。
故障自愈方面,可以定期监控某对象(比如MySQL数据库)运行状态、指标的脚本,当发现结果异常的时候调用对应的操作进行处理,从而达到故障自愈的目的。
拥有“鹰军”,我们就能够及时发现并处理突发情况。
虎军——强大的操作和编排
虎军,如猛虎一般,掌握长城内务的重型机关。Automation内置种类丰富的操作和编排,并提供包括Python、Shell、VBS、Bat在内的多种脚本语言支持,可利用这些脚本语言自由扩展运维操作。
内置丰富的操作:
自定义扩展操作:
每位运维工程师都可能会有“独家脚本”,正是依靠着它们实现了日常运维的需求,比如说软件的装卸、服务启停、系统检查等。然而这些脚本可能只能解决某个单一的问题,无法适用于复杂的运维场景,没能发挥出这些“士兵”的最大价值。Automation提供可视化的编辑能力,能将这些“士兵”编排起来形成强大的阵法,真正发挥出“虎军”的强大威力。拥有“虎军”,我们就能够游刃有余地应对各类需求。
熊军——开放简洁的API
熊军,短兵相见,以身相搏。Automation的OpenAPI体系提供非常便捷的集成能力,OpenAPI基于RESTful协议提供,支持任意技术集成。这样我们可以在特定的主机上运行其他业务程序,当需要实现自动操作时,比如创建虚拟机、部署应用、创建账号等,便可利用我们的利刃—OpenAPI来完成使命。拥有“熊军”,我们不再惧怕强大的“怪兽”,可以联合起具有各种特殊能力的友军,勇往直前。
鹿军——底层通信和消息通知
鹿军,禁军中的骑兵,速度是其利刃。Automation底层基于高效的消息队列实现,能够在数秒内完成单台Proxy与数千台Agent的即时通信(比如说指令的下发、结果的返回等),从而保证操作任务和文件的即时执行或下发,让管理成千上万台主机变得像管理单台主机一样轻松方便。
在作业执行失败,异或巡检或监控指标异常的时候,能够通过站内信、邮件、短信、社交工具等多种方式及时地通知相关负责人,从而使得及时处理成为可能。拥有“鹿军”,我们便能够快速执行,并能及时发现问题,及时处理。
在运维的世界中,有了Automation,即便一波又一波凶猛的“饕餮”来袭,我们也能够集结“五军”之力将之消灭。借助“鹤军”了解概况、综合分析,借助“鹰军”全面巡检、防患未然;借助“虎军”快速操作、批量作业;借助“熊军”灵活调度;借助“鹿军”提高效率、及时获取最新消息。未来Automation也会加入更多的军种,比如灵活便捷的编排DSL、插件化Agent体系等,共同抵御随时到来的“饕餮”!
筑一座五军集结的长城:保障运维世界