首页 > 代码库 > IT系统故障引起的一个事故的思考

IT系统故障引起的一个事故的思考

         记得几年前在我以前工作过的一个公司,因为系统的一个审批流突然中断,而且也没有在系统中触发邮件和短信等提示消息,而且我们的相关的审批人员和发

起人也没有在意。直到流程发起的同事在采购物品即将要使用的前2天才查看了系统,并且询问了相关仓库的同事是否收到了货,这时候才发现根本没有收到过要采

购这笔货的采购单,才发现问题严重了。

         因为没有这批货的话,生产线2天后就要停工待料了,于是业务部门不得不发起空运采购,要求通过空运紧急采购一批货过来应急使用。这才暂时解决了燃眉之

急。事后组织IT开发人员进行调查,发现由于sharepoint开发的工作量中间中断了,而且也没有走正常的异常处理程序,最后我们只能确认为微软公司的bug导致了

这次事故。

        事后我从另外一方面进行了思考,随着企业信息化的不断推进,我们日常工作对信息化系统的依赖不断增加,也就需要我们队信息化的建设和维护的投入不断

增加和关注,否则信息化系统就有可能成为我们日常工作的掣肘。但是现实生活中,我们很多企业对企业信息化建设比较在意,但是对系统后期的维护和升级的态

度则没有那么积极,很多情况下是一种敷衍或者应付的态度在实施运维。

        每当系统需要进行大的升级或者改造时,由于平时维护不当或者资料,人员不全,不得不将可以进行升级改造的工作,变成了重建,结果可能会出现建造了一个

又一个新的轮子,而且功能大多相似。实际花费的人力和物力更多,这也是管理的漏洞之一。