首页 > 代码库 > 2014年终工作总结及2015年工作计划--激励
2014年终工作总结及2015年工作计划--激励
习惯了总结,习惯了计划,没有总结就没法把零散的经验体系化,到头来是只见树木不见森林;没有计划就没有目标,没有目标人就容易颓废,到头来是王茂法贴春联一年又是一年。对于运维工作更是如此,运维是自我驱动的,而开发是需求驱动的,这有有很大的不同:运维涉及的知识面极为广泛、具体的工作也是异常分散、不可预知的突发事件更是让你措手不及,没有总结工作起来很痛苦,总是扮演消防员的角色;经过几年的发展,运维基础设施系统等大部分工作通过脚本、系统实现了自动化,很大程度的解放了运维的重复劳动,这个时候很容易无所事事、惶惶不可终日,这是深有体会的,所有计划对运维来说更是重要,计划提升自我、计划优化系统。。。都决定了自己的未来!
以下总结摘自我的工作邮件(仅对个别敏感处进行替换处理),激励自己,欢迎拍砖。
历年习惯,对2014年进行工作总结及计划2015年的工作目标。
一、运维管理类工作主要完成了:
(1)平台mysql慢查询按日分析推送系统上线,将按类别分析后的结果自动邮件至相关人员;
(2)hadoop知识的学习研究,接手hadoop后丰富了监控预警项目,增加了自动容量管理及通知功能,并对集群进行少量优化;
(3)创造性的实现了基于域名的单公网IP多内网站点的(http&https)七层NAT转发,结束了内网web应用测试需要记忆IP+端口的历史(应用在张*的dob*及张*微信的部分测试环境);
(4)石**机房整体搬迁至**机房及前期机房选址工作;
(5)线上监控系统增加了对redis多实例及代理服务器多实例的支持;
(6)**货运call center系统的学习及监控;
(7)线下虚机系统扩容及将**货运相关虚机资源隔离区分;
(8)线下发布系统重写,结合svn已完美实现完全自动化代码发布通知系统。
二、具体业务方面主要完成了:
(1)重要服务器的升级扩容(增加双电源、从库SSD磁盘扩容、增加服务器/交换机的备用设备);
(2)线上业务历史数据的归档及清理(tra**库、mongodb库);
(3)平台图片服务器迁移;
(4)redis、nginx proxy、haproxy单点的解决(线上暂时为冷切换,redis高可用方案已经完成并在线下稳定运行2个多月,2015尽早上线);
(5)sphinx性能优化:通过增加多实例和专用从库来提高分词服务性能,完全去除了因sphinx索引刷新对其他业务的造成卡顿、阻塞的影响);
(6)新增服务的线上线下环境部署及自动化发布(MP service、Upload service、影响*、dob**等);
(7)其他日常运维工作(这个方面有点庞杂,不再列出)。
三、突发事件应急处理方面主要有:
(1)**机房及公司网络、服务器负载、应用本身、DB等问题影响正常访问时,运维组及时排错、修复、跟进、告知相关业务方;
(2)部分服务器硬件问题的及时处理(如主库磁盘坏道、hadoop磁盘故障、datanode主板故障无法开机等);
(3)openssl出现heartbleed及bash漏洞发现后第一时间排查、确认、升级所有相关系统(详见邮件《关于公司所有linux服务器升级bash的通知20140925》)。
四、个人方面:
(1)通过学习获得了红帽的RHCA认证。
五、2015年主要工作计划(如果继续):
(1)建立线下的账号集中管理系统(个人服务器账号、jira、svn、跳板机等统一管理),线上已有堡垒机来管理账号暂时没有必要重做;
(2)建立线下服务器统一入口的堡垒机系统(自己开发);
(3)重点关注老旧服务器的运行情况,并适时提出硬件升级换代的实施方案;
(4)服务单点问题的解决(详见邮件《平台服务单点故障梳理20141114》);
(5)随着系统的日渐复杂,线下devbox已不能很好的满足开发人员的需求,熊*和李*在前期讨论这个事,如果可行,我们会配合熊*完成。
EOF
2014年终工作总结及2015年工作计划--激励