首页 > 代码库 > EMC VNX点检向导
EMC VNX点检向导
一、 VNX性能收集
1、打开管理控制台system->monitoring and alters
2、选择statistics for block
3、点击performance data logging弹出对话框,在stop automatically after填写信息收集的天数,最少1天,最多7天,然后点击start。再定义的天数之后收集工作自动停止
4、获得日志,点击Retrieve archive弹出对话框,选择收集的日志(可根据日期来确定),然后选择retrieve到本地电脑上
二、 VNX性能分析
1、存储各部件性能分析关注点:
? SP:Utilization, dirty pages, watermarks
? LUN:Ownership, forced flushes, throughput, I/O size
? DISK:IOPs, MB/s, Service Time, Queue Lengths
2、存储性能监控点:
? LUN Utilization: <50%
? Response Time: <10ms
? Average Queue Length: (视具体情况而定)
? Forced Flushes: 10/s
3、性能参数详解
? Utilization:利用率。对于存储来说,SP的利用率不差过70%,LUN的利用率不超过50%,那么我们认为该部件不存在性能问题。
? Watermarks:存储写内存的一个水位线参数,用于管理write cache flushing。EMC VNX存储默认的水位线为60%-80%。当cache usage超过80%,就会触发forced flushes。最佳状态是没有forced flushes,如果当每秒forced flushes数量超过10次,就存在性能问题。当cache usage长期低于60%,说明cache usage过低,可以通过适当的提高内存的利用率来提高性能。
? Response Time: RT = Service Time * Queue depth一般我们认为LUN的RT低于10ms,该设备没有性能问题。
? IOPs:对于VNX存储常用的磁盘类型,我们粗略定义如下:
SAS 15k rpm 180
SAS 10k rpm 150
NL-SAS 7.2k rpm 90
当我们发现存在性能问题时,我们检查磁盘的IOPs,如果磁盘非常繁忙,IOPs接近磁盘的理论上限,那么我们初步认为,目前的磁盘数量配置已经不能满足应用需求,需要扩容更多的磁盘。
? LUN Ownership:由于VNX存储的架构,每个LUN在某一时刻只能属于一个SP。故我们建议在创建LUN的时候手工将LUN Ownership平分到2个SP控制器上。当存储发现2个控制器的工作压力不平均或有一个控制器发现故障时,会切换LUN的ownership。正常切换不会影响生产应用和性能。但是如果发现非正常切换,例如短时间内一个LUN反复在2个SP上来回切换,这将导致严重的性能问题。LUN的ownership切换可以在存储的log里查看。
三、 VNX日常巡检
1、登录到VNX5500的Control Station,打开初始界面,在Dashboard上面可以查看部分告警信息及系统信息:
2、也可以在system目录下选择Monitoring and Alerts,查看关于文件系统或者后端存储的事件信息:
3、查看后端存储SP的事件日志:
4、查看文件系统的事件日志:
5、查看后端存储的故障信息:
6、查看后端存储的主机连接信息:
7、查看后端存储的LUN Trespass信息:
8、若有故障需要深入分析还需要获取存储上的诊断信息:生成方法如下图示:
9、上传生成的诊断信息到本地:如有需要在传给EMC support
EMC VNX点检向导