现象:最近客户vSphere 6.5日志发现有大量磁盘连接性问题的错误
由于连接性问题导致失去对卷xxx的访问权,正在进行还原尝试,稍后报告结果.

处理过程:
1.在SAN交换机上,通过porterrshow,并未发现端口错误
2.通过检查esxi主机/var/log/vmkernel.log,发现大量lpfc的驱动错误
2020-09-19T16:41:19.512Z cpu28:65985)WARNING: lpfc: lpfc_sli_issue_abort:10919: 1:(0):3169 Abort failed: Abort INP: Data: x195f x465 x1803 x98
2020-09-19T16:41:19.512Z cpu12:66294)lpfc: lpfc_handle_status:5227: 1:(0):3271: FCP cmd x89 failed <1/1> sid x010500, did x010001, oxid x195f iotag x465 Abort Requested Host Abort Req
2020-09-19T16:41:19.513Z cpu4:66065)lpfc: lpfc_handle_status:5227: 1:(0):3271: FCP cmd x2a failed <1/1> sid x010500, did x010001, oxid x1904 iotag x40a Abort Requested Host Abort Req
2020-09-19T16:41:19.513Z cpu0:66287)NMP: nmp_ThrottleLogForDevice:3630: Cmd 0x2a (0x4399c0c9e740, 65591) to dev "naa.600a098038313644325d4d7867335643" on path "vmhba2:C0:T1:L1" Failed: H:0x8 D:0x0 P:0x0 Invalid sense data: 0x0 0x0 0x0. Act:EVAL
2020-09-19T16:41:19.513Z cpu0:66287)WARNING: NMP: nmp_DeviceRequestFastDeviceProbe:237: NMP device "naa.600a098038313644325d4d7867335643" state in doubt; requested fast path state update...
通过查询,发现为esxi lpfc的驱动bug,
在安装了Emulex FC HBA驱动程序(lpfc)并且在加载驱动程序50天后启动并运行HPE无代理管理服务(AMS)的ESXi主机上,您可能会遇到以下症状:
- Emulex HBA可能会失去与SAN环境的连接,这可能包括但不限于:
o无法处理RSCN
o链路重置后无法重新发现SAN
o涉及ELS / CT命令的任何其他操作将不起作用
解决方案:通过更新ESXI驱动或者更新ESXI版本解决该问题
文章评论