vmkernel: 6:01:47:36.383cpu14:4274)<4>qla2xxx 0000:1a:00.0: Failed mailbox send register test
5、HBA卡可能进入离线状态,例如:
vmkernel: 6:01:47:36.383 cpu14:4274)<4>qla2xxx 0000:1a:00.0: ISP error recovery failed - board disabled 故障分析:
具体问题还不太清楚,期待VMware官方能够给出解释并放出相关补丁; 解决方案:
在ESXi/ESX 4.1里面雀圣启用了中断重映射代码,而这个代码和部分IBM服务器不兼容,可以通过禁止掉这个代码缺省启动的方式来临时解决这个问题: 1、进入到命令行界面,执行如下命令: #esxcfg-advcfg -k TRUE ioDisableIR #init 6
2、重启后检查这个选项是否依然缺省启动: #esxcfg-info -c iovDisableIR=TRUE
备注:这就表示缺省没有启动;
也可以利用vSphere Client登录到服务器的GUI进行修改
30、虚拟机无法关闭停止在95%左右的解决办法
一次做虚拟机回收工作,由于目标虚拟机当时杀毒软件正在运行,CPU占用很高,本来想登陆关闭虚拟机,但是远程连接根本没反映,打开VC带的控制台,鼠标点击进去,操作也是在是慢,总归到底,最后,直接将虚拟机电源关闭。之后,就看着任务开始执行,但进度条走到95%的时候,咋都不动了。 解决思路:
这个问题,属于一个“沟通”问题,应该从两方面入手: 1、一个是vCenter端是否已经将此命令顺利传送到ESX;
2、然后是,ESXi/ESX端是否顺利接到命令,以及是否执行了此命令。 解决过程: 1、SSH连接ESX;
2、vmware-cmd
3、官方文档说若为On,可继续执行其他命令来结束虚拟机;
但是我走到这里,显示的为Off;这就说明,ESX已经将虚拟机关闭了,那这问题就是一个沟通问题
4、登陆VC,我想先从VC端将此问题虚拟机所在的主机断开连接,之后再重新连接,这样就会进行一次新的对话,但是,由于前一个未关闭虚拟机的任务未执行完毕,之后的任务好像都成队列似的在等待,没有反应。 5、任务无法执行,重启相关VC和ESX服务
VC:在Vitual Center的WIN机器上的,在服务管理器重启VC服务。 ESX:在SSH登陆后对两个服务器执行重启。(注:虚拟机服务会短暂中断) 命令如下:
service mgmt-vmware restart service vmware-vpxa restart
6、在这沟通中的三个服务都已经重启完毕,此时再执行步骤2时,发现返回的结果为On--那台虚拟机正在运行,发现这个,那么按照官方的文档,后续的几个命令就可以有用武之地了。 7、kill -9 xxxx
ps -auxwww |grep -i
9、登陆VC查看,刷新下,如果状态还未改变,再重启下VC服务器,即可。
*******************************************************************************
31、为主机应用Host Profiles提示compliance错误
故障状态:
为主机应用Host Profiles失败,提示如下错误:
01.Specification state absent from host: device '
03.Specification state absent from host: device '
04.Host state doesn't match specification: device '
这是由于PSA组件导致的; 解决方案:
1、右击Host Profiles后点击Enable/Disable Profiles配置选项;
2、展开“Storage Configuration”选项,展开“Pluggable Storage Architecture”这个uxanxiang; 3、去掉“PSA Device Configuration”;
4、展开“Native Muti-Pathing(NMP)”这个选项后,接着展开“PSP and SATP configuration for NMP devi”选项;
5、去掉“PSP configuration for”这个选项后点击OK即可。
33、分析、解决IOPS导致的虚拟机/存储性能下降和虚拟机磁盘延时较大的问题
故障状态:
1、虚拟机性能较低;
2、在执行备份时磁盘延时很厉害; 3、虚拟磁盘vmdk延时较大; 故障分析:
这种问题基本都是由于虚拟机没有足够的IO Per Second(IOPS),或者IOPS低于30; 解决方案:
在解决问题前,首先要解决以下两个问题: 问题1:什么是IOPS?
IOPS全称为Input/Output Per Second,它是衡量一个磁盘(虚拟磁盘和物理磁盘)、存储的基本也是十分重要的标准。不同的磁盘、存储有着不同的IOPS。IOPS的高低直接会影响着系统的性能。当前,VMware虚拟化环境中最大的瓶颈也就在于这个IOPS。针对数据密集型业务的数据库业务和流媒体业务,由于它们的IOPS很大,所以在虚拟化环境中部署它们一定要充分考量它们的负载,也就是IOPS大小,结合实际的存储性能来查看是否符合业务标准。
问题2:如何计算IOPS? 如何计算每台虚拟机的IOPS?
要想计算每个虚拟机的总的IOPS数量,首先就要确认磁盘类型以及它们的IOPS是多少。处于RAID阵列里面的每个盘的IO有利于增长整体存储的可用IOPS。而位于这个存储上面的单台虚拟机的IOPS,则可以通过将这个存储的总IOPS除掉虚拟机数量即可基本得到单台虚拟机的IOPS。 现实案例:
假定有6颗10000RPM的磁盘,那么它们的总的可用IOPS大约为150x6=900。如果LUN上面运行的虚拟机数量为50个,则单台虚拟机的IOPS为900/50=18 IOPS。如果以这个为标准,则意味着虚拟机的性能相对底下。如果想要满足虚拟机的基本IOPS需求,那么应该为
900/30=30,也就是说同一个Volume里IOPS为30(最低要求)虚拟机需要数量控制在30台以下。
备注:备份存储会消耗更多的IOPS,同时也会给Volume带来更多额外的符合。如果是这样,则需要用额外手段解决备份时的额外资源消耗(可以通过I/O meter软件来测试IOPS)
34、丢失或锁定文档导致虚拟机无法Power On
故障状态:
1、虚拟机无法开启;
2、尝试开启虚拟机时,看到类似如下错误信息: ?Unable to open Swap File;
?Unable to access a file since it is locked; ?Unable to access Virtual machine configuration; 3、在/var/log/vmkernel文件里可以看到类似如下信息:
WARNING: World: VM xxxx: xxx: Failed to open swap file
7、虚拟机在vCenter Server和ESXi/ESX主机之间报告控制台电源状态冲突; 故障分析:
导致这个问题的因素可能很多,但是众多问题中,都穿插或包含着文件损坏或文件被锁定等问题的可能。虚拟机常用的文件包括: ?*.vswp ?*-flat.vmdk ?*-delta.vmdk ?*.vmx ?*.log 解决方案:
首先需要确认哪些文件处于锁定状态:
1、利用vSphere Client登录ESXi/ESX主机、vCenter Server主机;
2、在Datastore里找到想要开启但是无法开启的虚拟机所在位置;
3、尝试开启虚拟机,如果无法开启且console显示错误,先查阅vmware.log日志文件的相关信息来确认问题;
4、利用SSH或COS选用root权限登录到ESXi/ESX主机之后执行下面的命令查看虚拟机的完整路径: #vmware-cmd -l
系统将输出类似如下信息来显示注册到ESXi/ESX主机的虚拟机: /vmfs/volumes/
6、然后查阅vmware.log日志,在文件的尾部查看什么原因导致这个问题后再针对性的分析。
准确定位并删除掉锁定文件
由于虚拟机可以在主机之间移动,如果虚拟机注册到的主机保持对文件的锁定状态,那么,这个锁定文件可以有效保障ESXi/ESX主机对虚拟机文件的控制权和有效保护虚拟系统。主机由Service Console接口的MAC来确定。lock由VMkernel或Service Console负责维护;
备注:ESXi服务器没有Service Console所以,lock由VMkernel单独负责维护; 首先要确定VMkernel可能锁定的文件:
1、执行下面的命令来报告锁定目录所在的MAC地址:
#vmkfstools -D /vmfs/volumes/
2、由于负责锁定.vmdk文件的主机会将MAC地址写入到vmkernel日志里面,那么可以用下面的命令查阅: #tail /var/log/vmkernel
35、Storage vMotion失败:looking for lines staring with \
故障状态:
1、执行Storage vMotion失败; 2、系统提示如下错误信息:
01.A general system error occurred: Storage VMotion failed to copy one or more of the VM's disks. Please consult the VM's log for more details, looking for lines starting with \ 复制代码3、/var/log/vmware/hostd.log文件里有类似如下信息: