首页 > 代码库 > VMware vSphere常见问题汇总(十六)

VMware vSphere常见问题汇总(十六)

160. 解决安装sso报错:error 20010.failed to configure lookupservice问题

故障状态
安装vcenter single sign on这个组件时,系统提示如下错误:

Error 20010.failed to configure lookupservice

clip_image001

故障分析
这个问题一般都由ad、dns、时间等缘故导致;
解决方案
1、检查ad里的计算机名是否正常;
2、检查dns服务器解析里面的正向和逆向地址解析,并建议清除dns缓存和过期记录,然后重启dns服务器;
3、注意vcenter服务器的时间务必和ad服务器同步;
4、注意vcenter服务器的计算机名务必不要包含特殊字符;
5、注意vcenter single sing on的密码配置时不要包含类似@之类的非常规特殊字符;
6、确保vcenter服务器的防火墙处于关闭状态。

161. 无法登录到p2v之后的windows 2000系统

故障状态
1、成功完成p2v windows 2000物理服务器之后,无法登录它的虚拟机;
2、输入用户名密码之后,系统提示本地个人用户设置载入中,欢迎窗口一直无法弹出;
故障分析
这个问题通常是由于启动分区的盘符和初始化安装时的系统盘符不一致导致;
解决方案
1、搞个新的、可以成功启动的虚拟机,然后将这个抽取过来的windows 2000服务器生成的vmdk挂载上;
2、启动新建的这个虚拟机之后,当这块附加的vmdk磁盘被识别到之后,确认它的盘符;
3、更改启动分区的盘符后关闭这台新的虚拟机后将前面添加的vmdk移除掉;
4、再次在抽取生成的windows 2000虚拟机上尝试启动系统。

3. Ibm x3850x5主机无故从网络断开,所有虚拟机断开连接

故障现象

11月13日早8点左右,发现虚拟机都断开连接,检查主机发现主机与vcenter断开连接,重启esxi物理主机之后恢复正常。当时客户的esxi物理机为ibm x3850 x5,esxi版本为4.1 u1。

故障分析

通过800日志分析结果:

1.通过兼容性列表查询:

Http://www.vmware.com/resources/compatibility/detail.php?Devicecategory=io&productid=3242&devicecategory=io&keyword=5709&page=1&display_interval=10&sortcolumn=partner&sortorder=asc

之前的版本为2.0.7d-3vmw。

2.this issue has been observed in bnx2 driver version 2.0.7c.

This issue is resolved in the following asynchronous broadcom driver releases:

?esx/esxi 4.0 – broadcom driver version 2.0.15g.8.v40.1 ?esx/esxi 4.1 – broadcom driver version 2.0.15g.8.v41.1 to resolve this issue, ensure that your esx/esxi host has one of these driver version installed. To download the latest broadcom netxtreme ii ethernet network controller driver version, see the vmware download center.

Kb.vmware.com/kb/1029070

解决方案

1、将网卡驱动升级到broadcom driver version 2.0.15g.8.v40.1。下载链接http://downloads.vmware.com/d/details/dt_esxi40_broadcom_bcm57xx/zhcqynqlzwhidgqlca==

2、安装驱动

方法1

(1) 将驱动iso光盘插入esxi光驱。注:esxi主机使用cdrom方式比较特殊

~ # vmkload_mod iso9660

Module iso9660 loaded successfully

~ # /sbin/vsish -e set /vmkmodules/iso9660/mount mpx.vmhba32:c0:t0:l0

~ # ls /vmfs/volumes/cdrom #此时该到该目录即可看到光盘内容

Cd转到驱动所在目录。

(2) 主机进入维护模式并使用命令升级

Esxupdate --bundle=xxxxx(驱动名称).zip update

方法2

1. 解压缩网卡驱动

2. 驱动zip文件(bnx2-2.1.5d.v40.1-offline_bundle-446542.zip)在"offline-bundle"下面

3. 上传bnx2-2.1.5d.v40.1-offline_bundle-446542.zip到 /vmfs/volumes/<datastorename>/

4. 使用下面的命令"esxupdate --bundle=bnx2-2.1.5d.v40.1-offline_bundle-446542.zip update"升级驱动

方法3

1.下载vmware-vsphere-cli并在自己的电脑上安装;

2.下载网卡对应的驱动程序,并将其解压出来,

3.将要安装驱动的这台主机设置成维护模式,方法为通过vsphereclient连接vcenterserver,在主机上点击右键,选择“进入维护模式”(注意,最好关闭主机上的虚拟机)。

4.打开命令提示符(运行-》cmd),切换至vmwarevspherecli的安装目录,进入bin,运行:

>vihostupdate.pl--serverxxx.xxx.xxx.xxx(该主机ip)--install—bundle%驱动所在目录

%vmware-esx-drivers-net-igb_400.3.2.10-1vmw.2.17.249663.493750offline-bundleoffline-bundleint-intel-lad-ddk-igb-3.2.10-offline_bundle-493750.zip(这个参数是你的驱动所在目录)

然后会提示你输入用户名和密码,之后会执行该命令,进行驱动安装,安装过程可以字vsphereclient中看到。命令完成后就完成了网卡驱动的安装。就可以看到该网卡了。

如何查询网卡的驱动,可以使用下面的命令:

A.使用root用户登陆到esxi server;

B. # ethtool -i vmnic0

164. Update manager无法使用odbc的问题

故障现象:

在系统添加odbc无法在update manager中使用

解决方案:
由于update manager的odbc是32位,而vcenter系统“管理工具”的odbc为64位,存在不兼容的问题,需要在运行栏中输入:c:\windows\syswow64\odbcad32.exe。然后添加odbc即可。

165. Vcops5.6监控的到vcenter的health state为0

故障状态:

Vcenter operations 5.6部署后,现实vcenter server的health state为0,如下图所示:

故障分析:

找了半天,发现vsphere replication management server没有运行,导致了这个

解决方案:

打开mob里的“com.vmware.vchms"的配置插件,并且去掉这个for vr的插件之后,搞定:

移除后,健康状态如下图所示,ok:

然后在vsphere web client的vcenter solutions manager里看看吧,正常了。

166. Vsphere replication无法配对vrms服务器提示vrm server generic错误

故障状态

尝试用vsphere replication来配置srm,但是,在尝试配置vrms连接时,提示如下错误:
vrm server generic error.please troubleshooting information.the detailed exception is:"unexpected status code:404".

故障分析
这个错误一般都是由于fqnd的问题导致;
解决方案
编辑主站点和恢复站点的hosts文件,由于客户选用的是vcsa,所以,执行如下命令:

1. Vi /etc/hosts

2. 10.10.10.10 vc01.vmanager.cn vc01

3. 10.10.10.20 vc02.vmanager.cn vc02

修改完成之后,重启vcsa服务器,搞定。

167. 解决hp esxi主机不断从vcenter断开的问题

故障状态

Hp oem版本的esxi 5.x部署的系统老是从vcenter自动断开,连上一会儿之后又断开;

解决方案
1、ssh或者dcui连接到esxi主机;
2、执行如下命令,移除掉hp的oem版本license模块:
#esxcli software vib remove -n hp-esx-license --no-live-install
3、重启esxi主机

clip_image003

168. 解决退出lockdown mode会禁止掉root访问问题

最近某个用户提示如下图所示的故障:

clip_image005
关于lockdown mode的用途,我想大家都应该清楚,它被用于保护esxi host的安全,如下图所示:
clip_image007
经过测试之后发现这个问题是由于当将esxi主机进入到mockdown mode后,同时立刻移除掉root权限之后,就会导致在这个时刻dcui.access角色的权限会高于lockdown mode,就会导致这个问题,原因就是lockdown mode的工作原理了,它调用的角色就在dcui.access这个特定角色里;
回顾lockdown mode的整个过程来看就是当esxi主机加入到vcenter之后,受到特定权限锁定,然后通过agent来执行锁定命令传达,当这个权限丢失之后,锁定模式就失效了,可是此时root权限也没了,所以就会出现上述问题;
由于lockdown mode依托于vcenter服务器的角色定义调用的dcui.access权限,当vcenter宕机之后,要想恢复root权限访问esxi主机访问,则此时,唯一对于esxi host拥有访问权限的就是root账户,如下图所示:
clip_image009
回到esxi host上面看到当前的permision list的user/group,如下图所示:
clip_image011
从上图中所示的user list来看,里面包含root用户和admin02用户以及vpxuser和dcui user,上述用户都有administrator权限;
当将esxi host进入到lockdown mode之后再dcui.access list里将root改成admin02之后,如下图所示:
clip_image013
然后,将esxi host进入到维护模式,此时,再次尝试登录esxi host就fail掉了,如下图所示:
clip_image015
进入到dcui界面,输入如下图所示的用户名admin02和密码,之后,可以登陆进去,因为它在dcui.access list,但是再次登录esxi时,如下图所示了,root用户木有了:
clip_image017
而root账户是唯一拥有权限的user name,所以,如果root不再,则即使其它username都有administrator特权,依然无法退出esxi的lockdown mode。

169. 为esxi 5.x主机安装hp cim驱动

Cim全称common information model,被用于沟通esxi主机和硬件传感器之间的通讯;
它的存在是为了帮助esxi主机和硬件之间的沟通,以便可以查询到硬件的状态,例如下图所示:

clip_image019
当部署了hp cim驱动时,点击health status会显示如下图所示的状态信息:
clip_image021
有了这个cim driver,对于esxi主机的硬件健康状态监测就可以如愿实现,但是,有时候可能会碰到内置的cim driver和硬件版本不匹配的问题,那么,此时,可能就需要去服务器官网下载最新的for esxi主机的驱动来安装,自然是指定官网了,这里介绍的时hp,所以,如下图所示:

clip_image023

下载到了之后,就是安装了,安装步骤如下:

1 、进入到 esxi 主机的 dcui 命令航界面,执行如下图所示命令:

#esxcli software vib install -d /vmfs/xxxx/xxx.zip

或执行 vcli 远端命令行:

#esxcli -s x.x.x.x -u root -p password software vib install -d /vmfs/xxxx/xxx.zip
执行完成后, 如下图所示:

clip_image025

10. Vm虚拟机快照的对应关系

关于快照:

Virtual machine cannot be powered on.

Error message: cannot open disk. Vmdk file or one of the snapshot disks it depends on.

Virtual disk header file is missing.

Guest operating system fails when creating snapshots.

Windows guest operating system fails with a blue screen when a snapshot is created.

Guest operating systems exhibits strange behavior when a snapshot is created.

To allow the virtual machine to power on using the snapshot:

1. Log in to the esx host service console.

2. Type grep ‘^cid‘ <filename.vmdk> to see the content of the virtual disk header file. Do not use the <filename-flat.vmdk> as that is the actual content of the virtual disk.
The output appears similar to:
cid=fb183c20
take note of the cid.

3. Open the snapshot header file with a text editor. If there is more than one snapshot in the tree, it is the first snapshot in the tree (usually the one with filename-000001.vmdk ).

4. Locate the line that contains the string parentcid=.

5. Replace everything to the right of the equal sign with the cid obtained from step 2.

6. Save and exit the file.

7. Power on the virtual machine.

8. Http://kb.vmware.com/kb/1004232

注:当一个guest os有多块硬盘时,当对该guest os做了一次snapshot时,对应每块硬盘的快照也分别会各自有一个(如guest 有3块硬盘,做第一次快照时会多生成3对vmdk的),命名方式如下:
该guest os 做快照之前:

clip_image027

第一次快照后:

clip_image029

第二次快照后:

clip_image031

注:以上截图操作时在guest 关机操作下进行的执行快照操作,当guest 开机时 “*000002.vmdk”这三块硬盘中的系统盘,cid会变,但parentcid始终不会变。

Cid对应的值与“parentfilenamehint” 是要一致的,指向需要同一块磁盘,如:“"parentfilenamehint="eric_test_win2k31_2-000002.vmdk"”

删除snapshot1状况:

clip_image033

最后,参考官方kb:http://kb.vmware.com/kb/1003861

VMware vSphere常见问题汇总(十六)