华为云计算IE面试笔记-FusionCompute上的虚拟机A和虚拟机B不能正常通信,请描述可能的故障点和排除方法(分析虚拟机A和虚拟机B不通)
作者:互联网
*快速定位故障点:(考到)
ARP:同一二层内可以通过ARP -a命令查询到要访问的主机IP(ARP表项中记录了同一二层中的IP和MAC的对应关系),若查询不到,说明二层出现问题(Vlan 间不通)或者硬件问题(交换机策略限制,交换机挂了,服务器挂了,线缆松动)。若查询得到一般是虚拟机侧的问题。
tracert/traceroute目的端:路由跟踪。若失败,三层出现问题。大可能是网关出现问题(网关在路由器上设置错误,加入了错误的路由条目,虚拟机侧未设置正确网关,虚拟机网卡未设置正确网关)
同网段:
先互相ping对方 VM,如果能ping通,那么就是虚拟机侧的问题。(防火墙没关、获得无效IP、网关信息配置错误、安全组限制、杀毒软件。)
如果不能ping通,那就arp -a,
如果没有目的MAC地址说明是物理问题(物理链路不通,交换机策略限制,交换机挂了,服务器挂了)或者 Vlan 间不通(VLAN隔离)。
不同网段:
如果在同一路由器下,可以在源目 VM 分别查看 arp 表是否存在对应的网关MAC地址,不存在,则是本端二层有问题(物理硬件或VLAN间不通);存在或者通,问题可能就出在虚拟机侧。(防火墙没关、获得无效IP、网关信息配置错误、安全组限制、杀毒软件。)
不同路由器,用traceroute命令检查每一跳的情况,可能是链路上的路由出了问题,若失败,三层出现问题。大可能是网关出现问题(网关在路由器上设置错误,加入了错误的路由条目,虚拟机侧未设置正确网关,虚拟机网卡未设置正确网关)。
如果不是同一主机,条件允许的情况下,可以将虚拟机移至同一主机,如果通,则是物理网络配置错误。
*DVS、OVS、EVS的区别:
DVS是FC中VRM上的一个用于管理和统一下发配置的虚拟分布式交换机,它是一个逻辑上的概念,不存在的,只在VRM上体现。
OVS是一款使用开源软件实现的虚拟交换机,是DVS在底层的体现,真正负责主机内部流量转发的组件,在底层是实际存在的,是内核态的。
EVS是OVS的升级版,是华为结合intel的DPDK技术去实现了用户态(免内核)的虚拟交换机,可以直接通过用户态去转发,不需要再经过内核再去找它的原生驱动再找网卡再进行转发了,路径变短,性能提升。
A能ping通B,B ping不通A是什么原因?
A开启了防火墙、A和B不在一个安全组。
开启了防火墙流量可以出去,进来的流量会有限制,端口组会拒绝ping,保证安全性。
*在SC上创建的两台虚拟机不通有哪些原因?
(四种网络)路由,内部,外部,直连 (考试环境是 type 3,只有外部网络和内部网络) 1. 可能在不同的 VPC。
2. 同 vpc 可能在不同的网络中,内部和路由不通,内部和外部也不通--是天然不通,配弹性 IP或者snat可以实现路由网络和外部网络的通信(弹性 ip 可以双向,snat 只能单向内访外)。
3. 位于不同的安全组中、安全组的隔离,(要安全组放行)。
*两虚拟机昨天还通,今天就不通了,有什么原因导致?
1. 虚拟机侧:虚拟机蓝屏故障(pvdriver驱动监控);物理主机进入维护状态或者物理机故障;端口组被人为误改了,不在同一个端口组内。
2. DHCP模块故障后,动态ip用不了。
3. CNA节点EVS进程故障。
4. 中间链路故障。
*如果是两个部门之间不通,有什么原因导致?
两个部门,通常情况下,处在不同的 vlan,也就是处于不同的端口组。
可能原因有:端口组 vlan 是否配置错误、上行链路是否处于不同的物理平面;TOR 交换机是否配置错误;网关设备是否配置错误;中间系统是否拦截流量;
*如果两台虚机在两个DVS上,怎么互通?
三层互通,使用路由器将两个物理平面打通;
或者如果两个交换机是三层交换机 直接链接然后放通相应VLAN就好
*安全组是怎么理解的?
安全组是具有同等安全要求的一组虚拟机,不同 VPC 下的安全组默认是不可以通的。
不同安全组之间的访问控制由 IPtable 和 iNIC 来实现。
*两个 VPC 里面的主机就一定不通吗?
不一定,VM 的路由网络,绑定弹性 IP 后可以通信。
或者配置安全组策略,使两个 VPC 中的 VM 可以通信。
或把 VM 放入直连网络
*一个物理网络就对应一个 DVS 吗?
一个 CNA 主机内一个 DVS 绑定一个 CNA 主机物理网口
*Fusionscompute的三个概念:存储资源、存储设备和数据存储。
1. 存储资源:告知数据在哪里,硬盘在哪里
2. 存储设备:数据存放的空间
3. 数据存储:FusionCompute维持出来的统一概念(使用存储时,存储资源告知位置,找到存储设备)
虚拟化数据存储:实现存储虚拟化时,采用主机存储虚拟化+文件系统实现。
非虚拟化数据存储:存储设备虚拟化
裸设备映射数据存储:裸设备+逻辑卷
裸设备映射和非虚拟化存储的区别就是。存储本身是不是高级存储
*虚拟磁盘类型以及差别
*主机和 VRM 心跳连接异常?怎么解决?
可能原因:
1. CNA 节点下电。
2. 网络出现异常。
3. CNA 节点管理网口异常。
4. CNA 节点进程异常。
在告警信息中确认异常主机的 IP 和 BMC IP 登录 BMC,检查主机是否下电
如果是下电状态,选择上电,待主机上电成功后,查看告警是否清除
用 putty 登录 VRM 后台,尝试 ping 主机的 ip,如果不通,检查网络问题。
如果通的话,用 putty 登录 CNA 节点,service vnad status 查看 vnad 服务是否启动如果没有启动,service vnad restart。
PS:VRM 之所以能接管 CNA,因为 VRM 调用了 CNA 里的 vnad 进程
*虚拟磁盘的类型有哪些?配置模式有哪些?磁盘模式有哪些?
类型:
普通:只能给单个虚拟机使用
共享:可以绑定给多个虚拟机使用
配置模式:
普通:根据磁盘容量为磁盘分配空间,在创建过程中会将物理设备上保留的数据置零。这种格式的磁盘性能要优于其他两种磁盘格式,但创建这种格式的磁盘所需的时间可能会比创建其他类型的磁盘长。 建议系统盘使用该模式。
精简:该模式,系统首次仅分配磁盘容量配置值的部分容量,后续根据使用情况,逐步进行分配,直到分配总量达到磁盘容量配置值为止。
使用精简模式可能导致数据存储超分配,建议超分配比例不超过50%,超分配率可通过数据存储的概要页面“已分配容量”和“总容量”的比率关系来确定。数据存储类型为“FusionStorage”或“本地内存盘”时,只支持该模式;数据存储类型为“本地硬盘”或“SAN存储”时,不支持该模式。
普通延迟置零:根据磁盘容量为磁盘分配空间,创建时不会擦除物理设备上保留的任何数据,但后续从虚拟机首次执行写操作时会按需要将其全部置零。创建速度比“普通”模式快;IO性能介于“普通”和“精简”两种模式之间。
只有数据存储类型为“虚拟化本地硬盘”、“虚拟化SAN存储”或版本号为V3的“Advanced SAN存储”时,支持该模式。
磁盘模式:
从属:快照中包含该从属磁盘。
独立-持久:更改将立即并永久写入磁盘,持久磁盘不受快照影响。
即对虚拟机创建快照时,不对该磁盘的数据进行快照。使用快照还原虚拟 机时,不对该磁盘的数据进行还原。
独立-非持久:关闭电源或恢复快照后,丢弃对该磁盘的更改。
1. 当数据存储类型为“SAN存储”、“本地硬盘”或“本地内存盘”时,不支持创建快照,默认“独立-持久”。
2. 当数据存储类型为“虚拟化本地硬盘”、“虚拟化SAN存储”、“NAS存储”、“Advanced SAN存储”或“FusionStorage”,且磁盘类型为“共享”时,该磁盘不支持创建快照,默认“独立-持久”。
3. 当磁盘类型为“普通”且数据存储类型为“虚拟化本地硬盘”、“虚拟化SAN存储”、“FusionStorage”、“NAS存储”、版本号为V3的“Advanced SAN存储”或“本地内存盘”时,磁盘才可以创建为“独立-非持久”模式。
*数据存储是虚拟化或非虚拟化的本质差别:
当数据存储的虚拟化特性是由主机侧去实现时,其根本就是将存储设备格式化为文件系统。本地存储格式成ext4,共享存储格式成vims。
非虚拟数据存储就是一个块设备。
*FusionStorage是不是虚拟化数据存储?
不是,虚拟化数据存储特指由CNA自身实现的虚拟化特性,例如快照、精简磁盘等,即对应存储虚拟化为主机存储虚拟化+文件系统。FusionStorage支持虚拟化特性,是通过FusionStorage存储系统自身机制实现的,CNA并未参与。
AdvancedSAN对于V3时,也是非虚拟化数据存储,理由同上。
*FusionCompute 集群内无法执行调度策略的原因
1. 对于不满足迁移要求的虚拟机,将不会进行自动迁移。例如下面的情况:
1) 聚集或互斥规则将阻止迁移虚拟机。
2) 已为虚拟机禁用了 DRS。
3) 某个设备挂载到了一个或多个虚拟机上,使 DRS 无法移动虚拟机,从而无法平衡负载。
4) 虚拟机与 DRS 的目的主机不兼容。
5) 虚拟机与所在主机进行了绑定。
2. 迁移后会产生新的不平衡状态,这类情况将不会迁移虚拟机。例如:
1) 衡量因素选择“CPU 和内存”时,部分主机 CPU 相对高,另外部分主机内存相对高。
2) 衡量因素选择“CPU”或“内存”时,迁移任何一个虚拟机都无法达到平衡。
3. 动态资源调度=DRS模块+策略+vMotion(自动),故无法执行调度策略的原因可以从以上三点去考虑。
4. DRS 需要共享的存储
*虚拟机热迁移、存储热迁移和完整迁移:
虚拟机热迁移是虚拟机在服务器之间存储不变。
存储热迁移是更换存储主机不变。
完整热迁移是主机和存储一起变。
*虚拟机HA是什么?如何实现?
概念:物理服务器或虚拟机故障时,系统在资源池中自动启动虚拟机到另一可用物理服务器上。
物理机故障类型:主机下电、重启、宕机
虚拟机OS故障类型:Windows蓝屏,Linux Panic等
特性实现:
1. VM故障或计算节点故障
2. 管理节点查询VM状态,发现VM故障
3. 管理节点判断VM有HA属性,则根据保存的VM信息(规格、卷),选择可用的CNA启动VM
4. CNA节点收到HA请求,根据VM规格、卷信息启动新的VM
5. 启动过程中,将VM之前的卷重新挂在,包括用户卷
HA时,业务会中断,准确的说,HA触发时,业务已中断。HA需要共享的存储。
热迁移是计划性迁移,HA是非计划性迁移。
*如何让VM1与VM4通,那个路由器怎么配置?
TOR怎么配
端口配IP, 然后开启路由功能,比如 OPSF 然后加入路由条目
*安全组
安全组是基于iptables实现的。
默认出流量全部放行 入流量全部禁止
可以限制哪些协议?CMP TCP UDP 等
存储虚拟化实现方式?
裸设备+逻辑卷:通过给宿主机CNA挂载块设备,宿主机采用DeviceMapper的内核模块对块设备空间进行逻辑划分成逻辑卷,此时逻辑卷即为虚拟磁盘。在FC的环境中,非虚拟化的本地数据存储、非虚拟化的SAN数据存储就是采用该方式实现。
存储设备虚拟化:赋予虚拟化平台的管理节点VRM管理存储设备的能力(添加存储资源),在VRM界面上操作创建虚拟磁盘后,VRM会通过控制流在存储设备上创建相应块设备(AdvanceSAN为LUN,FusionStorage为卷)。在VRM界面上将该累虚拟磁盘挂在给某台虚拟机并点击打开电源后,VRM会通过控制流在存储设备上将LUN或卷映射给即将运行虚拟机的CNA主机,CNA主机再通过RDM的方式将映射上来的块设备挂载给虚拟机。
主机存储虚拟化+文件系统:
1. 通过给宿主机CNA挂载块设备,CNA主机对其格式化成文件系统(本地硬盘:ext4、SAN:VIMS,添加数据存储时选择虚拟化的数据存储),并通过文件的形式存放虚拟磁盘。
2. 通过给宿主机CNA挂载共享文件系统(NFS),并通过文件的形式存放虚拟磁盘。
特性对数据存储要求的总结
在FusionCompute中,大LUN和小LUN是什么?有什么差别?
大 LUN 是将一个 LUN 添加为数据存储后,在上面创建多个虚拟机;小 LUN 是一个 LUN 添加为数据存储后只供一个虚拟机底层一个 LUN,被虚拟化平台接管,直接将该 LUN 作为虚拟机的磁盘使用大 LUN 方便几种管理虚拟机,可以实现更多高级特性小 LUN 性能达到最优化,容灾设计时可以针对具体虚拟机磁盘进行容灾。
虚拟机大范围无法访问的原因?
可以从三层来考虑,一是存储问题,二是网络问题,三是底层系统的故障:
1. 登录 portal 查看告警信息,以及用户是否有误操作。
2. 查看网络、计算、存储资源是否有问题。
3. 登录 FusionCompute,查看虚拟机状态是否正常。
4. 硬件排查。
如果部署 VRM 时出错怎么解决?
1. 部署工具版本不一致。
2. VRM 与 CNA 网络故障。
3. CNA 故障,硬件或软件不兼容。
4. CNA 虚拟化指令集在 BIOS 中没有开启。
5. 安装失败后清理不彻底。
6. VRM 创建的 VM 下发配置失败(配置错误)。
存储资源使用对比
存储资源类型 |
底层协议 |
存储设备类型 |
是否支持虚拟化 |
是否支持存储卸载 |
IP SAN |
TCP/IP |
LUN |
是 |
否 |
FC SAN |
光纤 |
LUN |
是 |
否 |
NAS |
TCP/IP |
共享目录 |
是 |
否 |
本地磁盘 |
本地连接 |
本地磁盘 |
是 |
否 |
AdvancedSAN |
TCP/IP |
存储池 |
否 |
是 |
FusionStorage |
TCP/IP |
存储池 |
是 |
是 |
存储卸载:指将部分存储操作(模板部署、删除清零等操作)下移到存储侧进行,这样做可以不浪费主机侧资源,同时也可以提升操作效率。
虚拟化:对于LUN或者本地磁盘,在不支持虚拟化的场景不能支持快照,链接克隆等高级功能,但是所创建的卷具有很好的性能。虚拟化后的数据存储,支持各种高级功能,卷格式也支持多种,但是性能低于非虚拟化的存储设备。
考官追问:
上行链路怎么配置?上行链路对应的交换机端口怎么配置?上行链路是主备?负载分担?
上行链路 可以配链路聚合 端口可以负载 也可以主备
vlan是基于端口创建的?
不是
不同网段的虚拟机通讯一定要经过路由吗?
要经过路由。vlan就是划分物理网络的功能,可以把一个物理二层网络划分成多个逻辑网络
TOR1和TOR2连接后交换机要怎么配,把具体命令写出来?
连接交换机 那你肯定要配网关 然后 打上路由 比如相连网段的OSPF路由
如何知道vm地址等配置错误
比如说你要分配给vm 192.168.1.0/24的网段 但你配置错了 vm获取到的地址是 192.168.100.0/24 你可以在 FC界面 直接看网卡IP 地址
假如vm1属于vlan10网段为192.168.10.0,vm3属于vlan30网段为193.168.30.0在tor交换机上应该如何配置?在物理主机上如何配置?端口组如何配置?基于以上条件vm2属于vlan20,网段为20.0上述的东西应该如何配置?
标签:存储,虚拟化,主机,虚拟机,CNA,磁盘,IE,FusionCompute 来源: https://www.cnblogs.com/LongShineW/p/15330114.html