opensminifiniband 多端口 配置 opensm.conf

xiaoxiao2021-02-27  787

cat /etc/sysconfig/opensm 这里面是opensm的详细信息,里面提到对于opensm的多端口有两种配置方案: 1) Start opensm on multiple machines and configure it to manage  different fabrics on each machine 2) Configure opensm to start multiple instances on a single  machine 大意是: 1. 在一台机器上启动多个进程,每个进程负责一个网卡口,优点是简单,并且能够为每个端口的策略详细定制 2. 在一个配置文件上指定多个网卡端口,一个进程负责管理这些端口,优点是够简单 我个人推荐方案1 因为: 方案2在遇到主机上有多块HCA卡时会出现错误,我遇到的现象就是交换机亮黄灯,或者ip addr show 的ib网卡状态,有一个是DOWN 方案1: [root@rac1 log]# cp -a /etc/rdma/opensm.conf  /etc/rdma/opensm.conf.0 [root@rac1 log]# cp -a /etc/rdma/opensm.conf  /etc/rdma/opensm.conf.1 一定要注意,我们要的是Port GUID,不是其他的GUID,因为默认的输出还有system GUID等 [root@rac1 log]# ibstat |grep Port Port 1: Port GUID: 0x248a070300001234 Port 1: Port GUID: 0x248a070300bc5678 编辑 /etc/rdma/opensm.conf.0和 /etc/rdma/opensm.conf.1 [root@rac1 log]# cat /etc/rdma/opensm.conf.0 |grep guid guid  0x248a070300001234 ..........omit............ [root@rac1 log]# cat /etc/rdma/opensm.conf.1 |grep guid guid  0x248a070300005678 ..........omit............ 我们复制了 /etc/rdma/opensm.conf.<数字> 这种,opensm就不会去读取默认的 opensm.conf了 方案2: 当机器上只有1块HCA卡,上面有2个端口时,可以采用第二个,因为配置简单: [root@rac1 log]# ibstat |grep Port Port 1: Port GUID: 0x248a070300001234 Port 1: Port GUID: 0x248a070300bc5678 [root@rac1 log]# cat /etc/rdma/opensm.conf |grep guid guid  0x248a070300001234 guid  0x248a070300bc5678 ..........omit............ 重启opensm,当然更推荐直接reboot systemctl restart opensm  
转载请注明原文地址: https://www.6miu.com/read-115.html

最新回复(0)