• PA视讯国际 PA国际

    服务器 2024-06-25

    KunTai R2260 服务器光模块告警

    一、现网描述

    1.1 环境描述

    设备型号:8台R2660服务器

    硬件配置:每台服务器安装2张SP382网卡


    二、故障描述

    2.1故障现象

    现场一共8台服务器,每台服务器安装两张SP382网卡, 两张网卡分别使用一个光口连接到网络中,此时空闲状下的光模块在iBMC系统显示异常告警

    image.png


    三、问题分析

    3.1 排查思路

    1.sel显示光模块Abnormal Rx or Tx powers of optical module were detected告警,告警代码:0x29000017

    image.png

    2.Ibma服务已开启image.png

    3.关键过程

    告警信息是iBMA从光模块内部读取的,有光模块但是没有光纤它内部就会有RX功率低的告警; iBMA确实检测到该异常;和接口人对齐客户服务器环境确实是有光模块但是没有插网线;另外iBMC的用户指南对该告警也有说明

    image.png

    3.2 原因分析

    iBMA是从光模块内部读取的,有光模块但是没有光纤它内部就会有RX功率低的告警;iBMA确实检测到该异常。


    四、问题解决

    4.1 解决办法

    硬件层面

    拔掉空闲的光模块或者在空闲光模块上插入光纤线

    软件层面

    Down掉空闲的网口或者关闭iBMA功率信息收集功能(ibmc将无法获取系统层面硬件功率使用信息)

    禁用iBMA功率信息收集方法如下:

    1)cd /opt/huawei/ibma/config

    2)vi Monitor.ini

    3)找到NIC下的Sff_Dynamic

    4)将disableResource改为true

    5)更改后重启iBMA服务: