鑫启典
NEWS/
  • Backblaze 发布第一季度硬盘情况报告:SSD 固态硬盘故障率低于 HDD
  • ARM 服务器走进中国移动大网
  • XX科技现XX神器652!将推RXXXX Pro平板
  • 离开XX的怀抱依旧强!VXXX笔记本赚钱了
  • Android用户不要再怂:**变砖功能即将到来
  • XXX收购WithXXXX后,推出可监测心血管的智能秤
  • 实探:谷歌AXXXXGo背后团队是什么样的?
  • X龙652/820加持X2/Max2登陆印度市场
  • XXXRX480跑分首爆:只可惜完胜的是970
  • XX也有WWDC 2016:到会还送这些“壕”福利!
如何识别风扇噪音的一些常见原因并进行故障处理
来源: | 作者:computers-1027459 | 发布时间: 73天前 | 256 次浏览 | 分享到:

说明

PowerEdge 服务器中风扇噪音的常见原因是什么?

  1. 风扇故障、风扇缺失、风扇损坏

  2. 过时的固件

  3. 与 Integrated Dell Remote Access Controller (iDRAC)、Baseboard Management Chip (BMC) 或 Chassis Management Controller(CMC、MX 机箱的 OME-M)之间的通信中断

  4. 安装了不受支持的硬件

  5. 对需要安装不同类型的风扇的计算机的第二次 CPU 升级(取决于系统类型)或常规升级未完成

  6. 温度超出正常风扇速度范围(繁重的工作负载导致 CPU 利用率和温度升高、通风不畅)

  7. 系统护盖关闭或安装不正确。防盗开关可能被触发或无法正常工作。

  8. 配置设置

  9. 入口温度传感器故障,读出错误


风扇故障、风扇缺失、风扇损坏

在这种情况下,至少一个风扇或风扇部件(包含两个风扇)损坏(接头、风扇叶片、风扇叶框架)、缺失或发生故障。

要识别导致问题的风扇部件或风扇,请按顺序执行以下步骤:
  1. 检查正面 LCD 或系统事件日志,以查看报告了哪个风扇。

  2. 一旦我们知道哪个风扇被报告为故障,请检查风扇编号在盖子上的位置(或查阅 您的服务器用户指南),并查看风扇是否正在运行。

    注意:在不关闭服务器以检查风扇的情况下打开服务器的盖子时,请小心操作。内部元素可能是热的或尖锐的,或两者兼而有之。
    • 如果风扇转动较慢、完全不转动或发出不规则的噪音(刮擦、磨损),请关闭机器并拆下风扇组件进行检查。

      • 风扇磨损和刮擦应留下明显的划痕。

      • 有时碎屑或灰尘会导致风扇变得不规则,在这种情况下,清洁风扇可能会有所帮助。

      • 检查主板或风扇控制板上的接头以及风扇上的接头,查看是否有任何损坏。

    • 如果没有风扇损坏或连接问题,请重新安装风扇、导流罩(如果有)、机箱盖,然后重新打开机器。

    提醒:模块化机箱 M1000E 和 VRTX 具有所有可在外部检查的风扇。有关更多详细信息, 请参阅您的用户指南

    如果风扇仍报告为故障,请检查此 列表中的下一个可能性。

    过时的固件

    过时的固件可能会导致风扇高速旋转(发出噪音),而没有其他错误。当固件的某些部分已更新并且传感器数据收集链中的某些元素被忽略而无法更新时,这是很常见的。

    以下是在下一步调查中应检查更新的固件版本列表:
    1. iDRAC、CPLD、BIOS

    2. PERC、BOSS、背板、NVME 驱动器、SAS/SATA 驱动器

    3. NIC、任何其他 PCIe 卡

    4. 电源设备 (PSU)

    5. 任何其他硬件

    提醒:第一组更新(iDRAC、BIOS、CPLD)必须作为单个更新完成,并且不应与任何其他更新结合使用。
    当您想要使用 iDRAC 更新固件时(在此处了解如何执行此操作),更新将按从左到右和从上到下的导入顺序列出。
    每个列表项都应用作一次更新的指南(但不是第一项)。

    固件更新到最新版本后,继续执行列表中的下一项 

    与 Integrated Dell Remote Access Controller (iDRAC)、Baseboard Management Chip (BMC) 或 Chassis Management Controller(CMC、MX 机箱的 OME-M)之间的通信中断

    当 iDRAC、BMC 或 CMC/OME-M 失去与传感器套件的连接时,风扇会恢复到未受管速度(全速),以防止系统过热。
    这就是为什么在第一次打开时,您可以听到风扇旋转起来然后又下降的原因。iDRAC、BMC 或 CMC/OME-M 启动并开始调节风扇速度需要几分钟时间。
    提醒:当 iDRAC 或 BMC 未就绪时,开机自检过程中应显示超时消息。
    液晶屏(如果存在)将保持无文本状态。如果系统类型为模块化,则它可能无法在机箱中开机,因为它无法与 CMC 通信。
    在这种情况下, 请联系我们的支持团队

    要对此问题进行故障处理,请执行以下操作:
    1. 对于所有 iDRAC 系统,按住 i 按钮 16 秒钟。

    2. 对于具有 BMC 的系统或步骤 1 不起作用:

      1. 关闭服务器电源

      2. 从中拔下电源线。

      3. 按住电源按钮 10 秒

      4. 重新连接电源线

      5. 等待大约2分钟

      6. 重新打开服务器

    3. 对于具有 CMC 或 OME-M 的系统:

      1. 为所有依赖于机箱正常运行的服务器和连接的设备安排停机时间。

      2. 关闭服务器电源,然后关闭机箱电源

      3. 卸下电源线。

      4. 等待至少 10 分钟或按住开机按钮(如果有)。

      5. 重新连接电源线。

      6. 重新打开机箱,等待 20-30 分钟。

      7. 重新打开服务器。

      8. 全部恢复运行且没有任何错误或风扇噪音后,从外部重新连接到机箱。

      9. 如果安装了两个 CMC 或 OME-M,请按照故障切换过程故障切换到另一个设备。

      10. 如果仅安装了一个 CMC 或 OME-M,请从机箱中卸下模块,等待 2 分钟,然后重新插入模块,等待 20 分钟。

      11. 如果重新拔插模块或故障转移不起作用,则需要重新启动机箱才能完全重新初始化。

    如果您仍然遇到相同的风扇噪音,请继续浏览 列表

    安装了不受支持的硬件

    不受支持的硬件或未经认证或尚未经过认证的第三方供应商硬件可能会导致系统以高于正常水平甚至最大速度运行的风扇。

    要对此进行故障处理,请执行以下操作:
    1. 检查设备是否正常工作。

    2. 检查设备是否已正确安装 [安装在正确类型的插槽中(如果适用)]

    3. iDRAC 可能会为特定设备或在未知时以默认方式旋转风扇。

    4. 要在此处继续,请卸下第三方设备并查看风扇噪音是否恢复正常。

    5. 如果是,请咨询您的第三方供应商,了解他们是否知道任何缓解措施,或者对在 Dell PowerEdge 服务器中使用该设备有任何建议。

    提醒:戴尔无法支持您的第三方设备,也无法保证其在系统中的功能。
    如果您到目前为止已经遵循 了该列表,但仍需要更多支持,请继续遵循它。

    对需要安装不同类型的风扇的计算机的第二次 CPU 升级(取决于系统类型)或常规升级未完成

    如果您已升级系统或正在升级系统,则某些升级需要额外的部件(风扇、内存 DIMM)或不同的风扇类型(从标准升级到银牌甚至金牌风扇)。

    这些升级(非详尽列表,请咨询您的销售代表):
    1. 可购买单个 CPU 并可容纳 2 个 CPU 的系统的第二次 CPU 升级(取决于系统类型) 

      • 这可能需要移除挡片、具有相同步进的额外 CPU、额外的内存,并且通常还需要一个额外的风扇

      • 某些系统甚至可能需要将所有风扇从标准升级到银牌或金牌风扇(系统和升级特定要求)

    2. 支持该功能的系统的 GPU 或 GPGPU 升级

      • 这可能需要额外的转接卡和支持布线,但也需要额外的冷却,具体取决于原始布局和已安装的风扇。

    3. 其他 PCIe 卡或 NVME 驱动器

      • 在安装新部件后,可能需要进一步检查以确保一切都符合冷却预期,因为冷却要求可能要求额外的风扇或其他功能更强大的风扇类型。

    如果您已遵循这些操作,并确保到目前为止未列出此问题,请继续遵循 列表

    温度超出正常风扇速度范围(繁重的工作负载导致 CPU 利用率和温度升高、通风不畅)

    当系统处于高负载 CPU 下时,其他部件也会使用更多功率,这会导致比正常水平更高的冷却要求。
    此外,如果空气流通受到通风不良或通常视为灰尘堆积的障碍物的限制,则风扇速度可能会随着时间的推移而增加。

    检查以下步骤以查看此处存在的问题,以及可以采取哪些步骤来缓解或消除此问题:
    1. 检查 CPU 利用率是否处于持续的高负载 (90-100%) 下

      • 如果是这样,您可能需要检查为什么会出现这种情况,以及这是否是预期行为(这是正常工作负载导致的,还是未知的,例如,在最近更新或升级操作系统 (OS) 后开始发生的情况)

      • 如果行为不正常,请通过了解是哪个应用程序或服务导致高负载来进一步调查负载。

      • 如果该行为是由于看似正常的操作而发生的,并且最近没有对计算机软件进行更新(或重新启动,有意或无意),则您的计算机可能已达到其设计功能的最大值,并且您的工作负载已超出其运行的硬件。特别是如果您有多个具有相似负载、运行相似工作负载类型并且具有相同问题的系统,您需要与销售代表交谈,看看在扩展或升级方面可以采取哪些措施来解决这个问题。

    2. 检查进气孔是否受阻或受限,或者风扇本身是否受到任何形式的阻塞或限制

      • 随着时间的流逝,灰尘的堆积是相对正常的。根据具体情况,100%无尘环境有时很难维持甚至不切实际。因此,必须对机器进行定期维护,使机器免受灰尘影响并保持空气流动,并且应将其纳入所有维护计划中,每年至少进行一次(机器暴露在灰尘中的次数越多)。

      • 如果您发现通风口或风扇受阻,请为机器安排维护并清除所有灰尘和障碍物。您可以在 保持 Dell Technologies 设备清洁的指导中找到一些详细信息。

    如果您在执行此操作后遇到相同的问题,请进一步浏览 列表 。

    系统护盖关闭或安装不正确。防盗开关可能被触发或无法正常工作。

    某些系统要求关闭系统护盖,并使防盗开关处于关闭状态(按下)。如果未安装护盖并因此触发防盗开关,则作为预防措施,风扇速度将提高到最大值。
    这也可能是由于这些系统的防盗开关出现故障所致,因为损坏的开关始终处于打开状态,因此在这种情况下,总是会触发,指示系统护盖已打开。

    检查以下内容:
    1. 卸下系统护盖并重新安装,同时确保安装正确。

      • 在机架外有电源的测试台或工作台上测试这一点非常有用,以确保保存环境。

      • 这样还可以更好地查看系统护盖的贴合情况以及防盗开关固定器或开关本身的任何损坏情况。

    2. 检查开关是否正确就位,以及弹回时是否触发,按下时禁用。

      • 触发防盗开关会在系统事件日志中生成一个条目(可在系统的 iDRAC 中找到)

    3. 正确合上系统护盖,检查是否安装,并确保所有部件正确安装在一起。

    如果您在此之后仍需要进一步的帮助,请参阅 列表 以获取另一个主题。

    配置设置

    iDRAC 控制机器的散热设置,确保所有部件均正确冷却。可以手动更改这些设置,以提高或降低风扇速度的偏移量或更改默认散热配置文件。从默认配置文件更改配置文件也可以提高风扇速度。

    如果您不确定使用的设置,可以使用以下步骤重置设置:
    1. 在开机自检过程中,按 F2

    2. 选择 系统服务

    3. 在右下角 找到默认值并 按下它

    4. 选择“Exit

    5. 出现提示时,选择 保存并重新启动

    6. 重新启动后,在开机自检过程中再次按 F2 键

    7. 选择 iDRAC 设置>散热

    8. 确保未设置或选择任何设置,并且配置文件显示默认的热量配置文件设置(最大性能)。

    9. 完成并重新启动。

    如果您已经完成了这部分并且还没有找到解决方案,请考虑检查上面 的列表 。如果您已用尽此列表, 请收集支持日志文件 [TSR](技术支持报告)并 联系我们的支持团队。

    入口温度传感器故障,读出错误

    您可能会在 iDRAC 的系统事件日志 (SEL) 中遇到一条警告消息,提示入口温度发生故障或读数高于预期(测量时的环境温度与传感器输出不完全匹配)。传感器测量机器前端的温度,iDRAC 使用提供的数据来计算冷却需求。因此,故障或测量不正确的传感器将导致更高或最大的风扇速度。
    提醒:对于默认设置下的较低风扇速度和正常工作负载,典型入口温度范围介于 21°C 至 26°C(70°F 至 79°F)之间。服务器可以在较高温度下运行,但必须提高风扇速度以进行补偿。

    要对此问题进行故障处理,请执行以下操作:
    1. 检查 SEL 中的警告或错误消息

    2. 如果您尚未执行 固件部分中概述的操作,请按照该部分操作,以排除固件问题,因为不匹配信息。

    3. 所有固件更新完成后,再次检查 SEL。

    4. 在 iDRAC Web 界面中检查入口温度,查看它是否仍高于预期或读数根本不正常。

    5. 如果问题仍然存在, 请收集新的 TSR 并 联系我们的支持团队

      在这里,您可以返回 列表

    受影响的产品

    PowerEdge FX2/FX2s, PowerEdge M1000E, PowerEdge MX7000, PowerEdge R230, PowerEdge R240, PowerEdge R250, PowerEdge R260, PowerEdge R330, PowerEdge R340, PowerEdge R350, PowerEdge R360, PowerEdge R430, PowerEdge R440, PowerEdge R450, PowerEdge R530 , PowerEdge R530xd, PowerEdge R540, PowerEdge R550, PowerEdge R630, PowerEdge R640, PowerEdge R6415, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R660, PowerEdge R660xs, PowerEdge R6615, PowerEdge R6625, PowerEdge R730, PowerEdge R730xd, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R7415, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R760, PowerEdge R760XA, PowerEdge R760xd2, PowerEdge R760xs, PowerEdge R7615, PowerEdge R7625, PowerEdge R830, PowerEdge R840, PowerEdge R860, PowerEdge R930, PowerEdge R940, PowerEdge R940xa, PowerEdge R960, PowerEdge T130, PowerEdge T140, PowerEdge T150, PowerEdge T160, PowerEdge T330, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T430, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T630, PowerEdge T640, POWEREDGE VRTX