市值: $2.17T 0.51%
成交额(24h): $84.1809B 12.71%
恐惧与贪婪指数:

15 - 极度恐惧

  • 市值: $2.17T 0.51%
  • 成交额(24h): $84.1809B 12.71%
  • 恐惧与贪婪指数:
  • 市值: $2.17T 0.51%
加密货币
话题
百科
资讯
加密话题
视频
热门加密百科

选择语种

选择语种

选择货币

加密货币
话题
百科
资讯
加密话题
视频

如何解决带有服务器 PSU 的 GPU 挖矿设备的电源问题?

Dell PowerEdge PSUs with error codes like PSU0003 indicate input power failure—verify cable integrity, socket voltage (100–240V AC), and PSU compatibility; firmware updates are critical but cause guaranteed downtime.

2026/06/08 18:05

电源兼容性验证

1. 确认服务器PSU型号与制造商支持的GPU挖矿配置列表相匹配。标记为 PSU0001 至 PSU0003 的 Dell PowerEdge PSU 表示已知固件级与持续 GPU 负载周期不兼容。

2. 根据所有已安装 GPU 的总功耗交叉检查 PSU 的 12V 导轨电流额定值。单个NVIDIA A100在全哈希计算下功耗高达250W;四个这样的卡需要 12V 电源轨上至少 100A 的电流,不包括主板、风扇和存储负载。

3. 验证 PSU 的输出连接器是否包含额定连续输出功率为 75W 的本机 PCIe 8 针或 6+2 针电缆。从 SATA 或 Molex 转换为 PCIe 的适配器会在长时间挖矿过程中引入电压下降和热不稳定。

4. 检查 PSU 标签上的输入电压范围认证。标有“100–240V AC 自动调整范围”的装置可承受许多采矿设施运行的工业区常见的电网波动;固定输入 PSU 可能会在停电期间意外关闭。

热电负荷管理

1. 使用校准的热探头测量钻机底盘内的环境温度。服务器 PSU 在环境温度高于 40°C 时会降低输出;超过 45°C 的持续运行会触发内部限制,表现为间歇性 GPU 重置或内核电源事件 ID 41 日志。

2. 审核 PSU 的 iDRAC 或 IMM 界面中的风扇曲线。如果即使内部热敏电阻报告 >70°C,风扇速度仍保持静态低于 30%,则必须应用固件版本 ESE122T 或更高版本来恢复动态热响应。

3. 将标准 ATX 型机箱风扇替换为直接安装在 PSU 进气口上方的高静压 40 毫米或 60 毫米装置。 Lenovo ThinkSystem PSU 依赖于定向气流路径;通用机箱通风无法满足最低 CFM 要求。

4. 在 GPU 连接器 5 厘米范围内的所有 12V PCIe 电源线上安装铁氧体磁芯扼流圈。开关 PSU 产生的电磁噪声会干扰 GPU VRM 调节,导致欠压故障在 dmesg 输出中记录为“GPU 从 PCIe 总线掉落”。

固件和配置更新

1. 通过 ipmitool 提取当前 PSU 固件版本: ipmitool -I lanplus -H [BMC_IP] -U root -P calvin raw 0x30 0x09 。 AFE128B 之前的版本在同时 GPU 通电序列期间会出现时序错误。

2. 如果安装了 GPU 适配器,请禁用 UEFI BIOS 中的 Misc Option3。将此设置保留为默认值会强制采用激进的功率上限逻辑,与 ASIC 优化的挖矿工作负载不兼容。

3. 仅在计划的维护时段内应用 PSU 固件更新。电源更新可保证系统停机,并且如果在闪存中途中断,可能会导致设备变砖——不存在回滚选项。

4. 更新后,在系统完全断电并拔下插头的情况下重新安装所有 PCIe 电源线。镀金触点上的微氧化会导致间歇性电阻峰值,GPU 固件将其误解为 PSU 故障。

GPU 特定的电源路径诊断

1. 运行nvidia-smi -q -d POWER以捕获实时 GPU 功耗。值在 10 秒间隔内波动超过 ±8W 表明 PSU 调节不稳定,而不是驱动器问题。

2. 在 Linux 主机上监控cat /sys/class/power_supply/psu*/online 。值“0”表示 PSU 通信丢失,通常是由多个 GPU 电源控制器和 PSU 的 BMC 之间的 I²C 总线争用引起的。

3. 使用已知稳定的 ATX PSU 单独测试每个 GPU。如果不稳定现象消失,服务器 PSU 的瞬态响应时间将无法满足 NVIDIA PCIe 规范要求,即从 20% 负载阶跃变化恢复 <50μs。

4. 在将故障归因于硬件之前,检查“nouveau”模块冲突。该开源驱动程序会劫持 PCIe 电源管理寄存器,从而阻止在深度睡眠转换期间与服务器级 PSU 进行正确的握手。

常见问题解答

问:我可以使用 Dell R740 的双冗余 PSU 为八个 RTX 4090 供电吗?不会。戴尔 R740 PSU 结合共享 12V 导轨设计仅提供 1600W 功率。八个 RTX 4090 至少需要 3200W 的功率,并具有隔离的 12V 电源轨,以防止跨卡电压崩溃。

问:为什么我的设备仅在 DAG 纪元转换期间崩溃? DAG 文件重新加载会使 GPU 内存带宽需求增加 400%。没有快速瞬态响应电容器的服务器电源无法在这种微秒级浪涌下保持稳定的 12V,从而触发硬件级 OVP 关闭。

问:通过 IPMI 禁用 PSU 风扇控制以降低噪音是否安全?不安全。服务器 PSU 缺乏被动冷却功能。禁用风扇控制可能会导致 80% 负载下 90 秒内发生热失控,从而永久损坏 MOSFET 并触发不可逆的固件锁定。

问:Lenovo ThinkSystem PSU 支持 PCIe Gen5 GPU 电源排序吗?仅附带固件 ESE122T 或更高版本的型号支持 Gen5 功率斜坡时序。早期版本与 RTX 40 系列卡的握手失败,导致尽管存在物理 x16 插槽,但仍出现“PCIe 链路宽度减少至 x1”错误。

免责声明:info@kdj.com

所提供的信息并非交易建议。根据本文提供的信息进行的任何投资,kdj.com不承担任何责任。加密货币具有高波动性,强烈建议您深入研究后,谨慎投资!

如您认为本网站上使用的内容侵犯了您的版权,请立即联系我们(info@kdj.com),我们将及时删除。

相关百科

如何使用 GPU 挖掘 Iron Fish 并设置钱包进行支付?

如何使用 GPU 挖掘 Iron Fish 并设置钱包进行支付?

2026-06-02 02:39:59

市场波动模式1. 自2021年以来,Bitcoin超过68%的交易日在24小时窗口内价格波动超过15%。 2. 在流动性较低的时期,尤其是在 02:00 至 06:00 UTC 期间,以太坊表现出比 Bitcoin 更高的日内波动性。 3. 稳定币脱钩事件(例如 2023 年 3 月的 USDC 事...

如何在市场上出售旧的挖矿 GPU 而不会被骗?

如何在市场上出售旧的挖矿 GPU 而不会被骗?

2026-06-03 02:20:24

Bitcoin 减半机制1. Bitcoin 的协议强制执行固定的发行时间表,其中大约每 210,000 个区块,区块奖励就会减少一半。 2. 该事件大约每四年发生一次,直接减少了新进入流通的 BTC 数量。 3.截至2020年减半,矿工每区块获得6.25 BTC;下一次减少将达到 3.125 BT...

断电后如何修复我的蚂蚁矿机上的“chip bin”错误?

断电后如何修复我的蚂蚁矿机上的“chip bin”错误?

2026-06-08 08:20:16

Bitcoin 减半机制1. Bitcoin 的协议强制执行固定的发行时间表,其中大约每 210,000 个区块,区块奖励就会减少一半。 2. 该事件大约每四年发生一次,直接减少每个区块新进入流通的 BTC 数量。 3.截至2020年减半,矿工每区块获得6.25 BTC;下一次减少将使其达到 3.1...

如何设置 Telegram 机器人在我的矿机离线时提醒我?

如何设置 Telegram 机器人在我的矿机离线时提醒我?

2026-05-30 19:19:48

Bitcoin 减半机制1. Bitcoin 的协议强制执行固定的发行时间表,其中大约每 210,000 个区块,区块奖励就会减少一半。 2. 该事件大约每四年发生一次,直接减少了新进入流通的 BTC 数量。 3.截至2020年减半,矿工每区块获得6.25 BTC;下一次减少将达到 3.125 BT...

如何修复我的 GPU 在连续挖掘数月后显示伪影的问题?

如何修复我的 GPU 在连续挖掘数月后显示伪影的问题?

2026-06-02 01:59:50

Bitcoin 减半机制1. Bitcoin 的协议强制执行 2100 万个代币的固定供应上限,并通过向矿工提供区块奖励引入新代币。 2. 每 210,000 个区块(大约每四年),区块奖励就会减少一半,这一事件称为减半。 3. 最近一次减半发生在 2024 年 4 月,每个区块的奖励从 6.25 ...

如何使用KA3矿机进行嘉手纳挖矿并排除常见错误?

如何使用KA3矿机进行嘉手纳挖矿并排除常见错误?

2026-05-29 22:19:32

市场波动模式1. 自2021年以来,Bitcoin超过68%的交易日在24小时窗口内价格波动超过15%。 2. 在流动性较低的时期,尤其是在 02:00 至 06:00 UTC 期间,以太坊表现出比 Bitcoin 更高的日内波动性。 3. 稳定币脱钩事件(例如 2023 年 3 月的 USDC 事...

如何使用 GPU 挖掘 Iron Fish 并设置钱包进行支付?

如何使用 GPU 挖掘 Iron Fish 并设置钱包进行支付?

2026-06-02 02:39:59

市场波动模式1. 自2021年以来,Bitcoin超过68%的交易日在24小时窗口内价格波动超过15%。 2. 在流动性较低的时期,尤其是在 02:00 至 06:00 UTC 期间,以太坊表现出比 Bitcoin 更高的日内波动性。 3. 稳定币脱钩事件(例如 2023 年 3 月的 USDC 事...

如何在市场上出售旧的挖矿 GPU 而不会被骗?

如何在市场上出售旧的挖矿 GPU 而不会被骗?

2026-06-03 02:20:24

Bitcoin 减半机制1. Bitcoin 的协议强制执行固定的发行时间表,其中大约每 210,000 个区块,区块奖励就会减少一半。 2. 该事件大约每四年发生一次,直接减少了新进入流通的 BTC 数量。 3.截至2020年减半,矿工每区块获得6.25 BTC;下一次减少将达到 3.125 BT...

断电后如何修复我的蚂蚁矿机上的“chip bin”错误?

断电后如何修复我的蚂蚁矿机上的“chip bin”错误?

2026-06-08 08:20:16

Bitcoin 减半机制1. Bitcoin 的协议强制执行固定的发行时间表,其中大约每 210,000 个区块,区块奖励就会减少一半。 2. 该事件大约每四年发生一次,直接减少每个区块新进入流通的 BTC 数量。 3.截至2020年减半,矿工每区块获得6.25 BTC;下一次减少将使其达到 3.1...

如何设置 Telegram 机器人在我的矿机离线时提醒我?

如何设置 Telegram 机器人在我的矿机离线时提醒我?

2026-05-30 19:19:48

Bitcoin 减半机制1. Bitcoin 的协议强制执行固定的发行时间表,其中大约每 210,000 个区块,区块奖励就会减少一半。 2. 该事件大约每四年发生一次,直接减少了新进入流通的 BTC 数量。 3.截至2020年减半,矿工每区块获得6.25 BTC;下一次减少将达到 3.125 BT...

如何修复我的 GPU 在连续挖掘数月后显示伪影的问题?

如何修复我的 GPU 在连续挖掘数月后显示伪影的问题?

2026-06-02 01:59:50

Bitcoin 减半机制1. Bitcoin 的协议强制执行 2100 万个代币的固定供应上限,并通过向矿工提供区块奖励引入新代币。 2. 每 210,000 个区块(大约每四年),区块奖励就会减少一半,这一事件称为减半。 3. 最近一次减半发生在 2024 年 4 月,每个区块的奖励从 6.25 ...

如何使用KA3矿机进行嘉手纳挖矿并排除常见错误?

如何使用KA3矿机进行嘉手纳挖矿并排除常见错误?

2026-05-29 22:19:32

市场波动模式1. 自2021年以来,Bitcoin超过68%的交易日在24小时窗口内价格波动超过15%。 2. 在流动性较低的时期,尤其是在 02:00 至 06:00 UTC 期间,以太坊表现出比 Bitcoin 更高的日内波动性。 3. 稳定币脱钩事件(例如 2023 年 3 月的 USDC 事...

查看所有文章

User not found or password invalid

Your input is correct