-
bitcoin $87959.907984 USD
1.34% -
ethereum $2920.497338 USD
3.04% -
tether $0.999775 USD
0.00% -
xrp $2.237324 USD
8.12% -
bnb $860.243768 USD
0.90% -
solana $138.089498 USD
5.43% -
usd-coin $0.999807 USD
0.01% -
tron $0.272801 USD
-1.53% -
dogecoin $0.150904 USD
2.96% -
cardano $0.421635 USD
1.97% -
hyperliquid $32.152445 USD
2.23% -
bitcoin-cash $533.301069 USD
-1.94% -
chainlink $12.953417 USD
2.68% -
unus-sed-leo $9.535951 USD
0.73% -
zcash $521.483386 USD
-2.87%
如何解決具有伺服器 PSU 的 GPU 挖礦設備的電源問題?
Dell PowerEdge PSUs with error codes like PSU0003 indicate input power failure—verify cable integrity, socket voltage (100–240V AC), and PSU compatibility; firmware updates are critical but cause guaranteed downtime.
2026/06/08 18:05
電源相容性驗證
1. 確認伺服器PSU型號與製造商支援的GPU挖礦配置清單相符。標記為 PSU0001 至 PSU0003 的 Dell PowerEdge PSU 表示已知韌體等級與持續 GPU 負載週期不相容。
2. 根據所有已安裝 GPU 的總功耗交叉檢查 PSU 的 12V 導軌電流額定值。單一NVIDIA A100在全哈希計算下功耗高達250W;四個這樣的卡片需要 12V 電源軌上至少 100A 的電流,不包括主機板、風扇和儲存負載。
3. 驗證 PSU 的輸出連接器是否包含額定連續輸出功率為 75W 的本機 PCIe 8 針或 6+2 針電纜。從 SATA 或 Molex 轉換為 PCIe 的適配器會在長時間挖礦過程中引入電壓下降和熱不穩定。
4. 檢查 PSU 標籤上的輸入電壓範圍認證。標示「100–240V AC 自動調整範圍」的裝置可承受許多採礦設施運作的工業區常見的電網波動;固定輸入 PSU 可能會在停電期間意外關閉。
熱電負載管理
1. 使用校準的熱探頭測量鑽孔機底盤內的環境溫度。伺服器 PSU 在環境溫度高於 40°C 時會降低輸出;超過 45°C 的持續運作會觸發內部限制,表現為間歇性 GPU 重設或核心電源事件 ID 41 日誌。
2. 審核 PSU 的 iDRAC 或 IMM 介面中的風扇曲線。如果即使內部熱敏電阻報告 >70°C,風扇速度仍保持靜態低於 30%,則必須套用韌體版本 ESE122T 或更高版本來恢復動態熱響應。
3. 將標準 ATX 型機殼風扇替換為直接安裝在 PSU 進氣口上方的高靜壓 40 毫米或 60 毫米裝置。 Lenovo ThinkSystem PSU 依賴定向氣流路徑;通用機箱通風無法滿足最低 CFM 要求。
4. 在 GPU 連接器 5 公分範圍內的所有 12V PCIe 電源線上安裝鐵氧體磁芯扼流圈。開關 PSU 產生的電磁雜訊會幹擾 GPU VRM 調節,導致欠壓故障在 dmesg 輸出中記錄為「GPU 從 PCIe 匯流排掉落」。
韌體和配置更新
1. 透過 ipmitool 提取目前 PSU 韌體版本: ipmitool -I lanplus -H [BMC_IP] -U root -P calvin raw 0x30 0x09 。 AFE128B 之前的版本在同時 GPU 通電序列期間會出現時序錯誤。
2. 如果安裝了 GPU 適配器,請停用 UEFI BIOS 中的 Misc Option3。將此設定保留為預設值會強制採用激進的功率上限邏輯,與 ASIC 最佳化的挖礦工作負載不相容。
3. 僅在計畫的維護時段內套用 PSU 韌體更新。電源更新可確保系統停機,如果在快閃記憶體中途中斷,可能會導致裝置變磚-不存在回滾選項。
4. 更新後,在系統完全斷電並拔下插頭的情況下重新安裝所有 PCIe 電源線。鍍金觸點上的微氧化會導致間歇性電阻峰值,GPU 韌體將其誤解為 PSU 故障。
GPU 特定的電源路徑診斷
1. 運行nvidia-smi -q -d POWER以捕獲實時 GPU 功耗。值在 10 秒間隔內波動超過 ±8W 表示 PSU 調節不穩定,而不是驅動器問題。
2. 在 Linux 主機上監控cat /sys/class/power_supply/psu*/online 。值「0」表示 PSU 通訊遺失,通常是由多個 GPU 電源控制器和 PSU 的 BMC 之間的 I²C 匯流排爭用引起的。
3. 使用已知穩定的 ATX PSU 單獨測試每個 GPU。如果不穩定現象消失,伺服器 PSU 的瞬態回應時間將無法滿足 NVIDIA PCIe 規範要求,即從 20% 負載階躍變化恢復 <50μs。
4. 在將故障歸因於硬體之前,檢查「nouveau」模組衝突。此開源驅動程式會劫持 PCIe 電源管理暫存器,從而阻止在深度睡眠轉換期間與伺服器級 PSU 進行正確的握手。
常見問題解答
Q:我可以使用 Dell R740 的雙冗餘 PSU 為八個 RTX 4090 供電嗎?不會。戴爾 R740 PSU 結合共享 12V 導軌設計僅提供 1600W 功率。八個 RTX 4090 至少需要 3200W 的功率,並具有隔離的 12V 電源軌,以防止跨卡電壓崩潰。
Q:為什麼我的設備僅在 DAG 紀元轉換期間崩潰? DAG 檔案重新載入會使 GPU 記憶體頻寬需求增加 400%。沒有快速瞬態響應電容器的伺服器電源無法在這種微秒級突波下保持穩定的 12V,從而觸發硬體級 OVP 關閉。
Q:透過 IPMI 停用 PSU 風扇控制以降低噪音是否安全?不安全。伺服器 PSU 缺乏被動冷卻功能。停用風扇控制可能會導致 80% 負載下 90 秒內發生熱失控,永久損壞 MOSFET 並觸發不可逆的韌體鎖定。
Q:Lenovo ThinkSystem PSU 支援 PCIe Gen5 GPU 電源排序嗎?僅附帶韌體 ESE122T 或更高版本的型號支援 Gen5 功率斜坡時序。早期版本與 RTX 40 系列卡的握手失敗,導致儘管存在實體 x16 插槽,但仍出現「PCIe 連結寬度減少至 x1」錯誤。
免責聲明:info@kdj.com
所提供的資訊並非交易建議。 kDJ.com對任何基於本文提供的資訊進行的投資不承擔任何責任。加密貨幣波動性較大,建議您充分研究後謹慎投資!
如果您認為本網站使用的內容侵犯了您的版權,請立即聯絡我們(info@kdj.com),我們將及時刪除。
- 比特幣、eCash 分叉和空投動態:深入探討加密貨幣的最新爭議
- 2026-05-03 12:55:01
- 2026 年邁阿密共識:Web3、區塊鏈、加密貨幣、NFT、Metaverse,會議,5 月 5 日 — 華爾街與數位前沿相遇的地方
- 2026-05-02 12:45:01
- 聯準會維持利率穩定,地緣政治緊張局勢引發比特幣價格下跌
- 2026-05-01 06:45:01
- 比特幣礦工為電網供電:收購俄亥俄州天然氣廠開啟數位黃金新時代
- 2026-05-01 00:45:01
- MegaETH的MEGA代幣登陸紐約:為即時區塊鏈設定新的效能基準
- 2026-05-01 00:55:01
- Solana 的滑坡:價格預測顯示阻力損失和潛在的進一步下跌
- 2026-05-01 06:45:01
相關知識
如何使用 GPU 挖掘 Iron Fish 並設定錢包進行付款?
2026-06-02 02:39:59
市場波動模式1. 自2021年以來,Bitcoin超過68%的交易日在24小時窗口內價格波動超過15%。 2. 在流動性較低的時期,尤其是在 02:00 至 06:00 UTC 期間,以太坊表現出比 Bitcoin 更高的日內波動性。 3. 穩定幣脫鉤事件(例如 2023 年 3 月的 USDC 事...
如何在市場上出售舊的挖礦 GPU 而不會被騙?
2026-06-03 02:20:24
Bitcoin 減半機制1. Bitcoin 的協議強制執行固定的發行時間表,其中大約每 210,000 個區塊,區塊獎勵就會減少一半。 2. 該事件大約每四年發生一次,直接減少了新進入流通的 BTC 數量。 3.截至2020年減半,礦工每區塊獲得6.25 BTC;下次減少將達到 3.125 BTC...
斷電後如何修復我的螞蟻礦機上的“chip bin”錯誤?
2026-06-08 08:20:16
Bitcoin 減半機制1. Bitcoin 的協議強制執行固定的發行時間表,其中大約每 210,000 個區塊,區塊獎勵就會減少一半。 2. 該事件大約每四年發生一次,直接減少每個區塊新進入流通的 BTC 數量。 3.截至2020年減半,礦工每區塊獲得6.25 BTC;下一次減少將使其達到 3.1...
如何設定 Telegram 機器人在我的礦機離線時提醒我?
2026-05-30 19:19:48
Bitcoin 減半機制1. Bitcoin 的協議強制執行固定的發行時間表,其中大約每 210,000 個區塊,區塊獎勵就會減少一半。 2. 該事件大約每四年發生一次,直接減少了新進入流通的 BTC 數量。 3.截至2020年減半,礦工每區塊獲得6.25 BTC;下次減少將達到 3.125 BTC...
如何修復我的 GPU 在連續挖掘數月後顯示偽影的問題?
2026-06-02 01:59:50
Bitcoin 減半機制1. Bitcoin 的協議強制執行 2,100 萬個代幣的固定供應上限,並透過向礦工提供區塊獎勵引入新代幣。 2. 每 21 萬個區塊(大約每四年),區塊獎勵就會減少一半,這事件稱為減半。 3. 最近一次減半發生在 2024 年 4 月,每個區塊的獎勵從 6.25 BTC ...
如何使用KA3礦機進行嘉手納挖礦並排除常見錯誤?
2026-05-29 22:19:32
市場波動模式1. 自2021年以來,Bitcoin超過68%的交易日在24小時窗口內價格波動超過15%。 2. 在流動性較低的時期,尤其是在 02:00 至 06:00 UTC 期間,以太坊表現出比 Bitcoin 更高的日內波動性。 3. 穩定幣脫鉤事件(例如 2023 年 3 月的 USDC 事...
如何使用 GPU 挖掘 Iron Fish 並設定錢包進行付款?
2026-06-02 02:39:59
市場波動模式1. 自2021年以來,Bitcoin超過68%的交易日在24小時窗口內價格波動超過15%。 2. 在流動性較低的時期,尤其是在 02:00 至 06:00 UTC 期間,以太坊表現出比 Bitcoin 更高的日內波動性。 3. 穩定幣脫鉤事件(例如 2023 年 3 月的 USDC 事...
如何在市場上出售舊的挖礦 GPU 而不會被騙?
2026-06-03 02:20:24
Bitcoin 減半機制1. Bitcoin 的協議強制執行固定的發行時間表,其中大約每 210,000 個區塊,區塊獎勵就會減少一半。 2. 該事件大約每四年發生一次,直接減少了新進入流通的 BTC 數量。 3.截至2020年減半,礦工每區塊獲得6.25 BTC;下次減少將達到 3.125 BTC...
斷電後如何修復我的螞蟻礦機上的“chip bin”錯誤?
2026-06-08 08:20:16
Bitcoin 減半機制1. Bitcoin 的協議強制執行固定的發行時間表,其中大約每 210,000 個區塊,區塊獎勵就會減少一半。 2. 該事件大約每四年發生一次,直接減少每個區塊新進入流通的 BTC 數量。 3.截至2020年減半,礦工每區塊獲得6.25 BTC;下一次減少將使其達到 3.1...
如何設定 Telegram 機器人在我的礦機離線時提醒我?
2026-05-30 19:19:48
Bitcoin 減半機制1. Bitcoin 的協議強制執行固定的發行時間表,其中大約每 210,000 個區塊,區塊獎勵就會減少一半。 2. 該事件大約每四年發生一次,直接減少了新進入流通的 BTC 數量。 3.截至2020年減半,礦工每區塊獲得6.25 BTC;下次減少將達到 3.125 BTC...
如何修復我的 GPU 在連續挖掘數月後顯示偽影的問題?
2026-06-02 01:59:50
Bitcoin 減半機制1. Bitcoin 的協議強制執行 2,100 萬個代幣的固定供應上限,並透過向礦工提供區塊獎勵引入新代幣。 2. 每 21 萬個區塊(大約每四年),區塊獎勵就會減少一半,這事件稱為減半。 3. 最近一次減半發生在 2024 年 4 月,每個區塊的獎勵從 6.25 BTC ...
如何使用KA3礦機進行嘉手納挖礦並排除常見錯誤?
2026-05-29 22:19:32
市場波動模式1. 自2021年以來,Bitcoin超過68%的交易日在24小時窗口內價格波動超過15%。 2. 在流動性較低的時期,尤其是在 02:00 至 06:00 UTC 期間,以太坊表現出比 Bitcoin 更高的日內波動性。 3. 穩定幣脫鉤事件(例如 2023 年 3 月的 USDC 事...
看所有文章














