$87959.907984 USD

1.34%

ethereum

$2920.497338 USD

3.04%

tether

$0.999775 USD

0.00%

xrp

$2.237324 USD

8.12%

bnb

$860.243768 USD

0.90%

solana

$138.089498 USD

5.43%

usd-coin

$0.999807 USD

0.01%

tron

$0.272801 USD

-1.53%

dogecoin

$0.150904 USD

2.96%

cardano

$0.421635 USD

1.97%

hyperliquid

$32.152445 USD

2.23%

bitcoin-cash

$533.301069 USD

-1.94%

chainlink

$12.953417 USD

2.68%

unus-sed-leo

$9.535951 USD

0.73%

zcash

$521.483386 USD

-2.87%

Articles d’actualité sur les crypto-monnaies

Nvidia Rubin CPX: révolutionner les performances d'inférence avec un grand contexte AI

Sep 09, 2025 at 11:00 pm

Explorez comment Nvidia Rubin CPX transforme les performances d'inférence pour les charges de travail de contexte important, offrant une efficacité et un retour sur investissement inégalés.

The AI landscape is rapidly evolving, with inference becoming the new frontier. NVIDIA's Rubin CPX GPU is designed to meet the demands of long-context AI workloads with greater efficiency and ROI.

Le paysage de l'IA évolue rapidement, l'inférence devenant la nouvelle frontière. Le GPU Rubin CPX de Nvidia est conçu pour répondre aux exigences des charges de travail AI à long terme avec plus d'efficacité et un ROI.

The Rise of Long-Context AI

La montée de l'IA à long contexte

Modern AI models are now capable of multi-step reasoning and long-horizon context, enabling them to tackle complex tasks. Processing massive context has become increasingly critical, particularly in areas like software development and video generation. These applications demand sustained coherence and memory across millions of tokens, pushing the boundaries of current infrastructure.

Les modèles d'IA modernes sont désormais capables d'un raisonnement en plusieurs étapes et d'un contexte à long horizon, leur permettant de s'attaquer aux tâches complexes. Le traitement du contexte massif est devenu de plus en plus critique, en particulier dans des domaines tels que le développement de logiciels et la génération de vidéos. Ces applications exigent une cohérence et une mémoire soutenues à des millions de jetons, repoussant les limites de l'infrastructure actuelle.

NVIDIA's SMART Framework and Disaggregated Inference

Le cadre intelligent de Nvidia et l'inférence désagrégée

To address this shift, the NVIDIA SMART framework optimizes inference across scale, performance, architecture, ROI, and the broader ecosystem. Disaggregated inference enables the context and generation phases to be processed independently, optimizing compute and memory resources. This improves throughput, reduces latency, and enhances overall resource utilization.

Pour résoudre ce changement, le cadre intelligent NVIDIA optimise l'inférence à travers l'échelle, les performances, l'architecture, le ROI et l'écosystème plus large. L'inférence désagrégée permet de traiter les phases de contexte et de génération indépendamment, optimisant les ressources de calcul et de mémoire. Cela améliore le débit, réduit la latence et améliore l'utilisation globale des ressources.

Introducing NVIDIA Rubin CPX

Présentation de Nvidia Rubin CPX

NVIDIA is introducing the Rubin CPX GPU, a purpose-built solution designed to deliver high-throughput performance for high-value, long-context inference workloads. Built with the Rubin architecture, it features 30 petaFLOPs of NVFP4 compute, 128 GB of GDDR7 memory, and 3x attention acceleration. Optimized for processing long sequences, Rubin CPX enhances throughput and responsiveness, maximizing ROI for large-scale generative AI workloads.

NVIDIA introduit le GPU Rubin CPX, une solution spécialement conçue pour offrir des performances à haut débit pour des charges de travail d'inférence à grande valeur et à long terme. Construit avec l'architecture Rubin, il comprend 30 Petaflops de calcul NVFP4, 128 Go de mémoire GDDR7 et 3x accélération d'attention. Optimisé pour le traitement de longues séquences, Rubin CPX améliore le débit et la réactivité, maximisant le retour sur investissement pour les charges de travail générationnaires à grande échelle.

The NVIDIA Vera Rubin NVL144 CPX Rack

Le nvidia Vera Rubin NVL144 CPX Rack

Rubin CPX works in tandem with NVIDIA Vera CPUs and Rubin GPUs for generation-phase processing, forming a complete, high-performance disaggregated serving solution. The NVIDIA Vera Rubin NVL144 CPX rack integrates 144 Rubin CPX GPUs, 144 Rubin GPUs, and 36 Vera CPUs to deliver 8 exaFLOPs of NVFP4 compute and 100 TB of high-speed memory.

Rubin CPX fonctionne en tandem avec des processeurs NVIDIA VERA et des GPU Rubin pour le traitement en phase de génération, formant une solution de service désagrégée complète et haute performance. Le nvidia Vera Rubin NVL144 CPX Rack intègre 144 GPU Rubin CPX, 144 GPU Rubin et 36 CPU VERA pour fournir 8 exaflops de calcul NVFP4 et 100 To de mémoire à grande vitesse.

Real-World Impact and ROI

Impact réel et retour sur investissement

At scale, the platform can deliver a 30x to 50x return on investment, translating to as much as $5B in revenue from a $100M CAPEX investment. By combining disaggregated infrastructure, acceleration, and full-stack orchestration, Vera Rubin NVL144 CPX redefines what’s possible for enterprises building the next generation of generative AI applications.

À l'échelle, la plate-forme peut livrer un retour sur investissement de 30x à 50x, traduisant jusqu'à 5 milliards de dollars de revenus d'un investissement CAPEX de 100 millions de dollars. En combinant l'infrastructure, l'accélération et l'orchestration complète de l'emplacement complet, Vera Rubin NVL144 CPX redéfinit ce qui est possible pour les entreprises qui construisent la prochaine génération d'applications d'IA génératrices.

Conclusion

The NVIDIA Rubin CPX GPU and the NVIDIA Vera Rubin NVL144 CPX rack represent a new standard for full-stack AI infrastructure, creating new possibilities for workloads like advanced software coding and generative video. It's an exciting time to be in AI, and NVIDIA is leading the charge!

Le NVIDIA Rubin CPX GPU et le nvidia Vera Rubin NVL144 CPX Rack représentent une nouvelle norme pour l'infrastructure IA complète, créant de nouvelles possibilités de charges de travail telles que le codage logiciel avancé et la vidéo générative. C'est une période passionnante pour être dans l'IA, et Nvidia mène la charge!

Source primaire：nvidia

Clause de non-responsabilité:info@kdj.com

Les informations fournies ne constituent pas des conseils commerciaux. kdj.com n’assume aucune responsabilité pour les investissements effectués sur la base des informations fournies dans cet article. Les crypto-monnaies sont très volatiles et il est fortement recommandé d’investir avec prudence après une recherche approfondie！

Si vous pensez que le contenu utilisé sur ce site Web porte atteinte à vos droits d’auteur, veuillez nous contacter immédiatement (info@kdj.com) et nous le supprimerons dans les plus brefs délais.

Autres articles publiés sur Jul 03, 2026

Plus