|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Nachrichtenartikel zu Kryptowährungen
Apple und NVIDIA arbeiten zusammen, um eine schnellere Textgenerierungsleistung mit großen Sprachmodellen zu implementieren
Dec 19, 2024 at 05:33 am
In einem heutigen Blogbeitrag haben Apple-Ingenieure neue Details zu einer Zusammenarbeit mit NVIDIA mitgeteilt, um eine schnellere Textgenerierungsleistung mit großen Sprachmodellen zu implementieren.

Apple engineers have shared new details on a collaboration with NVIDIA to implement faster text generation performance with large language models (LLMs).
Apple-Ingenieure haben neue Details zu einer Zusammenarbeit mit NVIDIA bekannt gegeben, um eine schnellere Textgenerierungsleistung mit großen Sprachmodellen (LLMs) zu implementieren.
Earlier this year, Apple published and open sourced its Recurrent Drafter (ReDrafter) technique, a new method for generating text with LLMs that’s significantly faster and “achieves state of the art performance.” It combines two techniques: beam search (to explore multiple possibilities) and dynamic tree attention (to efficiently handle choices).
Anfang dieses Jahres hat Apple seine Recurrent Drafter (ReDrafter)-Technik veröffentlicht und als Open Source bereitgestellt, eine neue Methode zur Textgenerierung mit LLMs, die deutlich schneller ist und „eine Leistung auf dem neuesten Stand der Technik erreicht“. Es kombiniert zwei Techniken: Strahlsuche (um mehrere Möglichkeiten zu erkunden) und dynamische Baumaufmerksamkeit (um Entscheidungen effizient zu handhaben).
While its research demonstrated strong results, Apple also collaborated with NVIDIA to apply ReDrafter in production. As part of this collaboration, ReDrafter was integrated into NVIDIA TensorRT-LLM, a tool that helps run LLMs faster on NVIDIA GPUs.
Während seine Forschung starke Ergebnisse lieferte, arbeitete Apple auch mit NVIDIA zusammen, um ReDrafter in der Produktion einzusetzen. Im Rahmen dieser Zusammenarbeit wurde ReDrafter in NVIDIA TensorRT-LLM integriert, ein Tool, das dabei hilft, LLMs schneller auf NVIDIA-GPUs auszuführen.
Here are the results:
Hier sind die Ergebnisse:
To enable the integration of ReDrafter, NVIDIA added new operators or exposed existing ones, which considerably improved TensorRT-LLM’s capability to accommodate sophisticated models and decoding methods. ML developers using NVIDIA GPUs can now easily benefit from ReDrafter’s accelerated token generation for their production LLM applications with TensorRT-LLM.
Um die Integration von ReDrafter zu ermöglichen, fügte NVIDIA neue Operatoren hinzu oder machte bestehende verfügbar, was die Fähigkeit von TensorRT-LLM, anspruchsvolle Modelle und Decodierungsmethoden zu unterstützen, erheblich verbesserte. ML-Entwickler, die NVIDIA-GPUs verwenden, können jetzt problemlos von der beschleunigten Token-Generierung von ReDrafter für ihre Produktions-LLM-Anwendungen mit TensorRT-LLM profitieren.
In benchmarking a tens-of-billions parameter production model on NVIDIA GPUs, using the NVIDIA TensorRT-LLM inference acceleration framework with ReDrafter, we have seen 2.7x speed-up in generated tokens per second for greedy decoding. These benchmark results indicate this tech could significantly reduce latency users may experience, while also using fewer GPUs and consuming less power.
Beim Benchmarking eines Produktionsmodells mit mehreren zehn Milliarden Parametern auf NVIDIA-GPUs unter Verwendung des NVIDIA TensorRT-LLM-Inferenzbeschleunigungs-Frameworks mit ReDrafter haben wir eine 2,7-fache Beschleunigung der generierten Token pro Sekunde für gierige Dekodierung festgestellt. Diese Benchmark-Ergebnisse deuten darauf hin, dass diese Technologie die für Benutzer möglicherweise auftretende Latenz erheblich reduzieren könnte, während gleichzeitig weniger GPUs verwendet und weniger Strom verbraucht werden.
“LLMs are increasingly being used to power production applications, and improving inference efficiency can both impact computational costs and reduce latency for users,” Apple’s machine learning researchers conclude. “With ReDrafter’s novel approach to speculative decoding integrated into the NVIDIA TensorRT-LLM framework, developers can now benefit from faster token generation on NVIDIA GPUs for their production LLM applications.”
„LLMs werden zunehmend zur Stromversorgung von Produktionsanwendungen eingesetzt, und eine Verbesserung der Inferenzeffizienz kann sich sowohl auf die Rechenkosten auswirken als auch die Latenz für Benutzer verringern“, schließen die Apple-Forscher für maschinelles Lernen. „Mit dem neuartigen Ansatz von ReDrafter zur spekulativen Dekodierung, der in das NVIDIA TensorRT-LLM-Framework integriert ist, können Entwickler jetzt von einer schnelleren Token-Generierung auf NVIDIA-GPUs für ihre Produktions-LLM-Anwendungen profitieren.“
You can learn more about this work on Apple’s website and in a blog post on NVIDIA’s website.
Mehr über diese Arbeit erfahren Sie auf der Website von Apple und in einem Blogbeitrag auf der Website von NVIDIA.
Haftungsausschluss:info@kdj.com
Die bereitgestellten Informationen stellen keine Handelsberatung dar. kdj.com übernimmt keine Verantwortung für Investitionen, die auf der Grundlage der in diesem Artikel bereitgestellten Informationen getätigt werden. Kryptowährungen sind sehr volatil und es wird dringend empfohlen, nach gründlicher Recherche mit Vorsicht zu investieren!
Wenn Sie glauben, dass der auf dieser Website verwendete Inhalt Ihr Urheberrecht verletzt, kontaktieren Sie uns bitte umgehend (info@kdj.com) und wir werden ihn umgehend löschen.
-
-
- Konsens 2026 Miami: Web3, Blockchain, Kryptowährung, NFTs, Metaverse, Konferenz, 5. Mai – Wo die Wall Street auf die digitale Grenze trifft
- May 01, 2026 at 11:27 pm
- In Miami herrscht Aufregung, während sich am 5. Mai der Konsens 2026 nähert, der Web3, Blockchain, Krypto, NFTs und den Wandel des Metaversums vom Hype zur institutionellen und nachhaltigen Realität hervorhebt.
-
- Die Fed hält die Zinsen stabil, was inmitten geopolitischer Spannungen einen Bitcoin-Preisverfall auslöst
- May 01, 2026 at 04:04 am
- Die Entscheidung der Federal Reserve, die Zinssätze beizubehalten, wirkt sich in Verbindung mit dem Nahostkonflikt auf den Preis von Bitcoin aus. Analyse aktueller Trends und Marktreaktionen.
-
- Bitcoin-Miner elektrifizieren das Netz: Der Erwerb eines Gaskraftwerks in Ohio läutet eine neue Ära für digitales Gold ein
- Apr 30, 2026 at 10:38 pm
- Die Bitcoin-Mining-Branche befindet sich in einem erheblichen Wandel, wobei große Akteure ihre Aktivitäten aggressiv ausweiten und strategisch Energieanlagen wie Gaskraftwerke in Ohio erwerben, um ihre Zukunft in der digitalen Wirtschaft zu festigen.
-
- Der MEGA-Token von MegaETH erreicht den Big Apple: Er setzt neue Leistungsmaßstäbe für Echtzeit-Blockchain
- Apr 30, 2026 at 09:11 pm
- Der MEGA-Token von MegaETH wurde offiziell eingeführt und bestätigt seine „Echtzeit“-Blockchain-Vision mit einem leistungsorientierten Verteilungsmodell und einer schnellen USDM-Stablecoin-Einführung.
-
- Solanas rutschiger Abhang: Die Preisprognose deutet auf einen Widerstandsverlust und mögliche weitere Rückgänge hin
- Apr 30, 2026 at 09:08 pm
- Solana kämpft darum, wichtige Widerstände zu durchbrechen, was auf einen möglichen Abwärtstrend hindeutet. Wiederholte Ablehnungen bei 86 bis 88 US-Dollar, gepaart mit einem unterbrochenen kurzfristigen Muster, deuten auf Ziele von nur 67 US-Dollar oder sogar 40 US-Dollar hin, da die Verkäufer die Kontrolle behalten. Anleger sollten die kritischen Unterstützungsniveaus genau beobachten.
-
- BTC, Öl, Gewinne: Geopolitik treibt Rohöl an, Kryptos rutschen ab, Triumphe und Prüfungen der Technologie
- Apr 30, 2026 at 04:51 pm
- Die globalen Märkte sind ein Wirbelsturm: BTC sinkt, während der Ölpreis aufgrund geopolitischer Spannungen Mehrjahreshöchststände erreicht, während Technologiegiganten gemischte Gewinne verbuchen, was ein Zeichen für eine komplexe Finanzlandschaft ist.
-
- New York Citys neuer Trend: Abstecksysteme, USD1 und Governance treiben die nächste Welle von Krypto voran
- Apr 30, 2026 at 03:02 pm
- Von lukrativen 1-Dollar-Verdienstveranstaltungen bis hin zu robusten Governance-Modellen wimmelt es im Kryptobereich von Innovationen, die die Art und Weise, wie wir mit digitalen Vermögenswerten umgehen, neu gestalten und sich dabei auf langfristiges Engagement und den Nutzen stabiler Münzen konzentrieren.
-
- OKX stellt Agent Payments Protocol vor: läutet eine neue Ära der KI-Transaktionen ein
- Apr 30, 2026 at 02:53 pm
- OKX führt sein Agent Payments Protocol (APP) ein, einen offenen Standard für KI-gesteuerten Handel, der es Agenten ermöglicht, komplette Geschäftszyklen zu verwalten. Entdecken Sie die Auswirkungen auf KI-Transaktionen und Agentenzahlungen.

































