$106975.071866 USD

-0.29%

ethereum

$3871.670850 USD

-0.07%

tether

$1.000261 USD

-0.01%

bnb

$1084.417621 USD

-0.50%

xrp

$2.348167 USD

0.82%

solana

$185.621736 USD

0.45%

usd-coin

$0.999833 USD

-0.04%

tron

$0.313423 USD

0.81%

dogecoin

$0.188856 USD

0.54%

cardano

$0.630416 USD

-0.49%

hyperliquid

$36.506353 USD

2.24%

ethena-usde

$0.999584 USD

-0.01%

chainlink

$16.750026 USD

-0.77%

stellar

$0.313373 USD

0.37%

bitcoin-cash

$465.978560 USD

-1.57%

Articles d’actualité sur les crypto-monnaies

SwiReasoning : une nouvelle frontière pour les modes de raisonnement dans les grands modèles de langage

Oct 19, 2025 at 04:01 pm

Explorez SwiReasoning, un nouveau framework d'IA améliorant l'efficacité des grands modèles de langage en basculant dynamiquement entre les modes de raisonnement, améliorant ainsi la précision et l'utilisation des jetons.

The world of large language models (LLMs) is constantly evolving, and a recent development is making waves: SwiReasoning. This innovative framework, designed by researchers at Georgia Tech and Microsoft, promises to revolutionize how LLMs approach reasoning tasks. By dynamically switching between different reasoning strategies, SwiReasoning aims to boost both accuracy and efficiency.

Le monde des grands modèles de langage (LLM) est en constante évolution, et un développement récent fait des vagues : SwiReasoning. Ce cadre innovant, conçu par des chercheurs de Georgia Tech et Microsoft, promet de révolutionner la façon dont les LLM abordent les tâches de raisonnement. En basculant dynamiquement entre différentes stratégies de raisonnement, SwiReasoning vise à améliorer à la fois la précision et l'efficacité.

Understanding SwiReasoning's Core: Reasoning Modes

Comprendre le cœur de SwiReasoning : les modes de raisonnement

At the heart of SwiReasoning lies its ability to toggle between two distinct reasoning modes:

Au cœur de SwiReasoning réside sa capacité à basculer entre deux modes de raisonnement distincts :

Chain-of-Thought: This mode tackles problems step-by-step, using plain language to break down complex tasks.
Latent Reasoning: This mode operates within the model's vector space, performing reasoning without generating explicit text output.

The framework intelligently decides when to switch modes by monitoring the model's uncertainty, measured by the entropy of token probabilities. Low entropy indicates confidence, prompting a shift to explicit mode to solidify the line of thought. Conversely, high entropy signals uncertainty, triggering a return to latent mode to explore alternative solutions.

Le cadre décide intelligemment quand changer de mode en surveillant l'incertitude du modèle, mesurée par l'entropie des probabilités symboliques. Une faible entropie indique une confiance, ce qui incite à passer en mode explicite pour solidifier la ligne de pensée. À l’inverse, une entropie élevée signale une incertitude, déclenchant un retour au mode latent pour explorer des solutions alternatives.

Preventing Overthinking and Enhancing Efficiency

Éviter de trop réfléchir et améliorer l’efficacité

To prevent models from getting stuck in unproductive thought loops, SwiReasoning incorporates several mechanisms. Asymmetric dwell times ensure that switching to explicit mode happens instantly, while returning to latent mode requires a minimum number of steps. A cap on the number of allowed mode switches further prevents endless internal debate, forcing the model to wrap up its reasoning when it reaches half the limit or to provide an immediate response if it exceeds the maximum.

Pour éviter que les modèles ne restent coincés dans des boucles de pensée improductives, SwiReasoning intègre plusieurs mécanismes. Les temps d'arrêt asymétriques garantissent que le passage au mode explicite se produit instantanément, tandis que le retour au mode latent nécessite un nombre minimum d'étapes. Un plafond sur le nombre de changements de mode autorisés évite en outre un débat interne sans fin, obligeant le modèle à conclure son raisonnement lorsqu'il atteint la moitié de la limite ou à fournir une réponse immédiate s'il dépasse le maximum.

The Impact of SwiReasoning: Performance and Token Efficiency

L'impact de SwiReasoning : performances et efficacité des jetons

Tests on smaller models, such as Qwen3-8B, Qwen3-1.7B, and Deepseek R1, have shown promising results. SwiReasoning improved accuracy by up to 2.8 percent on math tasks and 2 percent on science tasks, particularly on the most challenging problems. Under strict token constraints, the framework significantly enhanced token efficiency, achieving improvements of 56 to 79 percent, and in some cases by as much as 6.8 times compared to standard chain-of-thought.

Les tests sur des modèles plus petits, tels que Qwen3-8B, Qwen3-1.7B et Deepseek R1, ont montré des résultats prometteurs. SwiReasoning a amélioré la précision jusqu'à 2,8 % sur les tâches mathématiques et 2 % sur les tâches scientifiques, en particulier sur les problèmes les plus difficiles. Sous des contraintes strictes en matière de jetons, le cadre a considérablement amélioré l'efficacité des jetons, atteignant des améliorations de 56 à 79 pour cent, et dans certains cas jusqu'à 6,8 fois par rapport à la chaîne de pensée standard.

Real-World Implications and Accessibility

Implications dans le monde réel et accessibilité

One of the most appealing aspects of SwiReasoning is that it requires no extra training and can be easily integrated as a replacement for standard generation functions. The implementation is available on GitHub, making it accessible to researchers and developers looking to enhance the reasoning capabilities of their LLMs.

L’un des aspects les plus attrayants de SwiReasoning est qu’il ne nécessite aucune formation supplémentaire et peut être facilement intégré en remplacement des fonctions de génération standard. L'implémentation est disponible sur GitHub, la rendant accessible aux chercheurs et développeurs cherchant à améliorer les capacités de raisonnement de leurs LLM.

A Glimpse into the Future

Un aperçu du futur

SwiReasoning represents a significant step forward in the quest to improve the reasoning abilities of large language models. Its dynamic approach to reasoning, combined with its focus on efficiency, holds great promise for a wide range of applications. As LLMs continue to evolve, frameworks like SwiReasoning will undoubtedly play a crucial role in shaping their future.

SwiReasoning représente une avancée significative dans la quête visant à améliorer les capacités de raisonnement des grands modèles de langage. Son approche dynamique du raisonnement, combinée à l’accent mis sur l’efficacité, est très prometteuse pour un large éventail d’applications. À mesure que les LLM continuent d'évoluer, des cadres tels que SwiReasoning joueront sans aucun doute un rôle crucial dans l'élaboration de leur avenir.

So, there you have it! SwiReasoning: making LLMs a little bit smarter, one token at a time. Who knows? Maybe one day, they'll be writing their own blog posts. But until then, we'll keep you in the loop!

Alors voilà ! SwiReasoning : rendre les LLM un peu plus intelligents, un jeton à la fois. Qui sait ? Peut-être qu'un jour, ils écriront leurs propres articles de blog. Mais d’ici là, nous vous tiendrons au courant !

Source primaire：the-decoder

Clause de non-responsabilité:info@kdj.com

Les informations fournies ne constituent pas des conseils commerciaux. kdj.com n’assume aucune responsabilité pour les investissements effectués sur la base des informations fournies dans cet article. Les crypto-monnaies sont très volatiles et il est fortement recommandé d’investir avec prudence après une recherche approfondie！

Si vous pensez que le contenu utilisé sur ce site Web porte atteinte à vos droits d’auteur, veuillez nous contacter immédiatement (info@kdj.com) et nous le supprimerons dans les plus brefs délais.

Autres articles publiés sur Oct 19, 2025

Plus