Capitalisation boursière: $3.6793T -2.630%
Volume(24h): $210.1238B 27.900%
  • Capitalisation boursière: $3.6793T -2.630%
  • Volume(24h): $210.1238B 27.900%
  • Indice de peur et de cupidité:
  • Capitalisation boursière: $3.6793T -2.630%
Cryptos
Les sujets
Cryptospedia
Nouvelles
Cryptosopique
Vidéos
Top nouvelles
Cryptos
Les sujets
Cryptospedia
Nouvelles
Cryptosopique
Vidéos
bitcoin
bitcoin

$113653.179192 USD

-1.98%

ethereum
ethereum

$3525.217143 USD

-5.13%

xrp
xrp

$2.974588 USD

-1.43%

tether
tether

$0.999613 USD

-0.03%

bnb
bnb

$764.503086 USD

-3.02%

solana
solana

$164.558033 USD

-4.03%

usd-coin
usd-coin

$0.999804 USD

-0.02%

tron
tron

$0.326608 USD

-0.14%

dogecoin
dogecoin

$0.201896 USD

-3.61%

cardano
cardano

$0.722456 USD

-2.12%

hyperliquid
hyperliquid

$38.099997 USD

-7.92%

sui
sui

$3.494024 USD

-3.45%

stellar
stellar

$0.385959 USD

-3.14%

chainlink
chainlink

$16.209093 USD

-4.30%

bitcoin-cash
bitcoin-cash

$540.811075 USD

-4.11%

Articles d’actualité sur les crypto-monnaies

LLMS, jetons et modèles: une révolution au niveau des octets?

Jun 25, 2025 at 03:17 am

Exploration des dernières tendances des LLM, des tokenzer et des modèles, en se concentrant sur le transformateur latent innovant (BLT) et ses implications pour l'avenir de l'IA.

LLMs, Tokenizers, and Models: A Byte-Level Revolution?

LLMS, jetons et modèles: une révolution au niveau des octets?

The world of LLMs is constantly evolving. This article summarizes the latest trends in 'LLM, Tokenizer, Models', focusing on the challenges of tokenization and the rise of byte-level models, as well as providing insights into potential future directions.

Le monde des LLMS évolue constamment. Cet article résume les dernières tendances de «LLM, Tokenizer, Models», en se concentrant sur les défis de la tokenisation et la montée des modèles au niveau des octets, ainsi que des informations sur les orientations futures potentielles.

The Tokenization Bottleneck

Le goulot d'étranglement de la tokenisation

Modern LLMs rely heavily on tokenization, a process that converts text into numerical tokens that the model can understand. However, this process isn't without its flaws. As Pagnoni et al (2024) point out, tokenization can strip away crucial sub-word semantics, leading to inefficiencies and vulnerabilities. Typos, domain-specific language, and low-resource languages can all cause problems for tokenizers, ultimately impacting the model's performance.

Les LLM modernes s'appuient fortement sur la tokenisation, un processus qui convertit le texte en jetons numériques que le modèle peut comprendre. Cependant, ce processus n'est pas sans défauts. Comme le soulignent Pagnoni et al (2024), la tokenisation peut se déshabiller la sémantique cruciale de sous-mots, entraînant des inefficacités et des vulnérabilités. Les fautes de frappe, le langage spécifique au domaine et les langues à faible ressource peuvent tous causer des problèmes aux tokenzers, ce qui a finalement un impact sur les performances du modèle.

The Rise of Byte-Level Models: BLT to the Rescue

La montée des modèles au niveau des octets: BLT à la rescousse

Enter the Byte Latent Transformer (BLT), a radical new approach that bypasses tokenization altogether. Developed by Meta AI, BLT models language from raw bytes, the most fundamental representation of digital text. This allows the LLM to learn language from the ground up, preserving sub-word semantics and potentially leading to more robust and versatile models.

Entrez le transformateur latent des octets (BLT), une nouvelle approche radicale qui contourne complètement la tokenisation. Développé par Meta Ai, BLT modélise la langue des octets bruts, la représentation la plus fondamentale du texte numérique. Cela permet au LLM d'apprendre la langue à partir de zéro, de préserver la sémantique de sous-mots et de conduisant potentiellement à des modèles plus robustes et polyvalents.

How BLT Works: A Two-Tiered System

Comment fonctionne BLT: un système à deux niveaux

BLT employs a clever two-tiered system to handle the computational challenges of processing raw bytes. The Local Encoder compresses easy-to-predict byte segments into latent "patches," significantly shortening the sequence length. The Latent Global Transformer then focuses its computational resources on the more complex linguistic regions. Finally, the Local Decoder decodes the predicted patch vector back into a sequence of raw bytes.

BLT utilise un système intelligent à deux niveaux pour gérer les défis de calcul du traitement des octets bruts. L'encodeur local comprime les segments d'octets faciles à prédire en «patchs» latents, raccourcissant considérablement la longueur de séquence. Le transformateur global latent concentre ensuite ses ressources de calcul sur les régions linguistiques les plus complexes. Enfin, le décodeur local décode le vecteur de patch prévu dans une séquence d'octets bruts.

BLT: A Game Changer?

BLT: Un changeur de jeu?

The BLT architecture offers several potential advantages over traditional token-based models:

L'architecture BLT offre plusieurs avantages potentiels par rapport aux modèles traditionnels basés sur les jetons:

  • Comparable Scaling: BLT can match the scaling behavior of state-of-the-art token-based architectures like LLaMA 3.
  • Dynamic Compute Allocation: BLT dynamically allocates computation based on input complexity, focusing resources where they are needed most.
  • Subword Awareness: By processing raw bytes, BLT gains access to the internal structure of words, improving performance on tasks involving fine-grained edits and noisy text.
  • Improved Performance on Low-Resource Languages: BLT treats all languages equally from the start, leading to better results in machine translation for languages with limited data.

The Future of LLMs: Beyond Tokenization?

L'avenir des LLMS: au-delà de la tokenisation?

The BLT represents a significant step forward in LLM research, challenging the long-standing reliance on tokenization. While tokenizers have become deeply ingrained in the AI ecosystem, the potential benefits of byte-level modeling are hard to ignore.

Le BLT représente un pas en avant significatif dans la recherche LLM, ce qui remet en question la dépendance de longue date à l'égard de la tokenisation. Alors que les jetons sont devenus profondément ancrés dans l'écosystème de l'IA, les avantages potentiels de la modélisation au niveau des octets sont difficiles à ignorer.

While Ozak AI is unrelated to Tokenization, it is an example of an AI project with real world market utility. In the coming year it could very well be the smartest and loudest token due to its use case, and continued AI adoption.

Bien que Ozak AI ne soit pas lié à la tokenisation, il s'agit d'un exemple de projet d'IA avec une utilité du marché réel. Au cours de l'année à venir, cela pourrait très bien être le jeton le plus intelligent et le plus fort en raison de son cas d'utilisation et une adoption continue de l'IA.

Final Thoughts

Réflexions finales

Whether BLT or other byte-level approaches become the norm remains to be seen. But one thing is clear: the future of LLMs is likely to involve a move beyond the superficial wrappers we call "languages" and towards a deeper understanding of the raw data itself. Now, if you'll excuse me, I'm going to go ponder the mysteries of bytes and tokens while listening to some bee-themed jazz. It's the buzz!

Que le BLT ou d'autres approches au niveau des octets deviennent la norme reste à voir. Mais une chose est claire: l'avenir des LLMS est susceptible d'impliquer un pas au-delà des emballages superficiels que nous appelons des «langues» et vers une compréhension plus approfondie des données brutes elle-même. Maintenant, si vous m'excusez, je vais aller réfléchir aux mystères des octets et des jetons tout en écoutant du jazz sur le thème des abeilles. C'est le buzz!

Source primaire:towardsdatascience

Clause de non-responsabilité:info@kdj.com

Les informations fournies ne constituent pas des conseils commerciaux. kdj.com n’assume aucune responsabilité pour les investissements effectués sur la base des informations fournies dans cet article. Les crypto-monnaies sont très volatiles et il est fortement recommandé d’investir avec prudence après une recherche approfondie!

Si vous pensez que le contenu utilisé sur ce site Web porte atteinte à vos droits d’auteur, veuillez nous contacter immédiatement (info@kdj.com) et nous le supprimerons dans les plus brefs délais.

Autres articles publiés sur Aug 03, 2025