bitcoin
bitcoin

$87959.907984 USD

1.34%

ethereum
ethereum

$2920.497338 USD

3.04%

tether
tether

$0.999775 USD

0.00%

xrp
xrp

$2.237324 USD

8.12%

bnb
bnb

$860.243768 USD

0.90%

solana
solana

$138.089498 USD

5.43%

usd-coin
usd-coin

$0.999807 USD

0.01%

tron
tron

$0.272801 USD

-1.53%

dogecoin
dogecoin

$0.150904 USD

2.96%

cardano
cardano

$0.421635 USD

1.97%

hyperliquid
hyperliquid

$32.152445 USD

2.23%

bitcoin-cash
bitcoin-cash

$533.301069 USD

-1.94%

chainlink
chainlink

$12.953417 USD

2.68%

unus-sed-leo
unus-sed-leo

$9.535951 USD

0.73%

zcash
zcash

$521.483386 USD

-2.87%

Vidéo d’actualité sur les crypto-monnaies

Conférence 6 -Transformateurs et grands modèles de langage (LLM)

Jul 01, 2026 at 04:02 pm Luis R Soenksen

Cette conférence explore les transformateurs et les grands modèles linguistiques (LLM), l'architecture d'apprentissage en profondeur qui alimente les systèmes d'IA modernes tels que ChatGPT, Claude, Gemini, Llama et de nombreux modèles de base multimodaux. Nous commençons par présenter les principales familles de modèles de langage, y compris les architectures autorégressives, auto-encodées et encodeurs-décodeurs, et retraçons l'évolution rapide des LLM depuis les premiers modèles de transformateurs comme BERT et GPT jusqu'aux systèmes multimodaux à grande échelle d'aujourd'hui. La conférence examine ensuite comment la mise à l'échelle, le réglage des instructions, l'apprentissage par renforcement, l'augmentation de la récupération et l'ingénierie des systèmes ont transformé les capacités LLM au-delà de la simple augmentation de la taille du modèle. La seconde moitié de la conférence propose une présentation intuitive mais rigoureuse de l'architecture Transformer, expliquant les intégrations de jetons, les codages de position, l'auto-attention, les vecteurs Query-Key-Value (QKV), l'attention des produits scalaires à l'échelle, l'attention multi-têtes, les connexions résiduelles, la normalisation des couches, les réseaux à action directe et les blocs de transformateur de style GPT. Grâce à des exemples visuels et à des formulations mathématiques, les étudiants développent une compréhension de niveau ingénierie de la manière dont les transformateurs construisent des représentations contextuelles et effectuent la prédiction du jeton suivant. Enfin, nous explorons comment la même architecture s'étend au-delà du langage naturel pour inclure le texte biomédical, les dossiers de santé électroniques (DSE), les séquences biologiques, l'imagerie médicale, les graphiques et les applications de soins de santé multimodales, tout en discutant de considérations pratiques telles que les hallucinations, l'alignement des modèles, la sécurité, l'interprétabilité et le déploiement responsable en médecine et en santé mondiale. #IA #IntelligenceArtificielle #MachineLearning #DeepLearning #Transformers #LargeLanguageModels #LLMs #GPT #ChatGPT #AttentionMechanism #SelfAttention #GenerativeAI #FoundationModels #NaturalLanguageProcessing #NLP #BiomedicalAI #MedicalAI #HealthcareAI #ClinicalAI #ElectronicHealthRecords #Bioinformatics #ComputationalBiology #VisionTransformer #MultimodalAI #AIEducation #GraduateCourse #AIInMedicine #GlobalHealth #MedicalEducation #MachineLearningCourse
Source vidéo:Youtube

Clause de non-responsabilité:info@kdj.com

Les informations fournies ne constituent pas des conseils commerciaux. kdj.com n’assume aucune responsabilité pour les investissements effectués sur la base des informations fournies dans cet article. Les crypto-monnaies sont très volatiles et il est fortement recommandé d’investir avec prudence après une recherche approfondie!

Si vous pensez que le contenu utilisé sur ce site Web porte atteinte à vos droits d’auteur, veuillez nous contacter immédiatement (info@kdj.com) et nous le supprimerons dans les plus brefs délais.

Autres vidéos publiées sur Jul 02, 2026