In dieser Vorlesung geht es um Transformers und Large Language Models (LLMs), die Deep-Learning-Architektur, die moderne KI-Systeme wie ChatGPT, Claude, Gemini, Llama und viele multimodale Basismodelle antreibt. Wir beginnen mit der Einführung der wichtigsten Familien von Sprachmodellen – einschließlich autoregressiver, automatischer Kodierung und Encoder-Decoder-Architekturen – und verfolgen die schnelle Entwicklung von LLMs von frühen Transformatormodellen wie BERT und GPT bis zu den heutigen großen multimodalen Systemen. Anschließend wird in der Vorlesung untersucht, wie Skalierung, Befehlsoptimierung, Reinforcement Learning, Retrieval Augmentation und Systems Engineering die LLM-Funktionen über die bloße Vergrößerung der Modellgröße hinaus verändert haben. Die zweite Hälfte der Vorlesung bietet einen intuitiven und dennoch umfassenden Rundgang durch die Transformer-Architektur und erklärt Token-Einbettungen, Positionskodierungen, Selbstaufmerksamkeit, Query-Key-Value (QKV)-Vektoren, skalierte Skalarproduktaufmerksamkeit, Mehrkopfaufmerksamkeit, Restverbindungen, Schichtnormalisierung, Feed-Forward-Netzwerke und GPT-artige Transformatorblöcke. Durch visuelle Beispiele und mathematische Formulierungen entwickeln die Studierenden ein Verständnis auf technischer Ebene dafür, wie Transformatoren kontextbezogene Darstellungen erstellen und die Vorhersage des nächsten Tokens durchführen. Abschließend untersuchen wir, wie sich dieselbe Architektur über die natürliche Sprache hinaus auf biomedizinische Texte, elektronische Gesundheitsakten (EHRs), biologische Sequenzen, medizinische Bildgebung, Grafiken und multimodale Gesundheitsanwendungen erstreckt, während wir praktische Überlegungen wie Halluzinationen, Modellausrichtung, Sicherheit, Interpretierbarkeit und verantwortungsvollen Einsatz in der Medizin und der globalen Gesundheit diskutieren. #KI #Künstliche Intelligenz #MachineLearning #DeepLearning #Transformers #LargeLanguageModels #LLMs #GPT #ChatGPT #AttentionMechanism #SelfAttention #GenerativeAI #FoundationModels #NaturalLanguageProcessing #NLP #BiomedicalAI #MedicalAI #HealthcareAI #ClinicalAI #ElectronicHealthRecords #Bioinformatik #ComputationalBiology #VisionTransformer #MultimodalAI #AIEducation #GraduateCourse #AIInMedicine #GlobalHealth #MedicalEducation #MachineLearningCourse
Die bereitgestellten Informationen stellen keine Handelsberatung dar. kdj.com übernimmt keine Verantwortung für Investitionen, die auf der Grundlage der in diesem Artikel bereitgestellten Informationen getätigt werden. Kryptowährungen sind sehr volatil und es wird dringend empfohlen, nach gründlicher Recherche mit Vorsicht zu investieren!
Wenn Sie glauben, dass der auf dieser Website verwendete Inhalt Ihr Urheberrecht verletzt, kontaktieren Sie uns bitte umgehend (info@kdj.com) und wir werden ihn umgehend löschen.