Mit der schnelllebigen Entwicklung künstlicher Intelligenz werden Großsprachenmodelle zunehmend verwendet, um verschiedene wissenschaftliche Herausforderungen zu bewältigen.

With the rapid development of artificial intelligence (AI), large language models (LLMs) are increasingly being used to address various scientific challenges. A crucial step in this process is converting domain-specific data into a format suitable for LLMs, typically a sequence of tokens. In chemistry, molecules are commonly represented by molecular linear notations, and chemical reactions are depicted as pairs of reactants and products. However, this approach does not capture the atomic and bond changes that occur during reactions, which are essential for chemical understanding and manipulation. To bridge this gap and facilitate seamless integration between chemistry and LLMs, we introduce ReactSeq, a reaction description language that decomposes chemical reactions into a series of molecular editing operations.
Mit der schnellen Entwicklung der künstlichen Intelligenz (KI) werden Großspracher -Modelle (LLMs) zunehmend verwendet, um verschiedene wissenschaftliche Herausforderungen anzugehen. Ein entscheidender Schritt in diesem Prozess ist die Konvertierung domänenspezifischer Daten in ein für LLM geeigneter Format, typischerweise eine Sequenz von Token. In der Chemie werden Moleküle üblicherweise durch molekulare lineare Notationen dargestellt, und chemische Reaktionen werden als Paare von Reaktanten und Produkten dargestellt. Dieser Ansatz erfasst jedoch nicht die Atom- und Bindungsänderungen, die bei Reaktionen auftreten, die für das chemische Verständnis und Manipulation wesentlich sind. Um diese Lücke zu überbrücken und die nahtlose Integration zwischen Chemie und LLMs zu erleichtern, führen wir Reactseq ein, eine Reaktionsbeschreibungssprache, die chemische Reaktionen in eine Reihe von molekularen Bearbeitungsoperationen zerlegt.
Each ReactSeq token corresponds to a specific atomic or bond modification, enabling a step-by-step unfolding of the chemical transformation. We trained a language model for retrosynthesis prediction using ReactSeq and observed that it consistently outperformed existing methods in all benchmark tests. Furthermore, the model demonstrated promising emergent abilities, such as performing multistep synthesis planning in response to user requests and providing explanations for its predictions. To delve deeper into the capabilities of LLMs in navigating chemical space, we trained a model to predict reaction yield based on ReactSeq representations and achieved high performance in this task.
Jedes Reactseq-Token entspricht einer spezifischen Atom- oder Bindungsmodifikation und ermöglicht eine schrittweise Entfaltung der chemischen Transformation. Wir haben ein Sprachmodell für die Retrosynthese -Vorhersage unter Verwendung von Reactseq geschult und beobachteten, dass es in allen Benchmark -Tests bestehende Methoden konsistent übertraf. Darüber hinaus zeigte das Modell vielversprechende aufstrebende Fähigkeiten wie die Durchführung einer mehrstufigen Syntheseplanung als Antwort auf Benutzeranfragen und die Bereitstellung von Erklärungen für seine Vorhersagen. Um tiefer in die Funktionen von LLMs im Navigieren des chemischen Raums zu tauchen, haben wir ein Modell geschult, um die Reaktionsausbeute auf der Grundlage von Reactseq -Darstellungen vorherzusagen und in dieser Aufgabe eine hohe Leistung zu erzielen.
Our analysis indicates that the model learned to evaluate the feasibility of reactions based on chemical principles, highlighting the potential of LLMs to go beyond empirical patterns and develop a chemical understanding of the data. Finally, we used ReactSeq to generate universal and reliable representations of chemical reactions, facilitating efficient retrieval of relevant experimental procedures from literature databases. This capability paves the way for seamless integration between theoretical predictions and experimental observations, ultimately advancing chemical discovery and invention.
Unsere Analyse zeigt, dass das Modell, das zur Bewertung der Machbarkeit von Reaktionen auf der Grundlage chemischer Prinzipien gelernt wurde, gelernt und das Potenzial von LLMs hervorhebt, über empirische Muster hinauszugehen und ein chemisches Verständnis der Daten zu entwickeln. Schließlich verwendeten wir Reactseq, um universelle und zuverlässige Darstellungen chemischer Reaktionen zu erzeugen, was die effiziente Wiederholung relevanter experimenteller Verfahren aus Literaturdatenbanken erleichtert. Diese Fähigkeit ebnet den Weg für die nahtlose Integration zwischen theoretischen Vorhersagen und experimentellen Beobachtungen, was letztendlich die chemische Entdeckung und Erfindung voranschreitet.
Haftungsausschluss:info@kdj.com
Die bereitgestellten Informationen stellen keine Handelsberatung dar. kdj.com übernimmt keine Verantwortung für Investitionen, die auf der Grundlage der in diesem Artikel bereitgestellten Informationen getätigt werden. Kryptowährungen sind sehr volatil und es wird dringend empfohlen, nach gründlicher Recherche mit Vorsicht zu investieren!
Wenn Sie glauben, dass der auf dieser Website verwendete Inhalt Ihr Urheberrecht verletzt, kontaktieren Sie uns bitte umgehend (info@kdj.com) und wir werden ihn umgehend löschen.