Beiträge

Artikelbild für den Artikel: Verbesserung der Natürlichkeit in generativen Sprachmodellen

Verbesserung der Natürlichkeit in generativen Sprachmodellen

/
In diesem Artikel wird ein neuartiges variationales Framework vorgestellt, das die Natürlichkeit in generativen Sprachmodellen verbessert, indem es automatisch prosodische Merkmale lernt.
Artikelbild für den Artikel: DETECTING UNLEARNING TRACES IN LLMS

DETECTING UNLEARNING TRACES IN LLMS

/
Die Forschung zeigt, dass Machine-unlearned LLMs erkennbare Fingerabdrücke hinterlassen, was erhebliche Datenschutz- und Urheberrechtsbedenken aufwirft.
Artikelbild für den Artikel: Text-to-LoRA: Instant Transformer Adaption

Text-to-LoRA: Instant Transformer Adaption

/
Forscher von Sakana AI haben mit Text-to-LoRA ein System entwickelt, das große Sprachmodelle sofort anpassen kann, basierend auf einer textuellen Beschreibung der Zielaufgabe.
Artikelbild für den Artikel: Kimi-Dev-72B: Ein neuer Maßstab für Open-Source Coding LLMs

Kimi-Dev-72B: Ein neuer Maßstab für Open-Source Coding LLMs

/
Moonshot AI hat mit Kimi-Dev-72B ein neues Open-Source-Modell für Softwareentwicklungsaufgaben vorgestellt, das eine bemerkenswerte Leistung von 60,4 % auf dem SWE-bench Verified erzielt hat.
Artikelbild für den Artikel: Verstehen und Implementieren des KV-Caches in LLMs

Verstehen und Implementieren des KV-Caches in LLMs

/
In diesem Artikel erfahren Sie, wie Key-Value Caches in LLMs funktionieren und wie Sie diese effizient implementieren können.
Artikelbild für den Artikel: OpenAI's praktischer Leitfaden zum Aufbau von Agenten

OpenAI’s praktischer Leitfaden zum Aufbau von Agenten

/
Der Leitfaden von OpenAI bietet einen strukturierten Ansatz zum Aufbau von Agenten, beginnend mit einzelnen Agenten und der Verwendung von Manager-Patterns zur Koordination.
Artikelbild für den Artikel: Spatiotemporale Aufmerksamkeit für die Decodierung von Motorik-Elektroenzephalogramm (MI-EEG)

Spatiotemporale Aufmerksamkeit für die Decodierung von Motorik-Elektroenzephalogramm (MI-EEG)

/
In diesem Artikel stellen wir das TCANet vor, ein innovatives Modell zur Decodierung von Motorik-Elektroenzephalogramm (MI-EEG) Signalen, das auf mehrskaligen Faltungen und Selbstaufmerksamkeit basiert.
Artikelbild für den Artikel: TREERL: LLM Reinforcement Learning mit On-Policy Tree Search

TREERL: LLM Reinforcement Learning mit On-Policy Tree Search

/
TreeRL nutzt On-Policy Tree Search und Zwischenaufsicht, um LLMs effizienter zu trainieren und die Notwendigkeit eines separaten Belohnungsmodells zu eliminieren.
Artikelbild für den Artikel: LOW-BIT QUANTIZATION WITH PARETOQ

LOW-BIT QUANTIZATION WITH PARETOQ

/
ParetoQ ist ein neuer Trainingsalgorithmus, der binäre, ternäre und 2- bis 4-Bit-Quantisierung vereint und dabei erstklassige Ergebnisse auf allen Ebenen erzielt.