Beiträge

Artikelbild für den Artikel: YOU COULD'VE INVENTED TRANSFORMERS

YOU COULD’VE INVENTED TRANSFORMERS

/
Die grundlegende Architektur von LLMs kann als eine Reihe von einfachen Schritten erklärt werden, die vom 0-Zählproblem der n-grams über Embeddings, neuronale Sprachmodelle bis hin zur Selbstaufmerksamkeit reichen.
Artikelbild für den Artikel: Infinite Tool Use: Die Zukunft der Sprachmodelle

Infinite Tool Use: Die Zukunft der Sprachmodelle

/
Der Artikel beleuchtet, wie das Paradigma der Werkzeugnutzung in großen Sprachmodellen die Effizienz und Genauigkeit in verschiedenen Bereichen verbessern kann.
Artikelbild für den Artikel: Gemini Diffusion: Googles neuestes Sprachmodell mit Diffusionstechnologie

Gemini Diffusion: Googles neuestes Sprachmodell mit Diffusionstechnologie

/
Gemini Diffusion ist Googles neuestes Sprachmodell, das Diffusionstechnologie anstelle von Transformern verwendet. Es verspricht schnellere und effizientere Textgenerierung.
Artikelbild für den Artikel: Chain of Draft: Effizientes Denken durch weniger Schreiben

Chain of Draft: Effizientes Denken durch weniger Schreiben

/
Die Chain of Draft ist eine prägnante Denkstrategie, die den Tokenverbrauch erheblich reduziert und dabei die Genauigkeit der Chain-of-Thought übertrifft oder zumindest erreicht.