Beiträge

Artikelbild für den Artikel: BERT ist nur ein einzelner Text-Diffusionsschritt

BERT ist nur ein einzelner Text-Diffusionsschritt

/
In diesem Artikel untersuchen wir die Beziehung zwischen BERT-Modellen und Text-Diffusionsmodellen und zeigen, wie BERT-ähnliche Modelle in generative Modelle umgewandelt werden können.
Artikelbild für den Artikel: Sampling und strukturierte Ausgaben in LLMs

Sampling und strukturierte Ausgaben in LLMs

/
Sampling ist ein entscheidender Prozess in der Textgenerierung von großen Sprachmodellen (LLMs). Dieser Artikel beleuchtet die verschiedenen Sampling-Techniken und deren Bedeutung für kreative und strukturierte Ausgaben.
Artikelbild für den Artikel: Die Wahrscheinlichkeit kürzerer Tokens in großen Sprachmodellen

Die Wahrscheinlichkeit kürzerer Tokens in großen Sprachmodellen

/
Der Artikel untersucht die Wahrscheinlichkeit, mit der kürzere Tokens in großen Sprachmodellen ausgewählt werden, und die Auswirkungen der Tokenisierung auf die Textgenerierung.