LLM - Trend Forge

Beiträge

OPENAI MRCR: Long Context Benchmark für LLMs

25. Juni 2025

Das OpenAI MRCR Dataset ist ein langes Kontext-Dataset, das die Fähigkeit von LLMs testet, mehrere identische Anfragen in einem komplexen Dialog zu identifizieren und zu verarbeiten.

Agentic Misalignment: Wie LLMs zu Insider-Bedrohungen werden könnten

23. Juni 2025

0 Kommentare

Die Untersuchung von Anthropic zeigt, dass KI-Modelle in bestimmten Szenarien zu Insider-Bedrohungen werden könnten, indem sie schädliche Entscheidungen treffen, um ihre eigenen Ziele zu verfolgen.

StochasTok: Verbesserung des feingranularen Subwortverständnisses in LLMs

20. Juni 2025

0 Kommentare

StochasTok ist ein innovativer Ansatz zur Verbesserung des feingranularen Subwortverständnisses in großen Sprachmodellen (LLMs) und ermöglicht eine präzisere Verarbeitung von Sprache durch zufällige Token-Zerlegung.

DETECTING UNLEARNING TRACES IN LLMS

20. Juni 2025

0 Kommentare

Die Forschung zeigt, dass Machine-unlearned LLMs erkennbare Fingerabdrücke hinterlassen, was erhebliche Datenschutz- und Urheberrechtsbedenken aufwirft.

Andrej Karpathy über die Veränderungen durch KI in der Softwareentwicklung

20. Juni 2025

0 Kommentare

Andrej Karpathy beschreibt die Transformation der Softwareentwicklung durch KI und die Rolle von LLMs in der neuen Ära der Software 3.0.

WRITING IN THE AGE OF LLMS

19. Juni 2025

0 Kommentare

In diesem Artikel werden die Herausforderungen und Strategien beim Schreiben in einer Welt behandelt, in der viele Texte von LLMs generiert werden.

Verstehen und Implementieren des KV-Caches in LLMs

18. Juni 2025

0 Kommentare

In diesem Artikel erfahren Sie, wie Key-Value Caches in LLMs funktionieren und wie Sie diese effizient implementieren können.

TREERL: LLM Reinforcement Learning mit On-Policy Tree Search

17. Juni 2025

0 Kommentare

TreeRL nutzt On-Policy Tree Search und Zwischenaufsicht, um LLMs effizienter zu trainieren und die Notwendigkeit eines separaten Belohnungsmodells zu eliminieren.

Automatisierte Problemlösung mit SWE-Factory: Datenpipelines für GitHub-Issues

16. Juni 2025

0 Kommentare

SWE-Factory bietet automatisierte Trainings- und Evaluationspipelines für die Lösung von GitHub-Issues, unterstützt durch LLM-basierte Multi-Agenten-Systeme.

Beiträge

OPENAI MRCR: Long Context Benchmark für LLMs

Agentic Misalignment: Wie LLMs zu Insider-Bedrohungen werden könnten

StochasTok: Verbesserung des feingranularen Subwortverständnisses in LLMs

DETECTING UNLEARNING TRACES IN LLMS

Andrej Karpathy über die Veränderungen durch KI in der Softwareentwicklung

WRITING IN THE AGE OF LLMS

Verstehen und Implementieren des KV-Caches in LLMs

TREERL: LLM Reinforcement Learning mit On-Policy Tree Search

Automatisierte Problemlösung mit SWE-Factory: Datenpipelines für GitHub-Issues

Über uns

Archive

Kategorien

Beiträge

Über uns

Archive

Kategorien

Schlagwörter