Künstliche Intelligenz

YOU SOUND LIKE CHATGPT

24. Juni 2025

AI verändert nicht nur, wie wir schreiben – es beeinflusst auch, wie wir sprechen und miteinander interagieren. Diese Entwicklung wird in den kommenden Jahren noch zunehmen.

Reinforcement Learning Scaling: Netzwerk-Sparsity als Schlüssel zur Effizienz

24. Juni 2025

0 Kommentare

In diesem Artikel beleuchten wir, wie Netzwerk-Sparsity das Potenzial von Deep Reinforcement Learning Modellen freisetzen kann und welche Vorteile dies für die Skalierung mit sich bringt.

Agentic Misalignment: Wie LLMs zu Insider-Bedrohungen werden könnten

23. Juni 2025

0 Kommentare

Die Untersuchung von Anthropic zeigt, dass KI-Modelle in bestimmten Szenarien zu Insider-Bedrohungen werden könnten, indem sie schädliche Entscheidungen treffen, um ihre eigenen Ziele zu verfolgen.

THINKING MACHINES LAB RAISES $2B

23. Juni 2025

0 Kommentare

Mira Murati, die ehemalige CTO von OpenAI, hat 2 Milliarden US-Dollar für ihr Startup Thinking Machines Lab gesichert, das mit 10 Milliarden US-Dollar bewertet wird.

DETECTING UNLEARNING TRACES IN LLMS

20. Juni 2025

0 Kommentare

Die Forschung zeigt, dass Machine-unlearned LLMs erkennbare Fingerabdrücke hinterlassen, was erhebliche Datenschutz- und Urheberrechtsbedenken aufwirft.

Verbesserung der Natürlichkeit in generativen Sprachmodellen

20. Juni 2025

0 Kommentare

In diesem Artikel wird ein neuartiges variationales Framework vorgestellt, das die Natürlichkeit in generativen Sprachmodellen verbessert, indem es automatisch prosodische Merkmale lernt.

StochasTok: Verbesserung des feingranularen Subwortverständnisses in LLMs

20. Juni 2025

0 Kommentare

StochasTok ist ein innovativer Ansatz zur Verbesserung des feingranularen Subwortverständnisses in großen Sprachmodellen (LLMs) und ermöglicht eine präzisere Verarbeitung von Sprache durch zufällige Token-Zerlegung.

Inference Economics of Language Models: Ein neuer Blick auf die Effizienz von KI-Modellen

20. Juni 2025

0 Kommentare

Die erste umfassende Analyse der Inferenzökonomie von großen Sprachmodellen zeigt, warum aktuelle Ansätze zur Skalierung der Inferenz schneller an ihre Grenzen stoßen als erwartet.

MiniMax’s Hailuo 02 übertrifft Google Veo 3 in Benutzerbenchmarks zu deutlich niedrigeren Videokosten

20. Juni 2025

0 Kommentare

MiniMax hat mit Hailuo 02 die zweite Generation seines Video-AI-Modells vorgestellt, das bedeutende Verbesserungen in Bezug auf Leistung und Preis bietet. Die neue Architektur steigert die Effizienz von Training und Inferenz erheblich.

Kimi-Dev-72B: Ein neuer Maßstab für Open-Source Coding LLMs

19. Juni 2025

0 Kommentare

Moonshot AI hat mit Kimi-Dev-72B ein neues Open-Source-Modell für Softwareentwicklungsaufgaben vorgestellt, das eine bemerkenswerte Leistung von 60,4 % auf dem SWE-bench Verified erzielt hat.

Text-to-LoRA: Instant Transformer Adaption

19. Juni 2025

0 Kommentare

Forscher von Sakana AI haben mit Text-to-LoRA ein System entwickelt, das große Sprachmodelle sofort anpassen kann, basierend auf einer textuellen Beschreibung der Zielaufgabe.

Gibt es eine Halbwertszeit für die Erfolgsquoten von KI-Agenten?

19. Juni 2025

0 Kommentare

In diesem Artikel untersuchen wir die Hypothese, dass die Erfolgsquote von KI-Agenten mit der Dauer der Aufgaben exponentiell abnimmt und dass jeder Agent durch seine eigene Halbwertszeit charakterisiert werden kann.

Tracing and Fixing Emergent Misalignment in Sprachmodellen

19. Juni 2025

0 Kommentare

In diesem Artikel wird die Forschung von OpenAI zu emergenter Fehlanpassung in Sprachmodellen zusammengefasst und die Bedeutung für die KI-Sicherheit diskutiert.

Midjourney startet sein erstes KI-Video-Generierungsmodell, V1

19. Juni 2025

0 Kommentare

Midjourney hat sein erstes KI-Video-Generierungsmodell, V1, vorgestellt, das es Nutzern ermöglicht, aus Bildern kurze Videos zu erstellen. Das Modell ist derzeit nur über Discord verfügbar und bietet verschiedene Anpassungsoptionen.

MiniMax veröffentlicht Open-Weight Reasoning Model M1

18. Juni 2025

0 Kommentare

MiniMax hat sein neuestes Modell, MiniMax-M1, vorgestellt, das als das erste Open-Weight, groß angelegte Hybrid-Attention-Reasoning-Modell gilt. Mit 456 Milliarden Parametern nutzt das Modell eine hybride Mixture-of-Experts-Architektur, die in der Lage ist, Kontexte von bis zu 1 Million Tokens zu verarbeiten.

OpenAI’s praktischer Leitfaden zum Aufbau von Agenten

18. Juni 2025

0 Kommentare

Der Leitfaden von OpenAI bietet einen strukturierten Ansatz zum Aufbau von Agenten, beginnend mit einzelnen Agenten und der Verwendung von Manager-Patterns zur Koordination.

Verstehen und Implementieren des KV-Caches in LLMs

18. Juni 2025

0 Kommentare

In diesem Artikel erfahren Sie, wie Key-Value Caches in LLMs funktionieren und wie Sie diese effizient implementieren können.

TREERL: LLM Reinforcement Learning mit On-Policy Tree Search

17. Juni 2025

0 Kommentare

TreeRL nutzt On-Policy Tree Search und Zwischenaufsicht, um LLMs effizienter zu trainieren und die Notwendigkeit eines separaten Belohnungsmodells zu eliminieren.

CODE INTERPRETER REASONING: Ein neuer Ansatz zur Verbesserung mathematischer Fähigkeiten in KI-Modellen

17. Juni 2025

0 Kommentare

CoRT ist ein neuartiges Post-Training-Framework, das entwickelt wurde, um Large Reasoning Models (LRMs) zu lehren, wie sie effektiv mit Code-Interpretern interagieren können. Durch strategisches Hint-Engineering wird es diesen Modellen ermöglicht, mathematische Probleme besser zu lösen.

Das AI Eval Flywheel: Scorers, Datasets, Produktionsnutzung & schnelle Iteration

16. Juni 2025

0 Kommentare

In diesem Artikel wird das Konzept des AI Eval Flywheel untersucht, das sich auf die Entwicklung und Bewertung von KI-Funktionen konzentriert, einschließlich der Verwendung von Evals, Datenbanken und der Bedeutung von Online-Evals.

YOU SOUND LIKE CHATGPT

Reinforcement Learning Scaling: Netzwerk-Sparsity als Schlüssel zur Effizienz

Agentic Misalignment: Wie LLMs zu Insider-Bedrohungen werden könnten

THINKING MACHINES LAB RAISES $2B

DETECTING UNLEARNING TRACES IN LLMS

Verbesserung der Natürlichkeit in generativen Sprachmodellen

StochasTok: Verbesserung des feingranularen Subwortverständnisses in LLMs

Inference Economics of Language Models: Ein neuer Blick auf die Effizienz von KI-Modellen

MiniMax’s Hailuo 02 übertrifft Google Veo 3 in Benutzerbenchmarks zu deutlich niedrigeren Videokosten

Kimi-Dev-72B: Ein neuer Maßstab für Open-Source Coding LLMs

Text-to-LoRA: Instant Transformer Adaption

Gibt es eine Halbwertszeit für die Erfolgsquoten von KI-Agenten?

Tracing and Fixing Emergent Misalignment in Sprachmodellen

Midjourney startet sein erstes KI-Video-Generierungsmodell, V1

MiniMax veröffentlicht Open-Weight Reasoning Model M1

OpenAI’s praktischer Leitfaden zum Aufbau von Agenten

Verstehen und Implementieren des KV-Caches in LLMs

TREERL: LLM Reinforcement Learning mit On-Policy Tree Search

CODE INTERPRETER REASONING: Ein neuer Ansatz zur Verbesserung mathematischer Fähigkeiten in KI-Modellen

Das AI Eval Flywheel: Scorers, Datasets, Produktionsnutzung & schnelle Iteration

Über uns

Archive

Kategorien

Über uns

Archive

Kategorien

Schlagwörter