
Kimi-Dev-72B: Ein neuer Maßstab für Open-Source Coding LLMs
/
0 Kommentare
Moonshot AI hat mit Kimi-Dev-72B ein neues Open-Source-Modell für Softwareentwicklungsaufgaben vorgestellt, das eine bemerkenswerte Leistung von 60,4 % auf dem SWE-bench Verified erzielt hat.

Text-to-LoRA: Instant Transformer Adaption
Forscher von Sakana AI haben mit Text-to-LoRA ein System entwickelt, das große Sprachmodelle sofort anpassen kann, basierend auf einer textuellen Beschreibung der Zielaufgabe.

Gibt es eine Halbwertszeit für die Erfolgsquoten von KI-Agenten?
In diesem Artikel untersuchen wir die Hypothese, dass die Erfolgsquote von KI-Agenten mit der Dauer der Aufgaben exponentiell abnimmt und dass jeder Agent durch seine eigene Halbwertszeit charakterisiert werden kann.

Tracing and Fixing Emergent Misalignment in Sprachmodellen
In diesem Artikel wird die Forschung von OpenAI zu emergenter Fehlanpassung in Sprachmodellen zusammengefasst und die Bedeutung für die KI-Sicherheit diskutiert.

Midjourney startet sein erstes KI-Video-Generierungsmodell, V1
Midjourney hat sein erstes KI-Video-Generierungsmodell, V1, vorgestellt, das es Nutzern ermöglicht, aus Bildern kurze Videos zu erstellen. Das Modell ist derzeit nur über Discord verfügbar und bietet verschiedene Anpassungsoptionen.

Echtzeit-Aktionschunking mit großen Modellen
In diesem Artikel wird ein Algorithmus namens Echtzeit-Chunking vorgestellt, der eine Echtzeitausführung ohne Unterbrechungen ermöglicht.

Was wir aus der Briefing-Serie mit über 70 Abgeordneten über die Bedrohung durch KI gelernt haben
In diesem Artikel werden die Erkenntnisse aus Briefings mit über 70 Abgeordneten des britischen Parlaments über die Risiken von Künstlicher Intelligenz zusammengefasst. Es wird diskutiert, wie Parlamentarier auf die Themen KI-Risiken reagieren und welche Herausforderungen und Empfehlungen es gibt.

O3 Turns Pro: Ein Blick auf die neue AI-Generation
Die Einführung von O3 Pro hat in der Tech-Community für Aufsehen gesorgt. Mit der Möglichkeit, deutlich mehr Rechenleistung für komplexe Probleme bereitzustellen, stellt sich die Frage, ob sich das Abonnieren des neuen Modells für die Nutzer lohnt.

MiniMax veröffentlicht Open-Weight Reasoning Model M1
MiniMax hat sein neuestes Modell, MiniMax-M1, vorgestellt, das als das erste Open-Weight, groß angelegte Hybrid-Attention-Reasoning-Modell gilt. Mit 456 Milliarden Parametern nutzt das Modell eine hybride Mixture-of-Experts-Architektur, die in der Lage ist, Kontexte von bis zu 1 Million Tokens zu verarbeiten.

Spatiotemporale Aufmerksamkeit für die Decodierung von Motorik-Elektroenzephalogramm (MI-EEG)
In diesem Artikel stellen wir das TCANet vor, ein innovatives Modell zur Decodierung von Motorik-Elektroenzephalogramm (MI-EEG) Signalen, das auf mehrskaligen Faltungen und Selbstaufmerksamkeit basiert.

OpenAI’s praktischer Leitfaden zum Aufbau von Agenten
Der Leitfaden von OpenAI bietet einen strukturierten Ansatz zum Aufbau von Agenten, beginnend mit einzelnen Agenten und der Verwendung von Manager-Patterns zur Koordination.

Verstehen und Implementieren des KV-Caches in LLMs
In diesem Artikel erfahren Sie, wie Key-Value Caches in LLMs funktionieren und wie Sie diese effizient implementieren können.

Wie man seinen Job nicht an KI verliert: Eine Karriereleitfaden
In der heutigen Zeit, in der Künstliche Intelligenz (KI) zunehmend in den Arbeitsmarkt eindringt, ist es für viele Menschen von entscheidender Bedeutung, sich auf die Veränderungen vorzubereiten, die diese Technologien mit sich bringen. Dieser Karriereleitfaden identifiziert Fähigkeiten, die paradoxerweise an Wert gewinnen, je mehr Automatisierung zunimmt.

Sam Altmans Einschätzung zu Metas 100 Millionen Dollar Angeboten
In einem Podcast hat Sam Altman, CEO von OpenAI, bestätigt, dass Meta neunstellige Angebote gemacht hat, um Forscher für sein Team zur Entwicklung von Superintelligenz zu gewinnen, jedoch kaum jemand gewechselt ist.

GEMINI 2.5: Aktualisierte Verfügbarkeit und neue Funktionen
Google hat die Modelle Gemini 2.5 Pro und Flash veröffentlicht und bietet nun auch Flash-Lite in der Vorschau an. Die neuen Denkbudgets ermöglichen eine verbesserte Genauigkeit und Flexibilität für Entwickler.

CURSOR’S $200 ULTRA PLAN
Anysphere hat den neuen Ultra-Plan für 200 USD pro Monat eingeführt, der 20-mal mehr Nutzung als der Pro-Plan bietet, unterstützt durch Partnerschaften mit führenden KI-Anbietern.

Die Beziehung zwischen Microsoft und OpenAI gerät ins Wanken: Spannungen über die Übernahme von Windsurf
Die Beziehung zwischen OpenAI und Microsoft steht an einem Wendepunkt, da Spannungen über die Übernahme des KI-Startups Windsurf zunehmen. OpenAI erwägt, Microsoft wegen wettbewerbswidrigen Verhaltens zu beschuldigen.

Prompts als API-Primitiv: Eine neue Ära für OpenAI-Dienste
OpenAI hat angekündigt, dass Prompts nun ein API-Primitiv sind, was eine zentrale Verwaltung und Optimierung über verschiedene Dienste ermöglicht.

Coding Agents Have Crossed a Chasm
In den letzten Monaten hat sich die Rolle der Entwickler durch leistungsstarke AI-Coding-Tools verändert, die von der Code-Erstellung zur Architektur von Lösungen übergehen.

OpenAI gewinnt $200 Millionen Verteidigungsvertrag der USA
OpenAI hat einen bedeutenden Vertrag über 200 Millionen Dollar mit dem US-Verteidigungsministerium gewonnen, um fortschrittliche KI-Tools für nationale Sicherheitsmissionen bereitzustellen.