QWEN3-CODER: AGENTIC CODING IN DER WELT

Mit der Einführung von Qwen3-Coder hat das Qwen Team ein neues Kapitel in der Welt der KI-gestützten Programmierung aufgeschlagen. Dieses Modell, das mit 480 Milliarden Parametern ausgestattet ist, bietet nicht nur herausragende Ergebnisse in verschiedenen Programmieraufgaben, sondern setzt auch neue Maßstäbe in der Agentic Coding-Technologie.

Einführung in Qwen3-Coder

Qwen3-Coder ist in mehreren Größen verfügbar, wobei die leistungsstärkste Variante, Qwen3-Coder-480B-A35B-Instruct, die erste ist, die vorgestellt wird. Dieses Modell nutzt eine Mischung aus Experten und unterstützt eine native Kontextlänge von 256K Tokens sowie 1M Tokens mit Extrapolationsmethoden. Dadurch wird eine außergewöhnliche Leistung sowohl bei Programmier- als auch bei agentischen Aufgaben erzielt.

Leistungsmerkmale

Das Modell hat neue Maßstäbe in der offenen Modellierung gesetzt, insbesondere in den Bereichen Agentic Coding, Agentic Browser-Use und Agentic Tool-Use. Es wird als vergleichbar mit Claude Sonnet 4 angesehen. Neben dem Modell wird auch ein Open-Source-Tool für agentisches Programmieren vorgestellt: Qwen Code. Dieses CLI-Tool wurde von Gemini Code abgeleitet und mit angepassten Aufforderungen und Funktionsaufrufprotokollen ausgestattet, um die Fähigkeiten von Qwen3-Coder voll auszuschöpfen.

Vortraining und Skalierung

Im Vortraining hat Qwen3-Coder das Ziel, die Kernfähigkeiten des Modells zu stärken. Dies geschieht durch:

Token-Skalierung: 7,5 Billionen Tokens (70% Code-Verhältnis), die im Programmieren hervorragend abschneiden und gleichzeitig allgemeine und mathematische Fähigkeiten bewahren.
Kontext-Skalierung: Nativ unterstützt es 256K Kontext und kann auf bis zu 1M mit YaRN erweitert werden, optimiert für Repo-Skalierung und dynamische Daten (z.B. Pull Requests).
Skalierung synthetischer Daten: Qwen2.5-Coder wurde genutzt, um raue Daten zu bereinigen und umzuschreiben, was die Datenqualität erheblich verbessert.

Post-Training und Reinforcement Learning

Im Gegensatz zu dem vorherrschenden Fokus auf die Generierung von Wettbewerbs-Code in der Community glaubt das Qwen Team, dass alle Code-Aufgaben natürlich gut für ausführungsgestütztes, großflächiges Reinforcement Learning geeignet sind. Daher wurde das Training von Code RL auf einer breiteren Palette realer Programmieraufgaben skaliert. Durch die automatische Skalierung von Testfällen diverser Programmieraufgaben wurden qualitativ hochwertige Trainingsinstanzen geschaffen, die das volle Potenzial des Reinforcement Learning freisetzten.

Langfristige Interaktionen mit Reinforcement Learning

Bei realen Software-Engineering-Aufgaben wie SWE-Bench muss Qwen3-Coder in mehrstufigen Interaktionen mit der Umgebung agieren, was Planung, Nutzung von Tools, Feedback und Entscheidungsfindung umfasst. In der Post-Training-Phase wurde langfristiges RL (Agent RL) eingeführt, um das Modell zu ermutigen, reale Aufgaben durch mehrstufige Interaktionen mit Tools zu lösen. Die Herausforderung von Agent RL liegt in der Skalierung der Umgebung, die durch den Aufbau eines skalierbaren Systems, das 20.000 unabhängige Umgebungen parallel betreiben kann, angegangen wurde.

Programmieren mit Qwen3-Coder

Das Qwen Code Tool ist ein CLI-Tool, das für Forschungszwecke angepasst wurde und eine verbesserte Parser- und Tool-Unterstützung für Qwen-Coder Modelle bietet. Um Qwen Code zu installieren, benötigen Sie Node.js 20+ und können es mit den folgenden Befehlen installieren:

curl -qL https://www.npmjs.com/install.sh | sh
npm i -g @qwen-code/qwen-code

Alternativ können Sie es auch aus dem Quellcode installieren:

git clone https://github.com/QwenLM/qwen-code.git
cd qwen-code && npm install && npm install -g

Anwendungsbeispiele

Einige Anwendungsbeispiele für Qwen3-Coder umfassen:

Simulation einer physikbasierten Schornsteinabriss mit kontrollierter Explosion.
Webentwicklung mit Qwen.
Testen Ihrer WPM mit einem berühmten Zitat.
Simulation des Sonnensystems.

Fazit und Ausblick

Das Qwen Team arbeitet weiterhin aktiv an der Verbesserung der Leistung ihres Coding Agents, mit dem Ziel, komplexere und mühsame Aufgaben im Software Engineering zu übernehmen und so die menschliche Produktivität zu steigern. Zukünftige Modellgrößen von Qwen3-Coder sind in Planung, die starke Leistungen bei reduzierten Bereitstellungskosten bieten sollen.

Quellenliste:

Dieser Artikel wurde mithilfe von KI verfasst und basiert auf automatisch gesammelten Informationen.

QWEN3-CODER: AGENTIC CODING IN DER WELT

Einführung in Qwen3-Coder

Leistungsmerkmale

Vortraining und Skalierung

Post-Training und Reinforcement Learning

Langfristige Interaktionen mit Reinforcement Learning

Programmieren mit Qwen3-Coder

Anwendungsbeispiele

Fazit und Ausblick

Quellenliste:

Hinterlasse einen Kommentar

Schreibe einen Kommentar Antwort abbrechen

Über uns

Archive

Kategorien

Einführung in Qwen3-Coder

Leistungsmerkmale

Vortraining und Skalierung

Post-Training und Reinforcement Learning

Langfristige Interaktionen mit Reinforcement Learning

Programmieren mit Qwen3-Coder

Anwendungsbeispiele

Fazit und Ausblick

Quellenliste:

Das könnte Dich auch interessieren

Hinterlasse einen Kommentar

Schreibe einen Kommentar Antwort abbrechen

Über uns

Archive

Kategorien

Schlagwörter