Tongyi DeepResearch: Eine neue Ära der Open-Source KI-Forschung
Tongyi DeepResearch ist ein bahnbrechendes Open-Source-Tool, das für langfristige und tiefgreifende Informationssuche entwickelt wurde. In diesem Artikel werden wir die verschiedenen Aspekte dieses innovativen Modells untersuchen, das die Grenzen der KI-Forschung erweitert.
Von Chatbots zu autonomen Agenten
Wir sind stolz darauf, Tongyi DeepResearch vorzustellen, den ersten vollständig Open-Source-Webagenten, der in der Lage ist, Leistungen zu erbringen, die mit denen von OpenAI’s DeepResearch vergleichbar sind. Tongyi DeepResearch zeigt herausragende Ergebnisse in komplexen Informationssuchaufgaben und übertrifft bestehende proprietäre und Open-Source-Agenten.
Kontinuierliches Pre-Training und Post-Training
Ein zentrales Merkmal von Tongyi DeepResearch ist das Agentic Continual Pre-Training (CPT), das eine systematische und skalierbare Lösung für die Datensynthese bietet. Wir sammeln kontinuierlich Daten aus verschiedenen Quellen und strukturieren diese in ein offenes Wissensgedächtnis um, das es dem Modell ermöglicht, qualitativ hochwertige Fragen und Antworten zu generieren.
Kontinuierliches Pre-Training Daten
Durch die kontinuierliche Datensammlung und die Konstruktion von Fragen können wir die Entscheidungsfähigkeit des Modells erheblich verbessern. Unsere Methoden zur Aktionssynthese ermöglichen eine umfassende Erkundung des möglichen Entscheidungsraums.
Post-Training Daten
Wir haben einen End-to-End-Prozess zur Generierung synthetischer Daten entwickelt, der keine menschliche Intervention erfordert. Dieser Prozess gewährleistet die Erstellung von Datensätzen von übermenschlicher Qualität, die darauf abzielen, die Grenzen der KI-Agentenleistung zu verschieben.
Rollout-Modi
Das Modell unterstützt mehrere Rollout-Formate, darunter den nativen ReAct-Modus und den kontextverwaltenden Heavy-Modus. Diese Modi ermöglichen es dem Agenten, komplexe mehrstufige Forschungsaufgaben effizient zu bewältigen.
Native ReAct-Modus
Im nativen ReAct-Modus zeigt unser Modell hervorragende Leistungen ohne jegliches Prompt Engineering. Es folgt dem Thought-Action-Observation-Zyklus und kann eine große Anzahl von Interaktionsrunden bewältigen.
Heavy-Modus
Der Heavy-Modus wurde entwickelt, um die Fähigkeiten des Agenten bei komplexen Aufgaben zu maximieren. Durch die Iteration von Forschungsrunden kann der Agent seine kognitiven Ressourcen optimieren und die Qualität seiner Schlussfolgerungen verbessern.
Anwendungen in der realen Welt
Tongyi DeepResearch ist nicht nur ein Forschungstool, sondern wird bereits in realen Anwendungen eingesetzt. Beispiele sind:
- Gaode Mate: Ein KI-Copilot, der komplexe Reiseplanungsaufgaben autonom ausführt.
 - Tongyi FaRui: Ein rechtlicher Forschungsagent, der komplexe Recherchen durchführt und präzise rechtliche Analysen liefert.
 
Herausforderungen und Einschränkungen
Trotz seiner Fortschritte hat Tongyi DeepResearch einige Einschränkungen. Die aktuelle Kontextlänge von 128k ist möglicherweise nicht ausreichend für die komplexesten Aufgaben, und die Skalierbarkeit des Trainingsprozesses muss noch validiert werden.
Fazit
Mit Tongyi DeepResearch wird eine neue Ära der Open-Source-KI-Forschung eingeläutet. Das Modell bietet nicht nur innovative Ansätze zur Datensynthese und Agentenausbildung, sondern zeigt auch vielversprechende Anwendungen in der realen Welt. Die kontinuierliche Verbesserung und Anpassung wird entscheidend sein, um die Herausforderungen der Zukunft zu meistern.
Quellenliste:
- Quelle: Tongyi DeepResearch: A New Era of Open-Source AI Researchers
 - WebWalker: Benchmarking LLMs in Web Traversal
 - WebDancer: Towards Autonomous Information Seeking Agency
 - WebSailor: Navigating Super-human Reasoning for Web Agent
 - WebShaper: Agentically Data Synthesizing via Information-Seeking Formalization
 









Hinterlasse einen Kommentar
An der Diskussion beteiligen?Hinterlasse uns deinen Kommentar!