Beiträge

TRAINING-FREE AGENT FÜR APP-AUTOMATISIERUNG
/
0 Kommentare
Der GUI-explorer ist ein bahnbrechender Agent, der ohne Training autonom mobile App-Oberflächen erkundet und Wissen extrahiert. Er adressiert Herausforderungen der GUI-Automatisierung in dynamischen Umgebungen.

EMERGING PROPERTIES IN UNIFIED MULTIMODAL PRETRAINING
ByteDance hat ein neues Open-Source-Multimodal-Foundation-Modell namens BAGEL veröffentlicht, das nativ multimodales Verständnis und Generierung unterstützt.

Notte Labs Web Agent Framework: Die Zukunft der KI-Agenten
Notte ist ein Open-Source-Framework zur Entwicklung von KI-Agenten, die Webseiten durchsuchen und mit ihnen interagieren. Die zentrale Innovation ist eine „Wahrnehmungsschicht“, die Webseiten in strukturierte, natürliche Sprachbeschreibungen umwandelt.

Rückblick auf die Google I/O 2025: AI-Ankündigungen im Podcast
In der neuesten Episode des Google AI: Release Notes-Podcasts werden die wichtigsten AI-Ankündigungen von der I/O 2025 vorgestellt, darunter Gemini 2.5 Pro Deep Think und das Entwickler-Tool Jules.

FutureHouse’s neues KI-System identifiziert erfolgreich eine neuartige Behandlung für die häufigste Ursache von Erblindung
FutureHouse hat mit seinem neuen KI-System Robin erfolgreich eine neuartige Behandlung für die altersbedingte Makuladegeneration identifiziert, die eine der häufigsten Ursachen für Erblindung darstellt.

Die Einführung des v0 AI Modells: Ein neuer Schritt in der Webentwicklung
Das v0 AI Modell, das spezialisiertes Wissen in der Webentwicklung bietet und eine OpenAI-kompatible API hat, ist jetzt in der Beta-Phase verfügbar.

LM Arena sichert sich 100 Millionen Dollar bei einer Bewertung von 600 Millionen Dollar
LM Arena, eine crowdsourced AI-Benchmarking-Plattform, hat 100 Millionen Dollar in Seed-Finanzierung gesichert, was die Organisation mit 600 Millionen Dollar bewertet.

Einführung des AI Gateway von Vercel: Ein neuer Standard für KI-Integration
Vercel hat das AI Gateway eingeführt, das Entwicklern den einfachen Wechsel zwischen rund 100 KI-Modellen ermöglicht, ohne API-Schlüssel zu verwalten.

IMAGEN 4, VEO 3 und LYRIA 2: Die nächste Welle generativer KI-Modelle von Google
Die neuen generativen KI-Modelle von Google, Imagen 4, Veo 3 und Lyria 2, revolutionieren die Erstellung von Bildern, Videos und Musik auf Vertex AI.
