Beiträge

TRAINING-FREE AGENT FÜR APP-AUTOMATISIERUNG
/
0 Kommentare
Der GUI-explorer ist ein bahnbrechender Agent, der ohne Training autonom mobile App-Oberflächen erkundet und Wissen extrahiert. Er adressiert Herausforderungen der GUI-Automatisierung in dynamischen Umgebungen.

EMERGING PROPERTIES IN UNIFIED MULTIMODAL PRETRAINING
ByteDance hat ein neues Open-Source-Multimodal-Foundation-Modell namens BAGEL veröffentlicht, das nativ multimodales Verständnis und Generierung unterstützt.

Notte Labs Web Agent Framework: Die Zukunft der KI-Agenten
Notte ist ein Open-Source-Framework zur Entwicklung von KI-Agenten, die Webseiten durchsuchen und mit ihnen interagieren. Die zentrale Innovation ist eine „Wahrnehmungsschicht“, die Webseiten in strukturierte, natürliche Sprachbeschreibungen umwandelt.

Rückblick auf die Google I/O 2025: AI-Ankündigungen im Podcast
In der neuesten Episode des Google AI: Release Notes-Podcasts werden die wichtigsten AI-Ankündigungen von der I/O 2025 vorgestellt, darunter Gemini 2.5 Pro Deep Think und das Entwickler-Tool Jules.

FutureHouse’s neues KI-System identifiziert erfolgreich eine neuartige Behandlung für die häufigste Ursache von Erblindung
FutureHouse hat mit seinem neuen KI-System Robin erfolgreich eine neuartige Behandlung für die altersbedingte Makuladegeneration identifiziert, die eine der häufigsten Ursachen für Erblindung darstellt.

Die Einführung des v0 AI Modells: Ein neuer Schritt in der Webentwicklung
Das v0 AI Modell, das spezialisiertes Wissen in der Webentwicklung bietet und eine OpenAI-kompatible API hat, ist jetzt in der Beta-Phase verfügbar.

LM Arena sichert sich 100 Millionen Dollar bei einer Bewertung von 600 Millionen Dollar
LM Arena, eine crowdsourced AI-Benchmarking-Plattform, hat 100 Millionen Dollar in Seed-Finanzierung gesichert, was die Organisation mit 600 Millionen Dollar bewertet.

GOOGLE’S ‘JULES’ ENTERS AI CODING RACE WITH AUTONOMOUS AGENT APPROACH
Google hat seinen autonomen Coding-Agenten Jules der Öffentlichkeit zugänglich gemacht. Das Tool nutzt KI, um Entwickler bei der Programmierung zu unterstützen, indem es Tests schreibt, Bugs behebt und neue Funktionen entwickelt.

EXCLUSIVE: GOOGLE SEES SMART GLASSES AS THE ‘NEXT FRONTIER’ FOR AI
Google kehrt mit Android XR in den Bereich der Smart Glasses zurück und integriert seine Gemini AI, um eine Echtzeitanalyse von Bildern, Übersetzungen und kontextuelle Unterstützung durch AR-Brillen zu bieten.
