Beiträge

TRAINING-FREE AGENT FÜR APP-AUTOMATISIERUNG
/
0 Kommentare
Der GUI-explorer ist ein bahnbrechender Agent, der ohne Training autonom mobile App-Oberflächen erkundet und Wissen extrahiert. Er adressiert Herausforderungen der GUI-Automatisierung in dynamischen Umgebungen.

EMERGING PROPERTIES IN UNIFIED MULTIMODAL PRETRAINING
ByteDance hat ein neues Open-Source-Multimodal-Foundation-Modell namens BAGEL veröffentlicht, das nativ multimodales Verständnis und Generierung unterstützt.

Notte Labs Web Agent Framework: Die Zukunft der KI-Agenten
Notte ist ein Open-Source-Framework zur Entwicklung von KI-Agenten, die Webseiten durchsuchen und mit ihnen interagieren. Die zentrale Innovation ist eine „Wahrnehmungsschicht“, die Webseiten in strukturierte, natürliche Sprachbeschreibungen umwandelt.

Rückblick auf die Google I/O 2025: AI-Ankündigungen im Podcast
In der neuesten Episode des Google AI: Release Notes-Podcasts werden die wichtigsten AI-Ankündigungen von der I/O 2025 vorgestellt, darunter Gemini 2.5 Pro Deep Think und das Entwickler-Tool Jules.

FutureHouse’s neues KI-System identifiziert erfolgreich eine neuartige Behandlung für die häufigste Ursache von Erblindung
FutureHouse hat mit seinem neuen KI-System Robin erfolgreich eine neuartige Behandlung für die altersbedingte Makuladegeneration identifiziert, die eine der häufigsten Ursachen für Erblindung darstellt.

Die Einführung des v0 AI Modells: Ein neuer Schritt in der Webentwicklung
Das v0 AI Modell, das spezialisiertes Wissen in der Webentwicklung bietet und eine OpenAI-kompatible API hat, ist jetzt in der Beta-Phase verfügbar.

LM Arena sichert sich 100 Millionen Dollar bei einer Bewertung von 600 Millionen Dollar
LM Arena, eine crowdsourced AI-Benchmarking-Plattform, hat 100 Millionen Dollar in Seed-Finanzierung gesichert, was die Organisation mit 600 Millionen Dollar bewertet.

Echtzeit-Sprachübersetzung in Google Meet
Google Meet hat die Echtzeit-Sprachübersetzung eingeführt, die auf dem Audio-Sprachmodell von DeepMind basiert und es ermöglicht, Stimme, Ton und Ausdruck über verschiedene Sprachen hinweg zu bewahren.

GOOGLE AI MODE IN SEARCH: Eine Revolution der Sucherfahrung
Google hat mit dem AI Mode in der Suche einen bedeutenden Schritt in Richtung einer umfassenderen und intelligenteren Sucherfahrung gemacht. Ab sofort steht dieser Modus allen Nutzern in den USA zur Verfügung und bietet eine tiefere, multimodale Suche mit fortgeschrittenem Denken.
