Beiträge

Artikelbild für den Artikel: TRAINING-FREE AGENT FÜR APP-AUTOMATISIERUNG

TRAINING-FREE AGENT FÜR APP-AUTOMATISIERUNG

/
Der GUI-explorer ist ein bahnbrechender Agent, der ohne Training autonom mobile App-Oberflächen erkundet und Wissen extrahiert. Er adressiert Herausforderungen der GUI-Automatisierung in dynamischen Umgebungen.
Artikelbild für den Artikel: EMERGING PROPERTIES IN UNIFIED MULTIMODAL PRETRAINING

EMERGING PROPERTIES IN UNIFIED MULTIMODAL PRETRAINING

/
ByteDance hat ein neues Open-Source-Multimodal-Foundation-Modell namens BAGEL veröffentlicht, das nativ multimodales Verständnis und Generierung unterstützt.
Artikelbild für den Artikel: Notte Labs Web Agent Framework: Die Zukunft der KI-Agenten

Notte Labs Web Agent Framework: Die Zukunft der KI-Agenten

/
Notte ist ein Open-Source-Framework zur Entwicklung von KI-Agenten, die Webseiten durchsuchen und mit ihnen interagieren. Die zentrale Innovation ist eine „Wahrnehmungsschicht“, die Webseiten in strukturierte, natürliche Sprachbeschreibungen umwandelt.
Artikelbild für den Artikel: Rückblick auf die Google I/O 2025: AI-Ankündigungen im Podcast

Rückblick auf die Google I/O 2025: AI-Ankündigungen im Podcast

/
In der neuesten Episode des Google AI: Release Notes-Podcasts werden die wichtigsten AI-Ankündigungen von der I/O 2025 vorgestellt, darunter Gemini 2.5 Pro Deep Think und das Entwickler-Tool Jules.
Artikelbild für den Artikel: FutureHouse's neues KI-System identifiziert erfolgreich eine neuartige Behandlung für die häufigste Ursache von Erblindung

FutureHouse’s neues KI-System identifiziert erfolgreich eine neuartige Behandlung für die häufigste Ursache von Erblindung

/
FutureHouse hat mit seinem neuen KI-System Robin erfolgreich eine neuartige Behandlung für die altersbedingte Makuladegeneration identifiziert, die eine der häufigsten Ursachen für Erblindung darstellt.
Artikelbild für den Artikel: Die Einführung des v0 AI Modells: Ein neuer Schritt in der Webentwicklung

Die Einführung des v0 AI Modells: Ein neuer Schritt in der Webentwicklung

/
Das v0 AI Modell, das spezialisiertes Wissen in der Webentwicklung bietet und eine OpenAI-kompatible API hat, ist jetzt in der Beta-Phase verfügbar.
Artikelbild für den Artikel: LM Arena sichert sich 100 Millionen Dollar bei einer Bewertung von 600 Millionen Dollar

LM Arena sichert sich 100 Millionen Dollar bei einer Bewertung von 600 Millionen Dollar

/
LM Arena, eine crowdsourced AI-Benchmarking-Plattform, hat 100 Millionen Dollar in Seed-Finanzierung gesichert, was die Organisation mit 600 Millionen Dollar bewertet.
Artikelbild für den Artikel: Echtzeit-Sprachübersetzung in Google Meet

Echtzeit-Sprachübersetzung in Google Meet

/
Google Meet hat die Echtzeit-Sprachübersetzung eingeführt, die auf dem Audio-Sprachmodell von DeepMind basiert und es ermöglicht, Stimme, Ton und Ausdruck über verschiedene Sprachen hinweg zu bewahren.
Artikelbild für den Artikel: GOOGLE AI MODE IN SEARCH: Eine Revolution der Sucherfahrung

GOOGLE AI MODE IN SEARCH: Eine Revolution der Sucherfahrung

/
Google hat mit dem AI Mode in der Suche einen bedeutenden Schritt in Richtung einer umfassenderen und intelligenteren Sucherfahrung gemacht. Ab sofort steht dieser Modus allen Nutzern in den USA zur Verfügung und bietet eine tiefere, multimodale Suche mit fortgeschrittenem Denken.