Beiträge

Artikelbild für den Artikel: Neue KI-gestützte Barrierefreiheitsfunktionen von Google

Neue KI-gestützte Barrierefreiheitsfunktionen von Google

/
Google hat neue KI-gestützte Barrierefreiheitsfunktionen für Android und Chrome eingeführt, die das Screen Reading, die Spracherkennung und das Verständnis von Bildern verbessern.
Artikelbild für den Artikel: HeyGen launcht Avatar IV – Das fortschrittlichste KI-Avatar-Modell bisher

HeyGen launcht Avatar IV – Das fortschrittlichste KI-Avatar-Modell bisher

/
HeyGen hat mit dem Avatar IV ein neues, bahnbrechendes KI-Avatar-Modell vorgestellt, das Emotionen und Intentionen versteht und fotorealistische Gesichtsausdrücke aus einem einzigen Bild erzeugt.
Artikelbild für den Artikel: STABILITY AI TEXT-TO-AUDIO MODEL: Stable Audio Open Small

STABILITY AI TEXT-TO-AUDIO MODEL: Stable Audio Open Small

/
Stability AI hat mit Stable Audio Open Small ein neues, open-source Text-zu-Audio-Modell veröffentlicht, das für die Ausführung auf Arm-CPUs optimiert ist. Mit 341 Millionen Parametern ermöglicht dieses Modell die schnelle Generierung von kurzen Audiosamples.
Artikelbild für den Artikel: OpenAI startet Safety Metrics Hub angesichts von Transparenzbedenken

OpenAI startet Safety Metrics Hub angesichts von Transparenzbedenken

/
OpenAI hat einen Safety Evaluations Hub vorgestellt, der die Leistung von Modellen in Bezug auf Halluzinationen, schädliche Inhalte, Jailbreak-Widerstand und Anweisungsbefolgung verfolgt.
Artikelbild für den Artikel: Google integriert Gemini Nano in Chrome zur Bekämpfung von Online-Betrug

Google integriert Gemini Nano in Chrome zur Bekämpfung von Online-Betrug

/
Google hat Gemini Nano in Chrome integriert, um Nutzer vor Online-Betrug zu schützen. Der Artikel beleuchtet die neuen Technologien und Maßnahmen, die Google ergreift, um Betrügereien zu bekämpfen.
Artikelbild für den Artikel: Intelligente Nachrichtenaggregation mit MCP, Q und tmux

Intelligente Nachrichtenaggregation mit MCP, Q und tmux

/
Ein Principal Applied Scientist bei Amazon hat ein intelligentes Nachrichtenaggregationssystem entwickelt, das auf Amazon Q CLI und Model Control Protocol (MCP) basiert.
Artikelbild für den Artikel: VOID: Open-Source AI Code Editor

VOID: Open-Source AI Code Editor

/
VOID ist ein Open-Source-Code-Editor, der als Fork von Visual Studio Code entwickelt wurde und direkte Verbindungen zu KI-Modellen ermöglicht, ohne Daten über Drittanbieter-Server zu leiten.
Artikelbild für den Artikel: TikTok AI Alive: Bringen Sie Ihre Fotos zum Leben

TikTok AI Alive: Bringen Sie Ihre Fotos zum Leben

/
TikTok hat mit AI Alive eine neue Funktion eingeführt, die statische Bilder in dynamische Videos verwandelt und somit das visuelle Storytelling revolutioniert.
Artikelbild für den Artikel: Audible erweitert seine Bibliothek mit KI-narrativen Hörbüchern

Audible erweitert seine Bibliothek mit KI-narrativen Hörbüchern

/
Audible, der Hörbuchdienst von Amazon, erweitert sein Angebot um KI-narrative Hörbücher und bietet über 100 Stimmen in mehreren Sprachen an.