Beiträge

Artikelbild für den Artikel: TimeScope: Wie gut können multimodale Modelle lange Videos verarbeiten?

TimeScope: Wie gut können multimodale Modelle lange Videos verarbeiten?

/
TimeScope ist ein neuer Open-Source-Benchmark zur Bewertung von Vision-Modellen und deren Fähigkeit, lange Videos zu verarbeiten. Der Benchmark untersucht nicht nur die Abrufbarkeit von Informationen, sondern auch die Synthese, Lokalisierung und feingranulare Bewegungsanalyse.