Beiträge

Artikelbild für den Artikel: Wie wir ein maßgeschneidertes Vision LLM zur Verbesserung der Dokumentenverarbeitung bei Grab entwickelt haben

Wie wir ein maßgeschneidertes Vision LLM zur Verbesserung der Dokumentenverarbeitung bei Grab entwickelt haben

/
Grab hat ein maßgeschneidertes Vision LLM entwickelt, um die Herausforderungen traditioneller OCR-Systeme in Südostasien zu überwinden und die Dokumentenverarbeitung zu verbessern.
Artikelbild für den Artikel: OLMOCR-2-7B-1025: Ein Durchbruch in der OCR-Technologie

OLMOCR-2-7B-1025: Ein Durchbruch in der OCR-Technologie

/
OLMOCR-2-7B-1025 von AllenAI stellt einen bedeutenden Fortschritt in der OCR-Technologie dar, optimiert für mathematische Gleichungen und komplexe Dokumente.
Artikelbild für den Artikel: DON'T BOTHER PARSING: JUST USE IMAGES FOR RAG

DON’T BOTHER PARSING: JUST USE IMAGES FOR RAG

/
In diesem Artikel wird erläutert, wie Morphik Vision Language Models nutzt, um die Herausforderungen der Dokumentenverarbeitung zu überwinden und Informationen aus komplexen PDFs effizient zu extrahieren.