Artikelbild für den Artikel: INSTITUTIONAL BOOKS 1.0: Ein bedeutendes Dataset für die Forschung

INSTITUTIONAL BOOKS 1.0: Ein bedeutendes Dataset für die Forschung

/
Die Harvard Library und Google Books haben 242 Milliarden Tokens aus nahezu 1 Million gemeinfreier Bücher veröffentlicht, die als hochwertiges Trainingsdataset dienen.