DepescheModelleneu
Baidu „Unlimited OCR“: quelloffenes Dokumentmodell liest dutzende Seiten in einem Durchlauf
Baidu hat mit „Unlimited OCR“ (Paper „Unlimited OCR Works“, arXiv 2606.23050, eingereicht am 22. Juni 2026) ein quelloffenes Dokument-KI-Modell veröffentlicht, das dutzende Seiten in einem einzigen Forward-Pass verarbeitet – bisherige Systeme schaffen meist kaum mehr als zehn. Kern ist eine „Reference Sliding Window Attention“ (R-SWA), die den KV-Cache über die gesamte Dekodierung konstant hält, statt ihn mit der Seitenzahl anwachsen zu lassen. Code und Gewichte liegen unter MIT-Lizenz auf GitHub und Hugging Face; das Modell baut auf DeepSeek OCR auf.