Unser humanoider Avatar Kilian hat sprichwörtlich Augen bekommen: Dank geeigneter multimodaler Vision-Modelle kann er ab sofort nicht nur Objekte erkennen, sondern auch gedruckte Texte und Zeitungsartikel live über die Kamera erfassen. Das System analysiert den Text in Sekundenschnelle, fasst die Kernpunkte zusammen und steht direkt für ein vertiefendes Gespräch bereit. Entwickelt wurde diese Erweiterung als Showcase für das Hessische Ministerium für Digitalisierung und Innovation.
Die komplexe Systemarchitektur hinter dem Projekt nehmen wir im aktuellen Weekly Talk Kilian liest mit: Vom Dokument zum KI-Gespräch detailreich auseinander.
Wer den Avatar selbst einmal testen und ihm ein Dokument in die Kamera halten möchte, findet den Live-Showcase unter INOSOFT.de/kilian.
26. Juni 2026