Unterstützte Dateitypen¶
Die Read-File-Komponente verarbeitet eine Reihe von Formaten. Welche Formate in einer bestimmten Konfiguration akzeptiert werden, hängt vom gewählten Extraktions-Backend ab — und bei Upload-Targets zusätzlich vom Feld Allowed Upload Extensions.
Standard-Dateiunterstützung¶
Die folgenden Formate sind vom Upstream-Langflow übernommen (Backend docling).
KARLI-Extraktions-Unterstützung¶
Steht Extraction Backend auf karli, hängen die unterstützten Formate vom gewählten Modell ab:
| Modell | Akzeptiert |
|---|---|
karli/default-data-extraction |
Jede unterstützte Datei (der Dienst wählt den Extraktor). |
karli/data-extraction-moe-latest |
Jede unterstützte Datei (MoE-Router wählt pro Dateityp und pro Seite bei PDFs den optimalen Extraktor). |
docling-project/docling, datalab-to/marker, opendatalab/MinerU, karli/multimodal-data-extraction |
Dokumentformate (PDF und ähnliches). |
openai/whisper-large-v3 |
Audioformate. |
Vor dem Upload prüft die Komponente die Datei gegen den akzeptierten Typ des gewählten Modells.
Das MoE-Modell unterstützt eine breite Palette an Formaten: PDF, Word (doc/docx), Präsentationen (ppt/pptx), Tabellen (xls/xlsx/csv), HTML, Bilder (png/jpg/gif/bmp/tiff/webp), Audio (aac/mpeg/wav/webm/mp3/mp4), E-Mail (eml/msg/pst) und Klartext. Die vollständige Routing-Tabelle findet sich unter Modelle → Datenextraktion.