Text kann aus Dokumenten der meisten Formate und der meisten unterstützten Betriebssysteme erfolgreich extrahiert werden, darunter folgende Objekttypen und Texteinheiten:

  • Diagramme in PowerPoint 2007-, 2010- und 2013-Dateien

  • Tabellen in PowerPoint-Dokumenten unterstützen Anzeigefunktionen wie z. B.:

    • Schattierung von Zellen

    • Rahmeneffekte wie Abschrägung, Schatten und Spiegelung

    • Hintergrundinformationen wie Designfarben und Hintergrundfüllung, Hintergrundbilder, Farbverläufe und Muster

    • Horizontales und vertikales Zusammenführen von Zellen

  • Für PowerPoint 2007, 2010 und 2013 werden neue Formtypen unterstützt, darunter:

    • Pfeil nach links und oben, Pfeil nach rechts und oben, nach oben gebogener Pfeil, gebogener Pfeil, Pfeil nach links, Pfeil nach rechts, rechteckiger Pfeil, 180-Grad-Pfeil

    • Pfeil in vier Richtungen und Legende mit Pfeil in vier Richtungen

    • Symbole Herz, Rad, Halbbogen, Verbotszeichen

  • Für Dateien im MSG-Format werden Indizieren, Als Webseite anzeigen und das Generieren von Miniaturansichten unterstützt.

    In Content Server 16 ist die Funktion zur Erstellung von Miniaturansichten standardmäßig deaktiviert. Sie können sie aktivieren, indem Sie das Kontrollkästchen für application/x-outlook-msg auf der Seite Konfigurieren der Miniaturansicht für MIME-Typen auswählen. Details hierzu finden Sie unter So konfigurieren Sie Optionen für Miniaturansichten.

  • Das Visio XML-Format, Versionen 2013 und neuer, (application/vnd.ms-visio.drawing (.vsdx)) wird für die Textextrahierung und für Als Webseite anzeigen unterstützt.