Die meisten in Content Server gespeicherten Objekte sind von Natur aus nicht indizierbar und müssen folglich einen Konvertierungsfilter durchlaufen. Konvertierungsfilter konvertieren Objekte aus ihren nativen MIME-Typen (wie Microsoft Word, Adobe, PDF oder ASCII-Text) in ein indexfähiges Format um, d. h. entweder in HTML oder in einfachen Text. Dieser Konvertierungsprozess wird in Datenflüssen durchgeführt und als Dokumentkonvertierungsprozess bezeichnet.

In Content Server stehen drei Typen von Konvertierungsfiltern zur Verfügung:

  • OpenText Dokumentfilter (IM-Filter)

  • Quality Document Filter (QDF)

  • XPDF

OpenText Dokumentfilter (IM-Filter)

OpenText Dokumentfilter verwenden Filterpakete, um Objekte aus ihren nativen Dateiformaten (beispielsweise Microsoft Word, Microsoft Excel oder Adobe PDF) in ein einfaches Textformat (beispielsweise HTML oder Text) zu konvertieren, damit sie in Content Server angezeigt oder indiziert werden können. Mit dem IM-Filter können Content Server-Objekte angezeigt werden.

Der IM-Filter konvertiert Dokumente aus ihren nativen Formaten zu Anzeige- und Indizierungszwecken in HTML oder einfachen Text. Nach der Konvertierung können die meisten Dokumente mithilfe der Funktion Als Web-Seite anzeigen als Rasterbilder angezeigt werden. Dateien in Word-, Excel- oder RTF-Formaten werden als Text angezeigt, der durchsucht und indiziert werden kann.

Der IM-Filter ist die Bibliothek, die mit DCS kommuniziert, um Textextrahierung und Metadatenextrahierung bereitzustellen. Die Bibliothek leitet Anforderungen zur TextExtraction- und MIMEtype-Erkennung über Dateinamen oder Pufferinhalte von DCS nach DCSIm weiter. Der gesamte von DCSIm extrahierte Text wird über UTF-8-Codierung an DCS zurückgegeben.

Da DCSIm noch nicht so eingerichtet ist, dass Extrahierungsanforderungen für Pufferinhalt für die meisten Formate verarbeitet werden können, wird eine temporäre Datei erstellt und auf Festplatte gespeichert, außer 95-2010-Dokumente des Microsoft Office-Formats. Sie können den IM-Filter konfigurieren, indem Sie den Abschnitt [DCSIm] der Datei opentext.ini bearbeiten. Weitere Informationen finden Sie unter [DCSIm].

QDF

Standardmäßig konvertiert Content Server Daten mithilfe von QDFs. QDFs sind Konvertierungsfilter, die speziell zum schnellen Filtern von Objekten entwickelt worden sind. Sie entfernen alle Formatierungen und geben anstelle von HTML einfachen Text aus. QDFs wurden zur Ausführung im Arbeitsspeicher entwickelt, anstatt vom Datenträger zu lesen, was ebenfalls zu ihrer Geschwindigkeit beiträgt.

Sie können QDFs konfigurieren, indem Sie den Abschnitt [QDF] der Datei opentext.ini bearbeiten. Weitere Informationen finden Sie unter [QDF].