Zu jedem Content Server-Objekt gehören Metadaten, z. B. das Datum, an dem das Dokument erstellt wurde. Metadaten werden bei der Textextrahierung als separater Parameter (DIHS_META_DOC_INFO) an die Document Filters zurückgegeben.

Bei der Textextrahierung extrahiert der Filter Metadaten, entfernt jedoch keine Daten aus dem von OTDF zurückgegebenen Inhalt.

Der Filter erkennt HTML-Tags in den Metadaten und konvertiert sie in zu OT zugeordnete Tags. Die Zuordnung von HTML- zu OT-Tags wird in einer XML-Datei (htmlToOTTag.mapping) im Ordner OTHOME\config gespeichert. Wenn die Datei nicht gefunden oder nicht geöffnet werden kann, werden die ursprünglichen HTML-Tags verwendet.

Die Datentypen, die extrahiert und als Metadaten an den DCS zurückgegeben werden, werden in der Datei metadatatags.txt definiert.

Die standardmäßig eingestellten Namen der Metadaten-Tags mit OT-Präfix können geändert werden, indem Zuordnungen in die Datei htmltoOTTag.mapping eingefügt werden. Wenn Sie beispielsweise das Metadaten-Tag OTDocTitle für den Namen des Dokuments in CS16 umbenennen möchten, geben Sie Folgendes ein:

OTDocTitle = CS16DocTitle

PDF-Dateien, die komprimierte Tabellendokumente mit Querverweisen enthalten, werden unterstützt. Die Metadaten in komprimierten Querverweis-Tabellen und -Streams (XRefStm) können mit Standard- oder mit benutzerdefinierten Metadatenfeldern extrahiert werden.

Metadaten werden für alle Formate extrahiert, die in den aktuellen Versionshinweisen zu Content Server aufgeführt sind.