Zu jedem Content Server-Objekt gehören Metadaten, z. B. das Datum, an dem das Dokument erstellt wurde. Metadaten werden bei der Textextrahierung als separater Parameter (DIHS_META_DOC_INFO) an die Document Filters zurückgegeben.
Bei der Textextrahierung extrahiert der Filter Metadaten, entfernt jedoch keine Daten aus dem von OTDF zurückgegebenen Inhalt.
Der Filter erkennt HTML-Tags in den Metadaten und konvertiert sie in zu OT zugeordnete Tags. Die Zuordnung von HTML- zu OT-Tags wird in einer XML-Datei (htmlToOTTag.mapping) im Ordner OTHOME\config gespeichert. Wenn die Datei nicht gefunden oder nicht geöffnet werden kann, werden die ursprünglichen HTML-Tags verwendet.
Die Datentypen, die extrahiert und als Metadaten an den DCS zurückgegeben werden, werden in der Datei metadatatags.txt definiert.
Die standardmäßig eingestellten Namen der Metadaten-Tags mit OT-Präfix können geändert werden, indem Zuordnungen in die Datei htmltoOTTag.mapping eingefügt werden. Wenn Sie beispielsweise das Metadaten-Tag OTDocTitle für den Namen des Dokuments in CS16 umbenennen möchten, geben Sie Folgendes ein:
OTDocTitle = CS16DocTitle
PDF-Dateien, die komprimierte Tabellendokumente mit Querverweisen enthalten, werden unterstützt. Die Metadaten in komprimierten Querverweis-Tabellen und -Streams (XRefStm) können mit Standard- oder mit benutzerdefinierten Metadatenfeldern extrahiert werden.
Metadaten werden für alle Formate extrahiert, die in den aktuellen Versionshinweisen zu Content Server aufgeführt sind.