Glossar-Eintrag
Metadaten
Zusatzinformationen über ein Dokument, etwa Titel, Autor, Erstellungsdatum und verwendete Software.
Metadaten sind Informationen über ein Dokument, die nicht zum sichtbaren Inhalt gehören. Dazu zählen Titel, Autor, Erstellungs- und Änderungsdatum, Schlagwörter sowie die Software, mit der die Datei erzeugt wurde. In einem PDF liegen sie im Dokument-Info-Wörterbuch oder als XMP-Block vor.
Beim Auslesen mit pdfjs lassen sich diese Angaben abfragen. Sie können nützlich sein, um etwa den Titel des erzeugten Word-Dokuments vorzubelegen oder zu erkennen, ob ein PDF aus einem Textprogramm oder aus einem Scanner stammt.
Datenschutzrelevant ist, dass Metadaten oft mehr verraten als beabsichtigt, etwa den Namen des Autors oder den Bearbeitungsverlauf. Da die Umwandlung hier vollständig im Browser stattfindet, verlassen weder Inhalt noch Metadaten das Gerät des Nutzers.
Verwandte Begriffe
Portable Document Format, ein plattformunabhängiges Format zur seitengetreuen Darstellung von Dokumenten.
PDF/A
Für die Langzeitarchivierung normierte PDF-Variante mit eingebetteten Schriften und ohne externe Abhängigkeiten.
pdf.js
JavaScript-Bibliothek von Mozilla, die PDFs im Browser darstellt und ihre Textebene ausliest.