Impulse Technologie & Architektur

Was sind Meta­daten und warum sind sie wich­tig?

Geschätzte Lesedauer: 6 Minuten



von Stephanie Schuldes

Gesicht eines Mannes, der aufmerksam auf mehrere Ebenen von durchscheinendem Text und Diagrammen blickt

Wo landen Rechnungen, E-Mails und Dokumente zuerst? In einem Ordner. Doch jede noch so clevere Struktur stößt an ihre Grenzen, wenn mehrere Köpfe zusammenarbeiten: Wo ist das Dokument nochmal? Ich brauche es für mein Projekt. Schnell eine Kopie machen … Und so nimmt das Chaos seinen Lauf.

Am Ende zählt nur eines: dass jeder so schnell wie möglich die Informationen bekommt, die er braucht – egal, wo sie liegen. Laut der Value of Data Study, die von Vanson Bourne für Veritas durchgeführt wurde, verbringen Mitarbeiter durchschnittlich zwei Stunden pro Tag mit der Suche nach Informationen. Diese Zeit könnten sie sinnvoller für die Arbeit mit diesen Informationen nutzen.

Metadaten sind eine Möglichkeit, die Effizienz der täglichen Arbeit zu verbessern. Was ausgefallen erscheint, ist in Wirklichkeit etwas, das jeder aus dem täglichen Leben kennt.

Was sind Metadaten?

Metadaten sind Informationen, die einen Inhalt beschreiben und in einen Kontext stellen. Da Metadaten viele Formen annehmen können, ist diese Definition absichtlich weit gefasst. Im Allgemeinen werden Metadaten in drei Typen eingeteilt:

  • Deskriptive Metadaten erleichtern das Auffinden und Verstehen des Inhalts.
  • Administrative Metadaten helfen bei der korrekten Verwaltung und Speicherung von Inhalten in Über­ein­stimmung mit Rechten und Vorschriften.
  • Strukturelle Metadaten beschreiben, wie verschiedene Teile des Inhalts miteinander interagieren.

Metadaten sind nicht auf Dokumente oder technische Daten beschränkt. Sie werden in alltäglichen Situationen verwendet, um Dinge zu kategorisieren. Zu den Metadaten gehören Informationen wie Etiketten auf Kartons während eines Umzugs, Musikgenres und das Datum und die Größe einer Fotodatei.

Arten von Metadaten

Die National Informational Standards Organization (NISO) nennt die folgenden Arten von Metadaten:

  • Beschreibende Metadaten
    • helfen beim Auffinden oder Ver­stehen einer Ressource, indem sie Infor­mationen über den Inhalt liefern
    • Beispiel: Titel, Autor, Thema, Genre, Veröffent­lichungsdatum
    • primäre Verwendung: Suche, An­zeige, Interoperabilität
  • Administrative Metadaten
    • Technische Metadaten
      • liefern Informationen, die zum Dekodieren und Rendern der Ressource benötigt werden
      • Beispiel: Dateityp, Dateigröße, Erstellungsdatum/-zeit, Kom­pressions­schema
      • Hauptanwendung: Interoperabilität, Verwaltung digitaler Objekte, Bewahrung
    • Erhaltungsmetadaten
      • helfen bei der Langzeitarchivierung digitaler Ressourcen
      • Beispiel: Prüfsumme, Hash, Konser­vierungsereignis
      • primäre Verwendung: Inter­operabilität, Verwaltung digitaler Objekte, Lang­zeit­archi­vierung
    • Rechte-Metadaten
      • liefern Informationen über die geistigen Eigentumsrechte, die die Nutzung der Ressource und ihres Inhalts regeln
      • Beispiel: Creative-Commons-Lizenz
      • primäre Verwendung: Inter­operabilität, Verwaltung digitaler Objekte
    • Strukturelle Metadaten
      • liefern Informationen darüber, wie verschiedene Teile einer oder mehrerer Ressourcen zueinander in Beziehung stehen
      • Beispiel: Seitenreihen­folge eines Dokuments, Inhalts­verzeichnis eines Dokuments, Verbindung verschiedener Auflösungen von identischem Inhalt
      • Hauptanwendung: Navigation
  • Markup-Sprachen
    • kombinieren Metadaten und Daten/Inhalt
    • Beispiel: Formatierung in einem Dokument, Kenn­zeichnung von Wörtern mit seman­tischen Infor­mationen (z. B. Ort, Wortart)
    • Hauptanwendung: Navigation, Inter­operabilität
Text- und Dokumentensymbole über Laptop mit tippenden Händen

Was sind die Vorteile von Metadaten gegenüber Ordnern?

Ordner sind nicht so anpassungsfähig wie Metadaten. Ein traditioneller, auf Ordnern basierender Ansatz organisiert den Inhalt in beschrifteten Ablagen für bestimmte Zwecke. Das macht es schwierig, sie in einem anderen Kontext wiederzufinden. Vielleicht benötigen Sie die gleichen Informationen für ein anderes Projekt. Ein Kollege aus einer anderen Abteilung könnte sie in einem völlig anderen Kontext nutzen. In diesem Fall kann eines von zwei Dingen passieren: Entweder verwenden Sie den Content nicht (weil Sie ihn vergessen haben oder nicht wussten, dass er existiert), oder Sie erstellen ein Duplikat in Ihrem aktuellen Arbeitsverzeichnis. Und vielleicht tut Ihr Kollege dasselbe. Das Ergebnis ist, dass der Inhalt an mehreren Orten landet, was mehr Speicherplatz benötigt und eine Versionsverfolgung unmöglich macht.

Bei einem metadatenbasierten Ansatz macht es keinen Unterschied, wo der Inhalt gespeichert ist. Wenn Sie eine Suche durchführen, die die mit dem Inhalt verknüpften Metadaten enthält, werden diese in den Ergebnissen angezeigt.

Warum sind Metadaten wichtig?

Metadaten helfen bei der Lösung typischer Probleme, die bei der täglichen Arbeit mit Dateien auftreten, wie etwa:

  • Was ist die aktuellste Version? Und wo kann ich sie finden?
  • Wo sollte ich sie speichern? Welches ist der richtige Ordner?
  • Wer hat die Änderungen an diesem Dokument vorgenommen?

Mit einem metadatenzentrierten Ansatz legen Sie nur fest, welche Art von Informationen Sie im System speichern wollen, nicht wo. Das bedeutet, dass Sie sich keine Gedanken über Ordnerstrukturen machen müssen oder darüber, wo Sie (oder andere) diese Informationen in Zukunft benötigen könnten.

Sie brauchen auch keine Duplikate an verschiedenen Orten zu speichern. Alles, was Sie tun müssen, ist, so viele Details über die Information zu speichern, wie Sie für die spätere Identifizierung für wichtig erachten.

Vorteile von Metadaten

  • Informationen leichter finden. Metadaten machen es einfach, die Such­er­gebnisse einzugrenzen, je nachdem, wer nach Informationen sucht. Benutzer können Suchkriterien flexibel kombinieren, so dass sie ihren Bedürfnissen ent­sprechen. So können sie schnell auf die gewünschten Informationen zugreifen, ohne wissen zu müssen, wo genau die Inhalte gespeichert sind. Diese Art des Infor­mations­zugriffs ermöglicht es Anwendern auch, relevante Inhalte zu entdecken, die sie sonst nicht gefunden hätten. Es bietet ihnen eine breitere Sicht und mehr Mög­lichkeiten.
  • Keine Duplikate. Sie können über die Suche und Filter auf Dateien zu­greifen, unabhängig davon, wo sie im System liegen.
  • Inhalt im Kontext. Metadaten ermöglichen es, Inhalte organischer zu organisieren. Sie ermöglichen die Verknüpfung von Inhalten, auch wenn diese in verschiedenen Repositories oder Anwendungen gespeichert sind. Dieser Kontext ermöglicht es verschiedenen Personen, auf Inhalte zuzugreifen und sie so zu nutzen, wie sie es benötigen.
  • Bessere Suche. Die Sucher­gebnisse sind präziser, da Sie Ihre Suche mit Kategorien eingrenzen können, die für den Inhalt selbst relevant sind (statt die Suche über Ordner, die nach Projekten usw. benannt sind).
  • Effiziente Autorisierung. Früher waren Berechtigungen an Ordner gebunden. Das bedeutete auch, dass sie auf dieser Ebene geändert werden mussten. Mit Metadaten lassen sich Berechtigungen über Rollen implementieren. Dies bindet die Berechtigungen an die Be­nutzer­verwaltung und macht es viel einfacher, die Zugriffs­rechte für ganze Gruppen von Benutzern zu steuern.

Wie werden Metadaten erstellt?

Idealerweise werden die Metadaten zum Zeitpunkt der Erfassung der Inhalte im System erstellt. Andernfalls kann die Sammlung zu schnell wachsen und schwer zu verwalten werden.

Metadaten können manuell, halbautomatisch oder vollautomatisch mithilfe von maschinellen Lernalgorithmen hinzugefügt werden.

  • manuell: Benutzer fügen Metadaten von Hand hinzu
    • Pro: genaue Daten
    • Contra: viel Arbeit, mühsam, zeitaufwendig
  • halbautomatisch: automatische Vorschläge
    • Pro: erleichtert die Erfassung für den Anwender
    • Contra: benötigt immer noch menschliche Interaktion
  • Machine Learning: Algorithmus taggt Inhalte automatisch
    • Pro: geringer manueller Aufwand für den Benutzer, Genauigkeit kann sehr hoch sein, schnell, Benutzer haben mehr Zeit für andere Aufgaben
    • Contra: muss erst trainiert werden, bevor er eingesetzt werden kann, Fehler können auftreten

Wie funktioniert die Arbeit mit Metadaten?

Metadaten sind Daten, die Informationen über andere Daten enthalten. Sie ermöglichen es Ihnen, ein Gefühl dafür zu bekommen, worum es in einem Dokument oder einem anderen Inhalt geht, bevor Sie es öffnen – mehr als nur den Dateinamen oder den Speicherort. Sie informieren Sie über bestimmte Aspekte des eigentlichen Inhalts. Da sie strukturiert sind, helfen sie bei der Einordnung von Inhalten in Kategorien, die dann verwendet werden können, um die Ergebnisse einer Suche einzugrenzen oder zu filtern.

Metadaten erweitern auch die Anzahl der Möglichkeiten, auf Inhalte zuzugreifen. Wenn Sie nicht wissen, wonach Sie in einer Kategorie suchen sollen, versuchen Sie eine andere oder kombinieren Sie mehrere, um Ihre Suche einzugrenzen. Das bedeutet auch, dass es zahlreiche Kombinationen von Suchbegriffen oder Filtern gibt, die denselben Inhalt in völlig unterschiedlichen Kontexten enthalten können, die einige Merkmale gemeinsam haben. Selbst wenn Sie nicht daran gedacht haben, nach diesem bestimmten Inhalt zu suchen, kann die Information für Ihre aktuelle Aufgabe nützlich sein.

Darüber hinaus ermöglicht ein Informationsmanagementsystem die Implementierung von metadatenbasierten Funktionen, die die tägliche Effizienz und Produktivität verbessern:

  • Die Workflow-Automatisierung übernimmt sich wiederholende Aufgaben in Geschäftsprozessen.
  • Das Berechtigungsmanagement über Rollen und Rechte verbessert die Informationssicherheit und Compliance.
Mann surft auf einer Welle aus Dokumenten

Wie definieren Sie eine für Ihr Unternehmen geeignete Meta­daten­struktur?

Während einige Kategorien mehr oder weniger universell sind, sind andere sehr spezifisch für eine Branche oder sogar eine einzelne Organisation. Eine Metadatenstruktur kann so angepasst werden, dass sie den Bedürfnissen einer jeden Organisation entspricht. Dies erfordert wahrscheinlich einen gewissen Aufwand, aber die Belohnung dafür ist hoch.

Fazit

Jeden Tag werden riesige Datenmengen erzeugt. Das Auffinden der benötigten Daten wird immer schwieriger und zeitaufwändiger. Dies wirkt sich negativ auf die Effizienz aus. Ohne die richtigen Informationen ist es schwierig, geschäftliche Entscheidungen zu treffen.

Metadaten liefern Informationen über andere Daten. Sie helfen uns, Informationen zu finden, indem sie ansonsten unstrukturierten Daten oder Informationen eine Struktur geben.

Metadaten ermöglichen den Zugriff auf Assets auf verschiedene Weise und für verschiedene Zwecke. Indem sie leicht zugänglich gemacht werden, helfen sie, die Bearbeitungszeiten (und die Markteinführungszeit) zu reduzieren. Indem sie spezifische Facetten der Assets für die Suche und Gruppierung bereitstellen, bieten sie neue Perspektiven auf die Daten im System. Dadurch können sie in neuen Kontexten verwendet werden.

Metadaten sind entscheidend für die Maximierung des Werts digitaler Assets, da sie diese leichter auffindbar, verständlich und nutzbar machen.