03.09.2020 | DHd AG Zeitungen & Zeitschriften | Workshop "Metadaten analysieren"

METS, MODS und Co. - Wo sind meine Metadaten?
Grundlagen, Standards, Schwierigkeiten

Gliederung

  1. Was sind Metadaten?
  2. Warum METS/MODS?
  3. Was finde ich in METS/MODS?
  4. Wo finde ich das, was ich suche?

Ziele

  • Eingrenzung der im Workshop behandelten Formate
  • Verständnis für Komplexität erreichen
  • Kenntnisse über Richtlinien/Standards
  • Anwendungsbeispiele für praktischen Teil des Workshops

Was sind Metadaten?

  • "Daten über Daten"
  • Metadaten-Universum
  • administrative, strukturelle, technische, deskriptive (bibliographische) Metadaten

Quellen für Metadaten

  • ... (Bibliotheks-)Kataloge ...
  • ... Webseiten/-anwendungen ...

www.digizeitschriften.de


  • Suche einzelner Zeitschriften
  • Anzeige bibliographischer Metadaten
  • Anzeige des Inhaltsverzeichnisses
  • Liste aller Open Access Zeitschriften

Aber: Wie komme ich an die Metadaten?

Beispiele

Der wahre Jakob
Der wahre Jakob (Bd. 17, 1900)
Der wahre Jakob (Bd. 17, 1900, Nr. 364)
Der wahre Jakob (über Schnittstelle)

Ankersätze

LIBER quarterly 8-17 (Ankersatz)
(einzelnes Heft)

OAI-PMH Header


<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet href="./oai2.xsl" type="text/xsl"?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2020-08-28T11:14:36Z</responseDate>
  <request verb="GetRecord" metadataPrefix="mets" identifier="oai:www.digizeitschriften.de:PPN514854618_0010">http://www.digizeitschriften.de/oai2/</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:www.digizeitschriften.de:PPN514854618_0010</identifier>
        <datestamp>2007-09-14T00:00:00Z</datestamp>
        <setSpec/>
      </header>
      <metadata>
        [...]
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
							

<metadata>


<metadata>
  <mets:mets xmlns:gdz="http://gdz.sub.uni-goettingen.de/" xmlns:dz="http://www.digizeitschriften.de/" xmlns:mets="http://www.loc.gov/METS/" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:dv="http://dfg-viewer.de/" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/METS/ http://www.loc.gov/mets/mets.xsd http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-2.xsd">
    <mets:dmdSec ID="dmdlog1">
      <mets:mdWrap MDTYPE="MODS">
        <mets:xmlData>
          <mods:mods>
            <mods:relatedItem type="host">
              <mods:recordInfo>
                <mods:recordIdentifier source="gbv-ppn">PPN514854618</mods:recordIdentifier>
              </mods:recordInfo>
              <mods:relatedItem type="preceding">
                <mods:recordInfo>
                  <mods:recordIdentifier source="gbv-ppn">PPN514854804</mods:recordIdentifier>
                </mods:recordInfo>
                <mods:titleInfo>
                  <mods:title>European research libraries cooperation : ERLC ; the LIBER Quarterly</mods:title>
                </mods:titleInfo>
              </mods:relatedItem>
            </mods:relatedItem>
            <mods:recordInfo>
              <mods:recordIdentifier source="gbv-ppn">PPN514854618_0010</mods:recordIdentifier>
            </mods:recordInfo>
            <mods:identifier type="purl">http://resolver.sub.uni-goettingen.de/purl?PPN514854618_0010</mods:identifier>
            <mods:location>
              <mods:url>http://www.digizeitschriften.de/resolveppn/PPN514854618_0010</mods:url>
            </mods:location>
            <mods:identifier type="gbv-ppn">PPN514854618_0010</mods:identifier>
            <mods:identifier type="PPNanalog">PPN24619474X_0010</mods:identifier>
            <mods:identifier type="ADBID">547433</mods:identifier>
            <mods:titleInfo>
              <mods:title>LIBER quarterly</mods:title>
            </mods:titleInfo>
            <mods:part type="host" order="100">
              <mods:detail>
                <mods:number>10</mods:number>
              </mods:detail>
            </mods:part>
            <mods:language>
              <mods:languageTerm type="code" authority="iso639-2b">eng</mods:languageTerm>
            </mods:language>
            <mods:originInfo>
              <mods:dateIssued keyDate="yes" encoding="w3cdtf">2000</mods:dateIssued>
              <mods:place>
                <mods:placeTerm type="text">Munich</mods:placeTerm>
              </mods:place>
              <mods:publisher>Saur</mods:publisher>
              <mods:dateCaptured encoding="w3cdtf">2007-09-14</mods:dateCaptured>
            </mods:originInfo>
            <mods:physicalDescription>
              <mods:extent>550 pages</mods:extent>
              <mods:digitalOrigin>reformatted digital</mods:digitalOrigin>
            </mods:physicalDescription>
            <mods:classification authority="dz">020 Librarianship</mods:classification>
            <mods:accessCondition type="dz">free</mods:accessCondition>
            <mods:accessCondition type="dz">Liber</mods:accessCondition>
            <mods:accessCondition type="dz">Librarianship</mods:accessCondition>
          </mods:mods>
        </mets:xmlData>
      </mets:mdWrap>
    </mets:dmdSec>
    <mets:dmdSec ID="dmdlog2">
      [...]
    </mets:dmdSec>
    [...]
  </mets:mets>
</metadata>
							

Vielfalt auf diversen Ebenen!

Warum METS/MODS?

DFG-Richtlinien

DFG-Praxisregeln "Digitalisierung"
Was ist der DFG-Viewer?
DFG-Viewer Strukturdatenset

Deutsche Digitale Bibliothek (DDB)

Wie werden Ihre Bibliotheksdaten Teil der DDB?

  • METS/MODS gleichberechtigt neben MARC und Dublin Core
  • MODS-Format dadurch wichtiger geworden (für DFG-Viewer alleine sind die bibliographischen Daten weniger relevant)
  • Best Practice Guide

Anwendungsprofile

METS
MODS

Komplexe Angelegenheit!

Was finde ich in METS/MODS?

METS

https://www.loc.gov/standards/mets/mets-home.html
  • Dient als Container, nimmt alle möglichen Metadaten auf
  • Fokus neben administrativen vor allem auf strukturellen Metadaten
  • Ziel: Zusammenführung verschiedener Teile eines digitalen Objekts (Images, bibliographische Metadaten, Lizenzinformationen etc.)

<metadata>


<metadata>
  <mets:mets xmlns:gdz="http://gdz.sub.uni-goettingen.de/" xmlns:dz="http://www.digizeitschriften.de/" xmlns:mets="http://www.loc.gov/METS/" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:dv="http://dfg-viewer.de/" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/METS/ http://www.loc.gov/mets/mets.xsd http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-2.xsd">
    <mets:dmdSec ID="dmdlog1">
      <mets:mdWrap MDTYPE="MODS">
        <mets:xmlData>
          <mods:mods>
            <mods:relatedItem type="host">
              <mods:recordInfo>
                <mods:recordIdentifier source="gbv-ppn">PPN514854618</mods:recordIdentifier>
              </mods:recordInfo>
              <mods:relatedItem type="preceding">
                <mods:recordInfo>
                  <mods:recordIdentifier source="gbv-ppn">PPN514854804</mods:recordIdentifier>
                </mods:recordInfo>
                <mods:titleInfo>
                  <mods:title>European research libraries cooperation : ERLC ; the LIBER Quarterly</mods:title>
                </mods:titleInfo>
              </mods:relatedItem>
            </mods:relatedItem>
            <mods:recordInfo>
              <mods:recordIdentifier source="gbv-ppn">PPN514854618_0010</mods:recordIdentifier>
            </mods:recordInfo>
            <mods:identifier type="purl">http://resolver.sub.uni-goettingen.de/purl?PPN514854618_0010</mods:identifier>
            <mods:location>
              <mods:url>http://www.digizeitschriften.de/resolveppn/PPN514854618_0010</mods:url>
            </mods:location>
            <mods:identifier type="gbv-ppn">PPN514854618_0010</mods:identifier>
            <mods:identifier type="PPNanalog">PPN24619474X_0010</mods:identifier>
            <mods:identifier type="ADBID">547433</mods:identifier>
            <mods:titleInfo>
              <mods:title>LIBER quarterly</mods:title>
            </mods:titleInfo>
            <mods:part type="host" order="100">
              <mods:detail>
                <mods:number>10</mods:number>
              </mods:detail>
            </mods:part>
            <mods:language>
              <mods:languageTerm type="code" authority="iso639-2b">eng</mods:languageTerm>
            </mods:language>
            <mods:originInfo>
              <mods:dateIssued keyDate="yes" encoding="w3cdtf">2000</mods:dateIssued>
              <mods:place>
                <mods:placeTerm type="text">Munich</mods:placeTerm>
              </mods:place>
              <mods:publisher>Saur</mods:publisher>
              <mods:dateCaptured encoding="w3cdtf">2007-09-14</mods:dateCaptured>
            </mods:originInfo>
            <mods:physicalDescription>
              <mods:extent>550 pages</mods:extent>
              <mods:digitalOrigin>reformatted digital</mods:digitalOrigin>
            </mods:physicalDescription>
            <mods:classification authority="dz">020 Librarianship</mods:classification>
            <mods:accessCondition type="dz">free</mods:accessCondition>
            <mods:accessCondition type="dz">Liber</mods:accessCondition>
            <mods:accessCondition type="dz">Librarianship</mods:accessCondition>
          </mods:mods>
        </mets:xmlData>
      </mets:mdWrap>
    </mets:dmdSec>
    <mets:dmdSec ID="dmdlog2">
      [...]
    </mets:dmdSec>
    [...]
  </mets:mets>
</metadata>
							

<mets:amdSec>


<metadata>
  [...]
  <mets:dmdSec ID="dmdlog84">
    [...]
  </mets:dmdSec>
  <mets:amdSec ID="amd1">
    <mets:rightsMD ID="rights1">
      <mets:mdWrap MIMETYPE="text/xml" MDTYPE="OTHER" OTHERMDTYPE="DVRIGHTS">
        <mets:xmlData>
          <dv:rights>
            <dv:owner>DigiZeitschriften e. V.</dv:owner>
            <dv:ownerLogo>http://www.digizeitschriften.de/logo_dfgv.jpg</dv:ownerLogo>
            <dv:ownerSiteURL>http://www.digizeitschriften.de/</dv:ownerSiteURL>
          </dv:rights>
        </mets:xmlData>
      </mets:mdWrap>
    </mets:rightsMD>
    <mets:digiprovMD ID="digiprov1">
      <mets:mdWrap MIMETYPE="text/xml" MDTYPE="OTHER" OTHERMDTYPE="DVLINKS">
        <mets:xmlData>
          <dv:links xmlns:dv="http://dfg-viewer.de/">
            <dv:reference>http://opac.sub.uni-goettingen.de/DB=1/PPN?PPN=514854618</dv:reference>
            <dv:presentation>http://www.digizeitschriften.de/resolveppn/PPN514854618_0010</dv:presentation>
          </dv:links>
        </mets:xmlData>
      </mets:mdWrap>
    </mets:digiprovMD>
  </mets:amdSec>
  [...]
</metadata>
						

<mets:fileSec>


<metadata>
  [...]
  <mets:amdSec ID="AMD">
    [...]
  </mets:amdSec>
  <mets:fileSec>
    <mets:fileGrp USE="DEFAULT">
      <mets:file ID="FILE_0001_DEFAULT" MIMETYPE="image/jpg">
        <mets:FLocat LOCTYPE="URL" xlink:href="http://www.digizeitschriften.de/content/PPN514854618_0010/800/0/00000001.jpg"/>
      </mets:file>
      <mets:file ID="FILE_0002_DEFAULT" MIMETYPE="image/jpg">
        <mets:FLocat LOCTYPE="URL" xlink:href="http://www.digizeitschriften.de/content/PPN514854618_0010/800/0/00000002.jpg"/>
      </mets:file>
      <mets:file ID="FILE_0003_DEFAULT" MIMETYPE="image/jpg">
        <mets:FLocat LOCTYPE="URL" xlink:href="http://www.digizeitschriften.de/content/PPN514854618_0010/800/0/00000003.jpg"/>
      </mets:file>
      [...]
    </mets:fileGrp>
    <mets:fileGrp USE="MIN">
      <mets:file ID="FILE_0001_MIN" MIMETYPE="image/jpg">
        <mets:FLocat LOCTYPE="URL" xlink:href="http://www.digizeitschriften.de/content/PPN514854618_0010/500/0/00000001.jpg"/>
      </mets:file>
      [...]
    </mets:fileGrp>
    <mets:fileGrp USE="MAX">
      <mets:file ID="FILE_0001_MAX" MIMETYPE="image/jpg">
        <mets:FLocat LOCTYPE="URL" xlink:href="http://www.digizeitschriften.de/content/PPN514854618_0010/1000/0/00000001.jpg"/>
      </mets:file>
      [...]
    </mets:fileGrp>
    <mets:fileGrp USE="THUMBS">
      <mets:file ID="FILE_0001_THUMBS" MIMETYPE="image/jpg">
        <mets:FLocat LOCTYPE="URL" xlink:href="http://www.digizeitschriften.de/content/PPN514854618_0010/150/0/00000001.jpg"/>
      </mets:file>
      [...]
    </mets:fileGrp>
    <mets:fileGrp USE="GDZOCR">
      <mets:file ID="FILE_0001_GDZOCR" MIMETYPE="text/xml">
        <mets:FLocat LOCTYPE="URL" xlink:href="http://www.digizeitschriften.de/gdzocr/PPN514854618_0010/00000001.xml"/>
      </mets:file>
      [...]
    </mets:fileGrp>
    <mets:fileGrp USE="PRESENTATION">
      <mets:file ID="FILE_0001_PRESENTATION" MIMETYPE="image/tif">
        <mets:FLocat LOCTYPE="URL" xlink:href="http://www.digizeitschriften.de/master/PPN514854618_0010/00000001.tif"/>
      </mets:file>
      [...]
    </mets:fileGrp>
    <mets:fileGrp USE="DOWNLOAD">
      <mets:file ID="FILE_0001_DOWNLOAD" MIMETYPE="application/pdf">
        <mets:FLocat LOCTYPE="URL" xlink:href="http://www.digizeitschriften.de/pdf/PPN514854618_0010/00000001.pdf"/>
      </mets:file>
      [...]
    </mets:fileGrp>
  </mets:fileSec>  
  [...]
</metadata>
						

<mets:structMap>


<metadata>
  [...]
  <mets:fileSec>
    [...]
  </mets:fileSec>							
  <mets:structMap TYPE="LOGICAL">
    <mets:div TYPE="Periodical" LABEL="Periodical">
      <mets:mptr LOCTYPE="URL" xlink:href="http://www.digizeitschriften.de/mets/PPN514854618.xml"/>
      <mets:div ID="log1" ADMID="amd1" DMDID="dmdlog1" TYPE="PeriodicalVolume" LABEL="LIBER quarterly  ">
        <mets:div ID="log2" DMDID="dmdlog2" TYPE="TitlePage" LABEL="Title page"/>
        <mets:div ID="log3" DMDID="dmdlog3" TYPE="TableOfContents" LABEL="Table of Contents  "/>
        <mets:div ID="log4" DMDID="dmdlog4" TYPE="PeriodicalIssue" LABEL="LIBER quarterly  ">
          <mets:div ID="log5" DMDID="dmdlog5" TYPE="TitlePage" LABEL="Title page"/>
          <mets:div ID="log6" DMDID="dmdlog6" TYPE="Imprint" LABEL="Impressum"/>
          <mets:div ID="log7" DMDID="dmdlog7" TYPE="TableOfContents" LABEL="Contents  "/>
          <mets:div ID="log8" DMDID="dmdlog8" TYPE="Imprint" LABEL="Impressum"/>
          [...]
        </mets:div>
        <mets:div ID="log20" DMDID="dmdlog20" TYPE="PeriodicalIssue" LABEL="LIBER quarterly  ">
          [...]
        </mets:div>
        [...]
      </mets:div>
    </mets:div>
  </mets:structMap>	
  [...]		  
</metadata>		  
						

<mets:structMap>


[...]
<mets:structMap TYPE="PHYSICAL">
  <mets:div ID="phys1" ADMID="amd1" DMDID="dmdlog1" TYPE="physSequence">
    <mets:div ID="phys2" ORDER="1" TYPE="page">
      <mets:fptr FILEID="FILE_0001_DEFAULT"/>
      <mets:fptr FILEID="FILE_0001_MIN"/>
      <mets:fptr FILEID="FILE_0001_MAX"/>
      <mets:fptr FILEID="FILE_0001_THUMBS"/>
      <mets:fptr FILEID="FILE_0001_GDZOCR"/>
      <mets:fptr FILEID="FILE_0001_PRESENTATION"/>
      <mets:fptr FILEID="FILE_0001_DOWNLOAD"/>
    </mets:div>					
    [...]
  </mets:div>
</mets:structMap>
[...]
						

<mets:structMap>


<mets:structMap TYPE="PHYSICAL">
  [...]
</mets:structMap>
<mets:structLink>
  <mets:smLink xlink:from="log1" xlink:tо="phys1"/>
  <mets:smLink xlink:from="log1" xlink:tо="phys2"/>
  <mets:smLink xlink:from="log1" xlink:tо="phys3"/>
  <mets:smLink xlink:from="log1" xlink:tо="phys4"/>
  <mets:smLink xlink:from="log1" xlink:tо="phys5"/>
  [...]
</mets:structLink>
[...]
						

METS

  • Detailliertere Beschreibung der deskriptiven Metadaten durch Verweis auf anderen Standard
  • Einbettung oder Verlinkung auf diese Daten
  • Reichlich Dokumentation und Information - aus Datengebersicht!

<mods:mods> in <mets:dmdSec>


<metadata>
  <mets:mets xmlns:gdz="http://gdz.sub.uni-goettingen.de/" xmlns:dz="http://www.digizeitschriften.de/" xmlns:mets="http://www.loc.gov/METS/" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:dv="http://dfg-viewer.de/" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/METS/ http://www.loc.gov/mets/mets.xsd http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-2.xsd">
    <mets:dmdSec ID="dmdlog1">
      <mets:mdWrap MDTYPE="MODS">
        <mets:xmlData>
          <mods:mods>
            <mods:relatedItem type="host">
              <mods:recordInfo>
                <mods:recordIdentifier source="gbv-ppn">PPN514854618</mods:recordIdentifier>
              </mods:recordInfo>
              <mods:relatedItem type="preceding">
                <mods:recordInfo>
                  <mods:recordIdentifier source="gbv-ppn">PPN514854804</mods:recordIdentifier>
                </mods:recordInfo>
                <mods:titleInfo>
                  <mods:title>European research libraries cooperation : ERLC ; the LIBER Quarterly</mods:title>
                </mods:titleInfo>
              </mods:relatedItem>
            </mods:relatedItem>
            <mods:recordInfo>
              <mods:recordIdentifier source="gbv-ppn">PPN514854618_0010</mods:recordIdentifier>
            </mods:recordInfo>
            <mods:identifier type="purl">http://resolver.sub.uni-goettingen.de/purl?PPN514854618_0010</mods:identifier>
            <mods:location>
              <mods:url>http://www.digizeitschriften.de/resolveppn/PPN514854618_0010</mods:url>
            </mods:location>
            <mods:identifier type="gbv-ppn">PPN514854618_0010</mods:identifier>
            <mods:identifier type="PPNanalog">PPN24619474X_0010</mods:identifier>
            <mods:identifier type="ADBID">547433</mods:identifier>
            <mods:titleInfo>
              <mods:title>LIBER quarterly</mods:title>
            </mods:titleInfo>
            <mods:part type="host" order="100">
              <mods:detail>
                <mods:number>10</mods:number>
              </mods:detail>
            </mods:part>
            <mods:language>
              <mods:languageTerm type="code" authority="iso639-2b">eng</mods:languageTerm>
            </mods:language>
            <mods:originInfo>
              <mods:dateIssued keyDate="yes" encoding="w3cdtf">2000</mods:dateIssued>
              <mods:place>
                <mods:placeTerm type="text">Munich</mods:placeTerm>
              </mods:place>
              <mods:publisher>Saur</mods:publisher>
              <mods:dateCaptured encoding="w3cdtf">2007-09-14</mods:dateCaptured>
            </mods:originInfo>
            <mods:physicalDescription>
              <mods:extent>550 pages</mods:extent>
              <mods:digitalOrigin>reformatted digital</mods:digitalOrigin>
            </mods:physicalDescription>
            <mods:classification authority="dz">020 Librarianship</mods:classification>
            <mods:accessCondition type="dz">free</mods:accessCondition>
            <mods:accessCondition type="dz">Liber</mods:accessCondition>
            <mods:accessCondition type="dz">Librarianship</mods:accessCondition>
          </mods:mods>
        </mets:xmlData>
      </mets:mdWrap>
    </mets:dmdSec>
    <mets:dmdSec ID="dmdlog2">
      [...]
    </mets:dmdSec>
    [...]
  </mets:mets>
</metadata>
							
weitere <mets:dmdSec>-Elemente

Anwendungsprofile

  • Beschreiben, welche Elemente in welcher Form verwendet werden müssen/dürfen.
  • Beschreiben auch, welche Werte erlaubt sind.
  • Ziel: Vereinheitlichung, um Nutzung in übergreifenden Anwendungen wie der DDB zu ermöglichen.
  • Aber: alles von der Seite der Datengeber aus gedacht!

MODS

http://www.loc.gov/standards/mods/
  • Reichhaltiger als Dublin Core, einfacher als MARC21
  • Konkordanz zu MARC-Feldern ist für Bibliotheken interessant, für die Forschung aber eher weniger.
  • MODS fordert oft einen URI, fördert damit Darstellung als RDF bzw. Linked Data.

Regelwerke, Kontrollierte Vokabulare, Thesauri, Mappings

  • Regeln zur Erschließung, d. h., Erzeugung von Metadaten (z. B. RDA - Resource Description and Access)
  • LCSH (Library of Congress Subject Headings)
  • Mappings in der Regel von komplex zu einfach, aber mit Informationsverlust

Wo finde ich das, was ich suche?

Vorhanden:

Metadatenfeld

Metadatum

Gesucht:

Metadatenfeld

???

Metadatum

Gesucht:

Metadatenfeld

Metadatum

Atlas of Digitized Newspapers

The Atlas
Resources
Metadata Maps

Beispiele aus Forschungfragen

Der Sturm (Artikelebene)
Zeitschrift "Nosotros"
Strukturdaten der Zeitschrift "Miscellanea Curiosa"

E N D E

Vielen Dank für die Aufmerksamkeit

Link zu dieser Präsentation: HTML | PDF

Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International Lizenz.

Creative Commons Lizenzvertrag