Umstellung der Goobi Vorgänge auf den SUB Regelsatz für Drucke
Auf den folgenden Seiten wird die Umstellung der Vorgänge der alten Regelsätze auf den SUB Regelsatz für Drucke dokumentiert. Die Mappingseiten werden über XSL aus den bisherigen Regelsätzen erzeugt und dann gemapppt.
Ablauf
Konvertierung auf dem Goobi Server
Die folgende Seite dokumentiert die Konvertierung auf dem Goobi Server:
Mappings
GDZ (gdz.xml)
VD 17 (vd17_nova.xml)
VD 18 (vd18.xml)
zu klären
Anmerkungen
Goobi
pica2mods
Das mods verwendet andere valueURIs für mods:languageTerm, nicht die LOC-URIs.
Das steht so im zvdd MODS AP als Beispiel
Generell
Mehrbändige Werke
Es wird jetzt aus dem c-Satz übernommen:
Der Titel wird (inkl. Unterordnungen) aus 036C übernommen.
PPN 871633507 (Mono, RDA)
(Pica+, Pica+ A-Satz, MM21, MODS)
Paralleltitel fehlt (021F)

Inhalt von mods:extent sollte wie bei MM21 gebildet werden
mods:note Element für die Verantwortlichkeitsangabe verwendet falschen type-Attributwert
statementOfResponsibility
⇒
statement of responsibility
so muss das mal definiert gewesen sein, das steht bei uns noch so im MODS AP und andere machen das auch (ist also nicht unserer Phantasie entsprungen), sorry - was sollen wir tun? 
PPN vom A-Satz fehlt
mods:identifier[@type=„other“] 
Fingerprint (007P$0) als mods:identifer[@type='fingerprint'] fehlt (nur in mods:note)

ISBN fehlt (004A$0 und 004A$A)

ISNM fehlt (004F$0 und 004F$A)

Reihen und Untereihen fehlen (mods:relatedItem[@type='series'] werden
036E$a und $l

Bandnummer (Sortierung) mods:part/@order
Dokumenttyp (013@$0) fehlt (mods:genre[@authority='din31631-4'])
007G$0 kommt momentan als mods:identifier[@type='firstCataloguingId], soll aber als [@type='local']
kommt im Moment 2x, einmal als „other“ einmal als „firstCataloguingId“. Und wenn ich mal MODS selbst dazu zitieren darf, was auch unser AP tut: „There is no controlled list of identifier types. Suggested values include, but are not limited to the following […]“ Wir können überlegen alle die im Moment „other“ heissen in „local“ umzubennen, aber was gewinnen wir davon, für andere ist diese Unterscheidung gleich nutzlos 
DNB-Nummer fehlt (
A-Satz 006G$0) in mods:identifier[@type='dnb']

PPN 881951706 (MBW, RDA, Ofv)
PPN 881951447 (MBW, RDA, Ocv)
PPN 88193884X (Zeitschrift, RDA)
(Pica+, Pica+ A-Satz, MM21, MODS)
das mods:originInfo für das Digitalisat enthält jeweils den ersten Ort des O-Satzes, hier in dem Beispiel entspricht das aber dem Ort des A-Satzes
ZDB-Nummer vom O-Satz (006Z$0) übernommen in mods:identifier[@type='zdb'] - sollte auch die ZDB-Nummer des A-Satzes übernommen werden?
ISSN fehlt (A-Satz 005A$0) in mods:identifier[@type='issn']
Hier das gleiche. Online-Ausgaben haben eigene ISSN, dh. die kann nur as dem O-Satz kommen. Einfache Lösung: A-Satz ISSN und ZDB Id weglassen oder beides jeweils als mods:identifier[@type=„other“] ausgeben. Im Moment lass ich es weg.
(steht jetzt in „other“)
Nochwas zur ISSN: aus PICA kommen ISSN und ISBN jeweils ohne Striche. Setzt Du die bei der Konversion ein? Nein, zu aufwendig
PPN 884600157 (Mono, RAK)
(Pica+, Pica+ A-Satz, MM21, MODS)
Der Parallelsachtitel wird sowohl in mods:titleInfo/mods:subTitle als auch in mods:titleInfo[@type='translated']/mods:title dort nochmal gedoppelt als mods:subTitle ausgegeben
da läuft etwas schief, ggf. durch Katalogisierungsfehler im Testdatensatz verursacht, nochmal prüfen

+
Zum Zusatz zum PST: Hier wird das Unterfeld in PICA nicht korrekt umgewandelt, weder mit $d
noch mit :
In RAK muss aber lt. der alten KatRicht :
stehen und das wird vom Template auch ausgewertet. Das merkwürdige Phänomen der Doppelung liegt in diesem Fall an der falschen Eingabe im Testdatensatz, was allerdings ein Sonderfall ist. Das gleich Phänomen trat auf, wenn es keinen Zusatz zum PST gab, das ist jetzt repariert 
Datum in Vorlageform (011@$n, vorhanden in O- und A-Satz) fehlt in mods:originInfo/mods:dateIssued
s.oben. Bei RAK-Aufnahmen werden außerdem KEINE Daten aus der A-Aufnahme übernommen. 
Abweichende Titel und spätere Haupttitel (4212 | 046C$a + $b) soll laut Datenmapping in die Allgemeine Bemerkung (mods:note), wird aber als Abweichender Titel ausgegeben (hier mods:titleInfo[@type='alternative'])

Nochmal prüfen, was gewollt ist

, s.a. MM21
das steht so in der Exceltabelle und ist eigentlich gewollt, ist hier auch explizit ein Nebentitel (d.h. in PICA auch als Titel suchbar) 
Besitznachweis des reproduzierten Exemplars (009A O-Satz) fehlt in mods:note[@type='original location']
steht da 1a drin

Bibliografische Zitate fehlen (007S$0, A-Satz, s.o.)
keine Datenübernahme aus A-Aufn. in RAK 
Gesamttitel der fortlaufenden Ressource (036E$a + $l) fehlt in mods:relatedItem[@type='series']/.. Die Daten werden aus 036F erzeugt

Es wird aber 036F übernommen und in einem mods:relatedItem[@type='series'] expandiert
im MM21 wird nur 036E berücksichtigt
ist richtig. Ich denke drüber nach 
PPN A-Satz fehlt in mods:identifier[@type='PPNanalog']
halte ich für irrelevant 
PPN 881967319 (MBW, RAK, OFu)
(Pica+, Pica+ A-Satz, MM21, MODS)
[%- IF (r.type == 'f' || r.type == 'F') -%]
<mods:part order="[%- r.subfields('036D','X').item(0).item(0) | xml -%]">
<mods:detail type="volume">
<mods:number>[%- r.subfields('036D','l').item(0).item(0) | xml -%]</mods:number>
[%- IF (r.type == 'f' && (r.subfields('021A','a').item(0).item(0) || r.subfields('021A','d').item(0).item(0))) -%]
<mods:title>[%- r.subfields('021A','a').item(0).item(0) | xml -%][%- IF r.subfields('021A','a').item(0).item(0) -%] : [%- END -%][%- r.subfields('021A','d').item(0).item(0) | xml -%]</mods:title>
[%- END -%]
</mods:detail>
</mods:part>
[%- END -%]
PPN 881967211 (MBW, RAK, Ocu)
PPN 88195411X (Zeitschrift, RAK, OFu)
Leere MODS Elemente
mods2goobi
„Externe“ Daten müssen noch ergänzt werden (Wo?)
Schrifftyp

(als Parameter „Schrifttyp“)
Digitale Kollektion

TSL/ATS

Bandnummer (Sortierung)

Sponsor

(nicht in VD18 Regelsatz enthalten)
MODS Elemente
extension

recordInfo

(nur PPN)
part

relatedItem[@type='host']

Normierter Erscheinungsort fehlt in der XSL

wahrcheinlich auch im MODS?
mods:relatedItem fehlt in der XSL

mods:part muss noch angepasst werden XSL

mods:subject/mods:name in XSL auskommentiert
Bei allen Titeln muss der „vollständige“ Titel („title_full“) generiert werden

bei mods:subject aufpassen
enthält mods:name die aus dem „Komplex“ für Goobi herausgelöst werden müssen, um sie im entsprechenden Goobi Element zu speichern.

alle anderen Elemente in die „subject“ Gruppe

Wiederholgruppen werden alle auf die „_x“ Felder gemappt
Fragen Intranda
Externer Zugriff auf Goobi
Valdierung anstoßen
Wie sieht die Antwort aus?
⇒ Momentan nicht möglich, wäre ein Entwicklungsauftrag für eine Erweiterung der REST-
API. Laut Robert aber nicht aufwending und könnte „mal zwischengeschoben werden“, Aufwand wenige Stunden
⇒ Alternative „halbmanuelle“ Lösung wäre einen Export der Metadaten ins Homeverzeichnis vor und nach der Konversion „per Hand“ (natürlich in Masse) anzustoßen, das hat den gleichen Effekt
richtig gut aber erst mit Goobi 3, da bei unsererer Version das nicht im Hintergrund läuft und man daher evtl. einen Timeout bekommt
welche Mengen sinnvoll sind ist fraglich
Sicherungsdateien nach der Umstellung
Alle sicherheitshalber löschen? Funktionieren nicht mehr mit dem neuen Regelsatz
Ein Backup zusätzlich schon anlegen?
stört sich Goobi wenn wir da rumlöschen?
⇒ Ist laut Robert egal, wenn Metadaten fehlen ist meist alles weg, auch die Sicherheitskopien
Nur Metadaten in Masse exportieren ohne Bilder - Wie geht das?
Müsen wir noch irgendetwas anderes beachten?
Suche nach Vorgängen mit einem bestimmten Regelsatz