140 lines
10 KiB
Markdown
140 lines
10 KiB
Markdown
OPDRACHT
|
||
Ontwikkelen van een Bronhouder Ontologie (Heritage Custodian Ontology) specificatie voor het identificeren en semantisch beschrijven van alle organisaties of groepen die cultureel erfgoed bewaren en beheren, zowel binnen als buiten het NDE-ecosysteem. Eveneens het standaardiseren van de NDE-lijst van bronhouders als linked data.
|
||
De opdracht omvat een Schema.org toepassingsprofiel dat afgestemd is op de Thesauri en Ontologieën voor Overheidsinformatie (TOOI), Europeana Data Model (EDM) en Core Public Organization Vocabulary (CPOV) en andere relevante ontologieën. Daarnaast legt het semantische verbindingen naar alle domein-specifieke collectie-ontologieën (RiC-O, EBUCore, LIDO, BIBFRAME, etc.) en een mapping van datasets zoals die door het NDE zijn aangeleverd. Dit legt de basis voor een open-source kennisgraaf van bronhouders. Beide de linked data en de specificatie kunnen in de toekomst verder uitgebreid worden.
|
||
|
||
|
||
AANDACHTSPUNT
|
||
De opdracht beschrijft de behoefte aan een uitgebreid overzicht van het huidig aantal bronhouders via persistente identificatoren. Eveneens relevant zijn de organisatorische ontwikkelingen van bronhouders. Zeker kleinere bronhouders kunnen tijdelijk inactief zijn of plots ophouden te bestaan. Grotere instellingen zijn daarnaast vaak door meerdere herorganisaties tot stand gekomen. De tijdsgebonden kenmerken en geschiedenis van bronhouders zijn van belang om organisaties te classificeren, rollen toe te kennen en onderlinge relaties te modelleren. Het duurzaam identificeren van bronhouders vereist ook het kunnen aanduiden van veranderingen binnen deze organisaties/gemeenschappen. Bovendien geven de tijdsgebonden kenmerken belangrijke inzichten in de herkomst van de collectie en data die de bronhouders beheren.
|
||
De ontologie zou daarom idealiter ook de tijdsgebonden ontwikkeling van een organisatie moeten kunnen uitdrukken. Zo zou bijvoorbeeld de beschrijving van het Rijksmuseum kunnen worden aangevuld met metadata die uit de archieven van dit instituut zijn ontsloten. Op die manier wordt de herkomst van het erfgoed van de diverse musea die later tot het Rijksmuseum fuseerde op een consistente en transparante wijze in beeld gebracht. Het vergaren van deze data hoeft niet tijdens dit project te gebeuren, maar de ontologie moet wel in staat zijn de organisatieontwikkelingen aan te duiden. Daarnaast zou een koppeling met de Persons in Context (PiCo) gewenst zijn om op den duur ook de telkens veranderende rollen binnen de organisatie te registreren.
|
||
|
||
|
||
WERKZAAMHEDEN
|
||
1. Bronhouder Ontologie afgestemd op al bestaande ontologieën
|
||
• Doelstelling: Ontwikkeling van een overkoepelende bronhouder ontologie die alle bronhouders op uniforme wijze beschrijft, classificeert en organisatorische ontwikkelingen en onderlinge relaties tussen bronhouders kan uitdrukken.
|
||
• Opleveringen:
|
||
o uitbreiding van Schema.org ‘Organization’ en hyponiemen als ‘Museum’, ‘Library’, ‘ArchiveOrganization’, ‘GovernmentOrganization’, ‘NGO’, en ‘EducationalOrganization’ (zowel als primair als bijkomende classificatie, zie https://docs.nde.nl/cm-implementation-guidelines/). Gebruik van SCHEMA-AP-NDE (https://docs.nde.nl/schema-profile/)
|
||
o afstemming met de TOOI-ontologie (v1.6.2) voor overheidsorganisaties
|
||
o Core Public Organization Vocabulary (CPOV) v2.00 verbinding voor EU-brede samenwerking
|
||
o Europeana Data Model (EDM) dataProvider uitbreidingen
|
||
o Domein-specifieke bronhouder profielen
|
||
o JSON-LD sjablonen en validatieregels
|
||
o Cultureel Erfgoed Ontologie (CEO)
|
||
o Mapping Museumnorm (Stichting Museumregister Nederland)
|
||
o NDE-rollen
|
||
o Gebruik concepten uit Termennetwerk waar mogelijk
|
||
o Gebruik van PiCo voor het aanduiden van actoren die bronhouders vertegenwoordigen.
|
||
o Persistente URIs binnen de ontologie
|
||
o CIDOC-CRM en FAIR compliance
|
||
o Samenstellen Competency Questions (CQs)
|
||
o Evaluatie via OntOlogy Pitfall Scanner! (OOPS!) en andere methoden
|
||
o Bronhouder Ontologie specificatie
|
||
o Uitleg verband met andere ontologieën
|
||
• Tijd: 120 uur
|
||
|
||
2. Semantische verbindingen tussen bronhouder-typen en specifieke collectie-ontologieën
|
||
• Doelstelling: Ontwikkeling van ontologische verbindingen tussen bronhouder-entiteiten en domein-specifieke collectiebeschrijvingen. Hiermee wordt de bronhouder set een bruikbaar scharnierpunt binnen het NDE-netwerk en het datasetregister.
|
||
• Opleveringen:
|
||
o Record-in-Context (RiC) koppeling voor archieven
|
||
rico:CorporateBody naar Bronhouder Ontology mapping
|
||
o Metagegevens voor duurzaam toegankelijke overheidsinformatie (MDTO)
|
||
o BIBFRAME 2.0 organisatorische uitbreidingen
|
||
bf:Agent naar bronhouder mapping met bibliotheek-specifieke rollen
|
||
ARM (Art and Rare Materials) uitbreidingen voor bijzondere verzamelingen (e.g. arm:repository)
|
||
o LIDO/CIDOC-CRM museum verbindingen
|
||
lido:legalBodyRefComplexType naar bronhouder terminologie
|
||
SPECTRUM 5.1 organizational procedure mapping
|
||
o EBUCore mediaorganisatie afstemming
|
||
ebucore:Agent en ebucore:Organisation naar bronhouder mapping voor media-instellingen
|
||
o GEDCOM 7.0 genealogische en kerkelijke bronhouders
|
||
gedcom:AGNC records
|
||
o ISO 18670 (Software Hash Identifier - SWHID) voor software artefacten
|
||
o Overige vormen van collectiebeschrijvingen waaronder 1 en 2-ster tabellen en PDFs.
|
||
• Tijd: 110 uur
|
||
|
||
3. Automatische conversie relevante datasets
|
||
• Doelstelling: Mapping van relevante datasets over bronhouders via linked dataschema’s
|
||
• Opleveringen:
|
||
o EAC-CPF 2.0 transformatie
|
||
o Mapping- en validatieschema’s kunnen in meerdere formaten geleverd worden, waaronder LinkML en SHACL
|
||
o Multi-domein autoriteitsbeheer verbindingen
|
||
o Integratie of koppeling van NDEs eigen voorbeeldlijst van organisaties en diensten. Opschonen en verrijken data.
|
||
o ISIL-codes (ISO 15511:2019) koppeling (tijdsgebonden versies)
|
||
• Tijd: 20 uur
|
||
|
||
• Niet inbegrepen:
|
||
o Nederlandse Actorenregister integratie
|
||
o Union of International Associations (UIA)’s Open Yearbook project koppeling, indien toestemming wordt verleend (jaarlijkse uitgaven)
|
||
o Data Confédération Internationale de Généalogie et d'Héraldique (CIGH) koppeling
|
||
o Museumregister Nederland koppeling
|
||
o Rijksmonumentenregister koppeling
|
||
o Wikidata koppeling
|
||
o Kamer van Koophandel koppeling (SBI 7220, 9101, 9102, 9103, 94994)
|
||
o Historical Archives of the European Union (HAEU) koppeling
|
||
o Herkomstketens van collecties naar bronhouders
|
||
o Persistente URIs voor bronhouders
|
||
o DPIA (Data Protection Impact Assessment) voor bronhouders, en actoren die deze vertegenwoordigen, die mogelijk anoniem willen blijven. Inclusief GDPR/AVG compliance matrix.
|
||
o Filteren van data met CC0 licentie
|
||
o Uitwerken mapping conventies voor data uit collectiebeheersystemen
|
||
Axiell Collections (voormalig Adlib), Memorix Nexus/Maior, Atlantis, The Museum System (TMS), MAIS-Flexis, Kleksi, Omeka S etc.
|
||
o Test met toepassing op internationale datasets van bronhouders:
|
||
MDA Codes (Verenigd Koningkrijk)
|
||
Musées de France (Frankrijk)
|
||
Sistem Informasi Kearsipan Nasional (SIKN) (Indonesië)
|
||
American Alliance of Museums (Verenigde Staten)
|
||
Collections Australia Network (Australië)
|
||
College of Arms (Verenigd Koningkrijk)
|
||
Archives Portal Europe
|
||
|
||
|
||
NIET INBEGREPEN
|
||
1. Bronhouder indexatie in tekstcorpora
|
||
• Doelstelling: Met automatische tekstanalyse bronhouders identificeren en indexeren in grote tekstcorpora en websites om zo obscure entiteiten en tijdsgebonden kenmerken te achterhalen.
|
||
• Opleveringen:
|
||
o Entiteitsherkenning (NER) Model voor Erfgoedbronhouders:
|
||
Aangepast Machinaal Leren (ML) model getraind op Nederlandse teksten over erfgoed
|
||
Entiteitstypen: musea, bibliotheken, archieven, privécollecties, genealogische verenigingen
|
||
Multi-label classificatie voor organisatietypes en erfgoeddomeinen
|
||
Contextuele onderscheiding tussen organisaties met vergelijkbare namen
|
||
o Opmaak analyse en document verwerking:
|
||
Extractie van metagegevens over bronhouders uit transcripties, computerbestanden en webpagina’s
|
||
Visuele lay-out begrip voor detectie van organisatie-informatie in historische documenten, voornamelijk belangrijk voor het herkennen van voet- en eindnoten, stempels, indices, marginalia en de colofon. Verwijzingen naar bronhouders zijn vaak in laatstgenoemde tekstdelen terug te vinden.
|
||
OCR/HTR (na)bewerking van archivale teksten
|
||
o Grootschalige Tekstverwerkingspijplijn:
|
||
Batchverwerking voor grote tekstcorpora (digitale kranten, archieven over/van bronhouders, monografieën, onderzoek notaties etc.)
|
||
Bronhouder-detectie binnen webarchieven (Internet Archive, KB-Webarchief)
|
||
Duplicaatdetectie en entiteitskoppeling naar bestaande bronhouder-registraties, aanvulling van deze dataset
|
||
o Trainingsgegevens en Validatie:
|
||
Geannoteerd corpus van 10.000+ tekstfragmenten met bronhouder-referenties
|
||
Inter-beoordelaar betrouwbaarheidsvalidatie
|
||
o Voortdurend Leerraamwerk:
|
||
Afstemmen model voor verbetering van model nauwkeurigheid
|
||
Terugkoppeling voor nieuwe bronhouder-ontdekkingen
|
||
Model actualisatieprocedures voor evoluerende organisatienamen en -structuren
|
||
o Privacybeschermende Ontdekking:
|
||
Differentiële privacy technieken voor gevoelige genealogische gegevens
|
||
Opt-out mechanismen voor privécollecties
|
||
AVG-conforme gegevensverwerking voor persoonlijke archief-referenties
|
||
• Innovatie: bronhouder ontdekkingssysteem dat historische teksten, websites en archivale materialen systematisch doorzoekt naar onbekende erfgoedbeherende organisaties en koppelt aan basale metadata zoals tijdsaanduidingen en verwante actoren
|
||
|
||
2. Klantvriendelijke weergave van kennisgraaf op interactief platform
|
||
• Doelstelling: Toegankelijke en interactieve weergave van bronhouders
|
||
• Opleveringen:
|
||
o Een GUI om op een dynamische en interactieve wijze de kennisgraaf doorzoekbaar en presenteerbaar te maken aan de bronhouders zelf. De bronhouders kunnen hier ook gegevens corrigeren en aanvullen.
|
||
o Dynamische tijdsgebonden ArchiMate-geïnspireerde weergaven van organisatiestructuren om informatiestromen weer te geven
|
||
o WCAG 2.1 AA-compatibel
|
||
o Geschreven in Rust of TypeScript
|
||
|
||
3. Kennisgraaf
|
||
• Doelstelling: Uitwerken van open-source kennisgraaf infrastructuur
|
||
• Opleveringen:
|
||
o TypeDB hypergraaf kennisgraaf (TypeQL endpoints) (AGPL-3.0 licentie)
|
||
o Oxigraph RDF kennisgraaf (SPARQL endpoints) (Apache-2.0 licentie)
|
||
o Performance benchmarks
|
||
o Volgt de Requirements for Collection Management Systems
|
||
o DERA-, NORA- en BIO compatibel
|
||
o Rust modules en Podman of Docker containers, wrappers om binnen andere programmeertalen te gebruiken.
|
||
o Automatisch conversie hypergraaf-triples & SPARQL-TypeQL
|
||
o Testen en evalueren Competency Questions (CQs)
|
||
|
||
TIJDSSCHEMA
|
||
250 uur over 13 weken (Week 40-52, 2025)
|