glam/data/instances/chile/BATCH9_ARCHIVES_ANALYSIS.md
2025-11-19 23:25:22 +01:00

2.5 KiB

Batch 9 - Chilean Archives Wikidata Enrichment Analysis

Summary

Query Results: 11 Chilean archives found in Wikidata
Fuzzy Matching Results: 0 automatic matches
Manual Analysis: Confirmed no valid matches

Why No Matches?

The 10 archives in our dataset that lack Wikidata are:

  1. Generic/Unknown Archives - Very limited information

    • "Archivo Histórico" (no location)
    • "Archivo Histórico SERVEL" (no location)
    • "Diócesis archives" (no location)
    • "ENACAR archives" (no location)
    • "Archivo de la Gobernación" (Cochrane)
  2. Specialized Archives Not in Wikidata

    • "Biblioteca Municipal's Archivo Sonoro" (sound archive)
    • "Archivo Histórico de Concepción" (regional)
    • "Arzobispado's Archivo Histórico" (church archive)
    • "Archivo General de Asuntos Indígenas (CONADI)" (indigenous affairs)
  3. Duplicate Entry (Data Quality Issue)

    • "USACH's Archivo Patrimonial" → Actually Archivo Nacional de Chile
    • OSM ID way/187712689 has wikidata: Q6970429
    • We already have "Archivo Nacional" with Q6970429 in dataset
    • This is a CSV error - wrong institution name

Wikidata Archives Found

The 11 archives in Wikidata are different institutions:

  1. Q108381608 - Chile Open Data Portal (data portal, not traditional archive)
  2. Q97001450 - Chile's Public Data Portal (data portal)
  3. Q109560585 - Archivo Central Andres Bello (Universidad de Chile, not in our dataset)
  4. Q112843848 - Archivo Histórico Patrimonial de Viña del Mar (different city)
  5. Q114193047 - Archivo Judío de Chile (Jewish archive, not in our dataset)
  6. Q6970429 - Archivo Nacional de Chile ( Already have this)
  7. Q112828791 - Archivo y Biblioteca Histórica de la Armada (Navy, not in our dataset)
  8. Q18563194 - CENFOTO (photography center, not in our dataset)
  9. Q54572178 - Cineteca Nacional de Chile (film archive, not in our dataset)
  10. Q5769705 - Cineteca Universidad de Chile (film archive, not in our dataset)
  11. [One more not listed in sample]

Conclusion

No valid enrichments available for Batch 9.

The archives in our dataset either:

  • Lack sufficient detail for matching (generic names, no locations)
  • Are smaller regional/specialized archives not yet in Wikidata
  • Are a duplicate entry (data quality issue)

Recommendation

Skip Batch 9 (archives) and proceed to Batch 10:

  • Target: MIXED type institutions (0/3 coverage)
  • Or: RESEARCH_CENTER (0/2 coverage)
  • Or: Focus on improving museum coverage (currently 74.5%)

Current coverage remains: 60.0% (54/90 institutions)