glam/data/instances/chile/BATCH9_ARCHIVES_ANALYSIS.md
2025-11-19 23:25:22 +01:00

64 lines
2.5 KiB
Markdown

# Batch 9 - Chilean Archives Wikidata Enrichment Analysis
## Summary
**Query Results**: 11 Chilean archives found in Wikidata
**Fuzzy Matching Results**: 0 automatic matches
**Manual Analysis**: Confirmed no valid matches
## Why No Matches?
The 10 archives in our dataset that lack Wikidata are:
1. **Generic/Unknown Archives** - Very limited information
- "Archivo Histórico" (no location)
- "Archivo Histórico SERVEL" (no location)
- "Diócesis archives" (no location)
- "ENACAR archives" (no location)
- "Archivo de la Gobernación" (Cochrane)
2. **Specialized Archives Not in Wikidata**
- "Biblioteca Municipal's Archivo Sonoro" (sound archive)
- "Archivo Histórico de Concepción" (regional)
- "Arzobispado's Archivo Histórico" (church archive)
- "Archivo General de Asuntos Indígenas (CONADI)" (indigenous affairs)
3. **Duplicate Entry** (Data Quality Issue)
- "USACH's Archivo Patrimonial" → Actually **Archivo Nacional de Chile**
- OSM ID way/187712689 has `wikidata: Q6970429`
- We already have "Archivo Nacional" with Q6970429 in dataset
- This is a CSV error - wrong institution name
## Wikidata Archives Found
The 11 archives in Wikidata are different institutions:
1. Q108381608 - Chile Open Data Portal (data portal, not traditional archive)
2. Q97001450 - Chile's Public Data Portal (data portal)
3. Q109560585 - Archivo Central Andres Bello (Universidad de Chile, not in our dataset)
4. Q112843848 - Archivo Histórico Patrimonial de Viña del Mar (different city)
5. Q114193047 - Archivo Judío de Chile (Jewish archive, not in our dataset)
6. **Q6970429 - Archivo Nacional de Chile** (✅ Already have this)
7. Q112828791 - Archivo y Biblioteca Histórica de la Armada (Navy, not in our dataset)
8. Q18563194 - CENFOTO (photography center, not in our dataset)
9. Q54572178 - Cineteca Nacional de Chile (film archive, not in our dataset)
10. Q5769705 - Cineteca Universidad de Chile (film archive, not in our dataset)
11. [One more not listed in sample]
## Conclusion
**No valid enrichments available for Batch 9.**
The archives in our dataset either:
- Lack sufficient detail for matching (generic names, no locations)
- Are smaller regional/specialized archives not yet in Wikidata
- Are a duplicate entry (data quality issue)
## Recommendation
**Skip Batch 9** (archives) and proceed to **Batch 10**:
- Target: MIXED type institutions (0/3 coverage)
- Or: RESEARCH_CENTER (0/2 coverage)
- Or: Focus on improving museum coverage (currently 74.5%)
Current coverage remains: **60.0%** (54/90 institutions)