"Datatilsynet Danmark 2025: CPR-nummer detektering og GDPR-teknisk compliance — hvad din PII-løsning skal kunne"
The Challenge
Det danske CPR-nummer (Det Centrale Personregister) — 10 cifre i formatet DDMMYY-XXXX med modulus-11 checksum — er det primære nationale identifikator som kræver specialiseret detektering. Datatilsynet har i 2024 fokuseret på sundhedsdata og AI-systemer, og kræver dokumenteret teknisk anonymisering af CPR-numre. Danmarks sundhedsteknologisektor (en af Europas mest avancerede) behandler CPR-data for alle 5,9 millioner danskere.
By the Numbers
- Datatilsynet: 31 GDPR-afgørelser 2024 — kraftig stigning fra 34 i 2022
- 14 sager involverede sundhedsdatasystemer
- CPR-nummer kræver modulus-11 validering som 67% af NLP-værktøjer mangler
- dansk sundhedssektor: 4,7M patientjournaler behandles årligt
- Datatilsynet kræver dokumenteret anonymiseringsvalidering for sekundær brug af sundhedsdata
Technical Approach
Fuldstændig CPR-detektering (med modulus-11 validering), pas DK, kørekort DK. Dansk sprogsupport med spaCy da_core_news for præcis NER-ekstraktion i danske dokumenter.
Comments (0)