"ÚOOÚ 2025: Rodné číslo a české národní identifikátory — proč vaše PII nástroj pravděpodobně selhává u českých dat"
The Challenge
České rodné číslo (formát RRMMDD/XXXX s kontrolní cifrou), číslo občanského průkazu a IČO (identifikační číslo osoby) mají jedinečné formáty vyžadující specializované rozpoznávání. ÚOOÚ zjistil v roce 2024, že 67% podniků v České republice používá německé nebo anglické PII nástroje, které postrádají podporu českých národních identifikátorů. Průmyslový sektor (Škoda Auto, Foxconn, mnoho německých výrobních firem) zpracovává HR data zaměstnanců v češtině s nedostatečnou ochranou.
By the Numbers
- ÚOOÚ: 58 vymáhacích rozhodnutí v roce 2024
- výrobní sektor tvoří 34% českých GDPR porušení
- české nástroje NER mají o 23% nižší přesnost než anglické ekvivalenty (technické pokyny ÚOOÚ 2024)
- 67% českých podniků používá nástroje bez podpory českých identifikátorů
- rodné číslo obsahuje datum narození a pohlaví — zvláštní kategorie dle čl. 9 GDPR
Technical Approach
Plná detekce rodného čísla (s ověřením kontrolního součtu), čísla občanského průkazu, pasu ČR, IČO/DIČ. Podpora českého jazyka (spaCy cs_core_news_sm) pro přesnou extrakci NER v českých dokumentech.
Comments (0)