Compliance i Protecció de Dades
La anonimització: Riscos i tècniques
La anonimització és una tècnica que s’aplica sobre les dades personals perquè no es pugui identificar les persones reduint així els riscos de tractament massiu de dades, però aquest procés no està exempt de riscos.Moltes empreses utilitzen tècniques d’anonimització de dades per no haver de realitzar un tractament de dades personals que les obligui a complir amb les normativa establerta al respecte. Es tracta d’un procés que els permet identificar i amagar la informació concernent als titulars de la mateixa i divulgar sense vulnerar els drets de protecció de dades.
Si bé l’anonimització és una estratègia d’indubtable valor, especialment en el tractament de gran volum de dades, la veritat és que no està exempta de riscos i els responsables del tractament prendre en consideració que un conjunt de dades anonimitzat pot implicar riscos residuals per les persones titulars de les dades.
Hi ha diferents tècniques d’anonimització amb diferents graus de solidesa davant els riscos d’identificabilitat de les dades tractades. En aquest àmbit, és important tenir en compte el Dictamen 05/2014 del Grup de Treball de l’article 29, sobre tècniques d’anonimització, en què s’identifiquen els seus riscos bàsics i les tècniques més adequades per prevenir aquests riscos i impedir la reidentificació de dades:
1- Riscos bàsics per a la anonimització:
- Singularització (Singling out): És la possibilitat d’aïllar alguns o totes les dades que permeten identificar un individu en un conjunt, un cop realitzada l’anonimització.
- Vinculabilidad (linkability): És la capacitat de vincular, almenys, dues dades referents al mateix interessat o grup d’interessats (en una mateixa base de dades o en dues bases de dades diferents).
- Inferència (Inference): És la possibilitat de deduir, amb una probabilitat significativa, el valor d’un atribut en un conjunt d’atributs.
2- Tècniques d’anonimització:
- Aleatorització: és un conjunt de tècniques que altera la veracitat de les dades per tal d’eliminar el vincle entre les dades i l’individu. Si les dades són prou incerts llavors ja no es pot fer referència a un individu específic.
Hi ha diverses modalitats:
– Addicció del soroll: consisteix a modificar els atributs en el conjunt de dades perquè siguin menys precisos, mantenint la distribució general. D’aquesta manera, un observador suposarà que els valors són precisos, però això només serà cert fins a cert punt. Bé aplicada, aquesta tècnica permet que no es pugui identificar un individu així com reparar o detectar com s’han modificat les dades.
– Permutació: Aquesta tècnica, consisteix a barrejar els valors dels atributs en una taula perquè alguns d’ells estiguin artificialment vinculats a diferents titulars de les dades. Aquesta modalitat és útil quan és important mantenir la distribució exacta de cada atribut dins del conjunt de dades.
– Privadesa diferencial: S’utilitza quan el controlador de dades genera vistes anonimitzades d’un conjunt de dades mentre conserva una còpia de les dades originals. Aquestes vistes anonimitzades normalment es generen a través d’un subconjunt de consultes per a un tercer en particular. Dit subconjunt, inclou una mica de soroll aleatori afegit deliberadament ex-post.
- Generalització: Consisteix en generalitzar o diluir els atributs dels interessats modificant l’escala respectiva o ordre de magnitud (una regió en lloc d’una ciutat, un mes en lloc d’una setmana). Encara que aquest enfocament pot ser efectiu per prevenir l’aïllament, no permet l’anonimització efectiva en tots els casos; en particular, requereix enfocaments quantitatius específics i sofisticats per evitar la vinculació i la inferència.
Hi ha diverses modalitats:
– Agregació i anonimat k (Aggregation i k-Anonymity): Amb ella es pretén impedir que una persones sigui singularitzada a agrupar-la amb almenys un grup k de persones. Per això els valors dels atributs es generalitzen de manera que cada individu comparteixi el mateix valor.
– Diversitat l, proximitat t (L-diversity / T-Closeness): S’afegeix complexitat a la tècnica abans descrita, i s’amplia el “k-Anonymity” assegurant-se que en cada classe d’equivalència, cada atribut tingui almenys l valors diferents.
En difinitiva, en el procés d’anonimització, els responsables del tractament han de conèixer bé les fortaleses i debilitats de cada tècnica, i considerar bé les circumstàncies concretes per aplicar la tècnica o combinació de tècniques, més adequades per garantir la privacitat de dades i que no es pugui singularitzar a una persona, ni vincular els registres ni informació a ella relatius.
Campos Catafal porta assessorant i representant a emprenedors, autònoms i empreses des de 1983. Recordeu que el present article és informatiu i no substitueix l’assessorament legal d’un advocat. Si vol el nostre assessorament professional sobre aquest tema, contacti amb nosaltres.