Niet zelden zie ik in organisaties gevechten tussen data scientists en privacy professionals. En dan gaat de strijd niet over traditionele oorzaken zoals land, religie of eer, maar over dataminimalisatie (hoeveel data heb je nodig), opslag (hoe lang sla je data op) en grondslag (mag dit eigenlijk wel). Met felle discussies, rookgordijnen en achterhoedediscussies gaat men elkaar te lijf. Maar bij gevechten zijn eigenlijk nooit winnaars. Ook niet bij dit gevecht.
Het is ook niet raar dat deze gevechten plaatsvinden: het zijn allebei immers nieuwe vakgebieden, waarbij (net als op het schoolplein) een territorium moet worden afgebakend. En dat territorium van data lijkt op het eerste oog wel eens ten koste te gaan van het privacy territorium.
Lijkt. Want nu beide vakgebieden wat volwassener worden, valt dat bij nader inzien best mee. Want eigenlijk hebben beide beroepsgroepen dezelfde kernwaarden. Beide zijn op drie manieren sterk afhankelijk van de kwaliteit van gegevens: de juistheid, de actualiteit en de volledigheid. OK, de privacy pro kijkt vooral naar persoonsgegevens en de data pro naar alle gegevens, maar de kernwaarden zijn hetzelfde.
Bij opdrachtgevers doen we steeds meer opdrachten die data én privacy raken. En langzaam zie ik dat de privacy en data teams elkaar ook steeds beter beginnen te vinden, te begrijpen en te waarderen.
Natuurlijk, vanuit data perspectief is er soms de behoefte om te experimenteren, waardoor je wel eens de grenzen opzoekt van de privacywetgeving. En vanuit privacy perspectief is het nodig om een goede wettelijke basis te hebben en transparant te zijn. Iets waar je als data scientist niet direct bij stil staat als je verbanden zoekt.
Maar het zijn de juistheid, de actualiteit en de volledigheid van de gegevens die de vakgebieden verbinden. De discussies gaan dus in ieder geval over de goede gegevens!