DS en privacyvraagstukken - context en waarde

Data Science & privacyvraagstukken: oogst de waarde van data

31 maart 2020

In januari 2020 plaatste Follow the Money een artikel met de titel ‘Alle kinderen nauwgezet in beeld met big data’. Mijn gevoelens naar aanleiding van dat artikel waren tweeledig. Aan de ene kant zag ik een aantal punten waarvan ik vond dat enige nuance op zijn plaats was. Aan de andere kant kan ik de zorgen die in het artikel genoemd werden, heel goed plaatsen.

In de afgelopen twee blogs heb ik geprobeerd om twee van de elementen te belichten en hopelijk mensen nieuwe inspiratie te geven. Het ging hier om het gebruik van Artificial Intelligence in het sociaal domein en het identificeren van risicofactoren en risicogroepen. In deze laatste blog van mijn blogreeks geef ik mijn visie en antwoorden op de vragen: Waar zijn wij als analisten schuldig aan? Welke afspraken zouden we met opdrachtgevers moeten kunnen maken?

Registratieverslaving

Allereerst wil ik toch nog even herhalen wat in de vorige blog ook al is aangestipt: Er is naar mijn mening sprake van een breder probleem. Met de verschuiving van het afnemen van enquêtes naar de analyse van registraties, is men ook op een andere manier naar deze registraties gaan kijken. Deze zijn opeens heilig geworden. Uit alle hoeken van de samenleving hoor je geluiden dat men steeds meer moet registreren en verantwoorden. En dat op basis van die registraties, het systeem het verdere verloop van een procedure bepaalt. Dat het systeem dit kan, werkt perfect voor een vaststaande workflow bij een IT bedrijf wanneer er bijvoorbeeld een nieuwe data- connectie moet worden aangevraagd. Maar ik denk dat wij er als samenleving serieus over moeten nadenken of dit wel wenselijk is bij processen die uiteindelijk effect hebben op de levens van (kwetsbare) mensen en gezinnen.

Het gevaar dreigt dat de registraties belangrijker worden dan de context, en vooral in het sociaal domein is dat simpelweg onacceptabel. De context kan het verschil maken tussen het krijgen van huiswerkbegeleiding op school en aangemerkt worden voor wekelijkse therapiesessies. Of, zoals het voorbeeld in Follow the Money, een (onterechte) uithuisplaatsing.

Vandaar ook een herhaling van mijn oproep van vorige week: Maak gebruik van de voordelen van data science, maar maak het absoluut niet leidend. Geef hulpverleners een toolkit waarmee ze hun gezinnen kunnen helpen, maar maak ze geen slaven van registraties en hokjes. Vertrouw op hun professionaliteit en inzicht, en laat data niets anders zijn dan een hulpmiddel.

De verantwoordelijkheid van analisten

Soms zitten wij analisten een beetje in onze eigen bubble. Laten we daar eens uit gaan breken door niet tegen onze opdrachtgevers te roepen: ‘over een week heb ik wel iets’, maar ze mee te nemen in ons denkproces. En benoem daarbij welke uitdagingen er bij het analyseren van de data zijn. En dan heb ik het niet alleen over datakwaliteit 😉. Zoals in mijn tweede blog omschreven, neem het doorgronden en snappen van je dataset mee als onderdeel in je analyse. Zorg dat je te rade gaat bij de data-eigenaren om te snappen hoe een dataset tot stand is gekomen, en welke mogelijke vooroordelen zij denken dat erin verstopt kunnen zitten. Om een statement te gebruiken dat op dit moment vaak in het politiek debat voorkomt, maar ook hier van toepassing is: wees transparant!

Verzoek aan de opdrachtgevers

Ik plaats ook graag een oproep aan de opdrachtgevers: Verdiep je in het data science proces. Je hoeft echt het verschil niet te weten tussen een logistische regressie en een lineaire regressie, maar zorg wel dat je weet welke stappen je analisten nemen en met welke redenen ze dat doen. Wij analisten mogen ook wel een beetje ter verantwoording worden geroepen. Vraag naar de stappen die we nemen, de keuzes die we maken en waarom we dat doen. Maak afspraken over wat er absoluut wel of niet met de data gedaan mag worden.

Veel data scientists hebben niets liever dan een ongerepte speeltuin waar er gegrasduind kan worden in de data. Maar als je organisatie daar niet het vertrouwen in heeft omdat de data-huishouding nog niet op orde is, of omdat het een nieuw territorium is, maak dan afspraken wie met welke data kan spelen, onder welke voorwaarden en voor welke doeleinden. Maak er een project van.

Transparante communicatie

Ik vind dat er naar buiten toe veel transparanter gecommuniceerd moet worden over lopende onderzoeken, met welk doel die worden uitgevoerd en welke keuzes daarin worden gemaakt. Als we aan alle kanten een beetje meer open zijn, zowel als opdrachtnemer naar opdrachtgever, als opdrachtgever naar opdrachtnemer en als instituut/bedrijf naar de buitenwereld, verdwijnt die angst voor data als sneeuw voor de zon.

Conclusie

Ter afsluiting van mijn blogserie, hier een overzicht van de belangrijkste punten die ik heb benoemd:

Ken je historie en ken je data!
Val niet in de valkuilen van stereotypering.
Wees je bewust van mogelijke consequenties bij het (foutief) analyseren.
Maak context leidend, niet het systeem.
Wees transparant, in wat je als data scientist doet en in je communicatie.

Heb je na het lezen van mijn blogreeks over Data Science & privacyvraagstukken nog vragen? Of kan ik je helpen met een vraagstuk omtrent data-analyse? Laat het me dan weten via dboertien@scamander.com. Ik help je graag om de waarde van data te oogsten.

Diana Boertien
Data Analist en Adviseur

Registratieverslaving

De verantwoordelijkheid van analisten

Verzoek aan de opdrachtgevers

Transparante communicatie

Conclusie

Ter afsluiting van mijn blogserie, hier een overzicht van de belangrijkste punten die ik heb benoemd:

Ken je historie en ken je data!
Val niet in de valkuilen van stereotypering.
Wees je bewust van mogelijke consequenties bij het (foutief) analyseren.
Maak context leidend, niet het systeem.
Wees transparant, in wat je als data scientist doet en in je communicatie.

Diana Boertien
Data Analist en Adviseur

Data Science & privacyvraagstukken: oogst de waarde van data

Registratieverslaving

De verantwoordelijkheid van analisten

Verzoek aan de opdrachtgevers

Transparante communicatie

Conclusie

Registratieverslaving

De verantwoordelijkheid van analisten

Verzoek aan de opdrachtgevers

Transparante communicatie

Conclusie

Semantische spraakverwarringen en het gebruik van vaktermen

Waarom kies je voor een open source data catalogus?

Waarom investeren in een data catalogus?

Vragen en antwoorden over data

(Data)strategie, richting én resultaat

Datawijze overheid – Gemeente ‘s-Hertogenbosch

28 januari – Europese dag van de privacy

Scamander ISO 27001 gecertificeerd

Fijne feestdagen en een gezond 2024

Bekijk de wereld door de lens van data

Het hoe en wat van Azure Cost Management

Eindejaarsactie 2023 – welk doel geef jij wat extra aandacht?

Informatie is dood, lang leve data!

Scamander bestaat 25 jaar! En dat vieren we.

Persbericht: Gemeente ‘s-Hertogenbosch kiest voor Data Platform van Scamander

Mini-conferentie Gemeentelijk Gegevensmodel en het Sociaal Domein

Modelleren is allesbehalve een technische exercitie

Scamander start Gilden voor optimale kennisdeling

Eindejaarsactie 2022 – Welk doel geef jij wat extra aandacht?

e-paper: De juiste definitie in de juiste context

Persbericht: Paul Uijtewaal Algemeen Directeur a.i. bij Scamander

Oeps, een datalek….Tips om ze te voorkomen

AD Artikel: Schiedamse ouderen drukten ruim 400 keer op de Behoeftelijnknop

Eindejaarsactie 2021 – Welk doel geef jij wat extra aandacht?