“Predictive policing”: bij voorbaat verdacht

Stelselmatige intimidatie.
Stelselmatige intimidatie.
Sinds een aantal jaren werkt de politie in de VS en in andere landen, waaronder Nederland, met computerprogramma’s die misdaad zouden kunnen ‘voorspellen’. “Predictive policing” werd door Time Magazine een van de beste uitvindingen van 2011 genoemd. Het gebruik van “datamining” en statistische technieken bij politie en andere instanties vormt echter een grootscheepse aantasting van de privacy en bestempelt grote groepen mensen als verdacht of als risicofactor.

In Los Angeles gebruikt de politie zogeheten “PredPol”-software. Die software analyseert data van misdrijven in voorafgaande jaren en doet op grond daarvan voorspellingen over de kans op misdrijven in de toekomst. Daarvoor deelt het programma gebieden op in zeer kleine zones. Ook de Nederlandse politie gebruikt dergelijke software. Het meest gebruikte programma hier is DataDetective dat op de markt wordt gebracht door het bedrijf Sentient. Het programma is door middel van “datamining” in staat om verbanden te ontdekken tussen duizenden verschillende gegevens afkomstig van onder andere het KNMI, de Kamer van Koophandel, CBS, en Experian – een multinational die handelt in uiteenlopende data over mensen – en maakt daarvoor gebruik van een mix van onder andere “zelflerende modellen”, clusteranalyse en statistiek. Het programma genereert zogenaamde Hotspot- en voorspellingskaarten, als het ware een soort weersverwachting van de misdaad die bepaalt waar de meest intensieve surveillance plaats dient te vinden, of dit nu is met politieauto’s, helikopters of de momenteel sterk in de belangstelling staande drones. Het programma wordt ook gebruikt voor de bepaling van “mogelijke verdachten” en ingezet om plaatsen voor preventieve fouilleeracties te bepalen.

Allereerst moet worden vastgesteld dat de naam “predictive policing” nogal overtrokken verwachtingen schept, namelijk dat misdrijven zouden kunnen worden voorspeld. Ook een naam als PredPol roept dergelijke verwachtingen op. Niet vreemd, want de producenten willen hun product uiteraard graag verkopen. Er is echter geen sprake van dat misdaden hiermee kunnen worden voorspeld, hoe graag sommigen bij de politie dit ook zouden willen. Maar er worden wel successen geclaimd in het terugdringen van misdaadcijfers, en de conclusie ligt dan voor de hand dat toepassing van software als DataDetective en PredPol alleen maar logisch is. Toch kleven er grote bezwaren aan deze technieken.

Een mogelijk probleem van het gebruik van DataDetective is de veronderstelde objectiviteit van de gebruikte algoritmes (rekenregels) en de onmogelijkheid voor buitenstaanders om die te kunnen controleren. Voor aanhouding is normaal gesproken een redelijk vermoeden van een overtreding of misdrijf nodig, anders kan de rechter de aanhouding en het vervolg daarop als onrechtmatig bestempelen. Het gevaar bestaat dat de uitkomsten van programma’s als DataDetective als objectief worden gezien, vanwege de wetenschappelijke aura die er omheen hangt. Dit kan een vrijbrief voor de politie worden om mensen op basis van statistische gegevens staande te houden of te arresteren. Een probleem daarbij is ook dat bedrijven geen informatie over hun software willen openbaren, omdat ze hun concurrenten geen informatie willen verschaffen, maar ook de politie zal niet graag prijsgeven wat zij zien als strategische informatie.

Rechters zullen misschien niet zomaar akkoord gaan met een dergelijke aanpak door de politie, maar het leed is dan al geschied. In ieder geval kunnen hele groepen van de bevolking, personen met bepaalde kenmerken of zelfs hele woonwijken bij de politie onder het vergrootglas komen te liggen. Een aanleiding om iemand aan te houden is dan wellicht snel gevonden.

Triviaal

Aanwijzingen die in verband worden gebracht met misdrijven kunnen heel triviaal zijn, zodat iedereen verdacht kan worden. Als een correlatie (verband) door het systeem hoog genoeg wordt bevonden, gaan de alarmbellen rinkelen. Of het verband oorzakelijk is, of niet, is daarbij voor de politie niet van belang.

Dat DataDetective correlaties kan ontdekken in de meest uiteenlopende gegevens, leidt soms tot foutieve conclusies die bijvoorbeeld hele bevolkingsgroepen in een kwaad daglicht stellen. Het programma vond een correlatie tussen de ramadan en vandalisme. Maar correlaties hoeven helemaal niet op oorzakelijke verbanden te duiden. Zo ook in dit geval: de ramadan viel in die jaren in het najaar en het vandalisme bleek bij nader inzien met het afsteken van vuurwerk te maken te hebben.

Afgaan op correlaties kan ook dodelijk uitpakken. Het programma DataDetective bevat “zelflerende modellen” om vuurwapengevaarlijke personen te leren herkennen op basis van voorbeelden. Volgens Rob van der Veer van Sentient, de producent van DataDetective, is dat erg handig bij aanhouding, want ook al heeft iemand concreet gesproken niets met vuurwapens te maken, het kan zijn dat zo iemand wel “veel andere kenmerken vertoont van de gemiddelde vuurwapengevaarlijke”. Dergelijke onjuiste vermoedens kunnen echter makkelijk aanleiding geven voor dodelijk politiegeweld. Dat bleek wel in 2012 toen de zeventienjarige Rishi Chandrikasing op station Den Haag HS door de politie werd doodgeschoten, omdat die ten onrechte meende dat hij een vuurwapen bij zich had. Dat de informatie in dit geval (voor zover bekend) niet van DataDetective afkomstig was, doet daar niets aan af.

De politie is ook geïnteresseerd in het voorspellen van welke jongeren zich later mogelijk tot “veelpleger” zouden kunnen ontwikkelen. Tot de voorspellers daarvan behoren naast fietsendiefstal en zwartrijden ook spijbelen en het behoren tot een eenoudergezin. Dat het opgroeien in een eenoudergezin iemand in het verdachtenbankje plaatst, is natuurlijk volstrekt onacceptabel. Voor spijbelen geldt eigenlijk hetzelfde, want voor zover ik weet valt dat vooralsnog niet onder de noemer “misdadig gedrag”. Het roept bovendien de vraag op welke persoonlijke omstandigheden je nog meer verdacht kunnen maken, zodat je in het vizier komt bij de politie en allerlei hulpinstanties.

Stelselmatige observatie

Het voorselecteren van “mogelijke verdachten” op basis van ongrijpbare “datamining”-technieken wordt steeds belangrijker en plaatst steeds meer mensen of groepen van mensen op oncontroleerbare wijze in het verdachtenbankje. Dat is ook het geval bij het gebruik van het @MIGO-BORAS-camerasysteem door de marechaussee. Je kunt daarbij verdacht zijn vanwege voertuigkenmerken die je auto bezit of “verdachte verkeerspatronen” waaraan je voldoet. Wat dat in concrete gevallen inhoudt, wordt angstvallig geheim gehouden, maar het is wel zeker dat er naar nationaliteit gekeken wordt. De overheid zelf stelt in verhullend taalgebruik dat het @MIGO-BORAS-systeem slechts “verkeerspatronen” en “algemene gegevens en doelgroepprofielen” gebruikt om te bepalen wie er gecontroleerd wordt. Het betekent wel dat iedereen zonder het te weten en zonder concrete verdenking verdacht kan zijn en dus kan worden gecontroleerd. Volgens de bekende advocaat Inez Weski is er in dergelijke gevallen sprake van stelselmatige observatie zonder feitelijke verdenking, wat in strijd is met het Europees Verdrag voor de Rechten van de Mens.

Doordat er bij informatiegestuurde surveillance sprake is van het sterk focussen van politieaandacht, kan een dergelijke manier van surveilleren ook zomaar overgaan in stelselmatige observatie zonder concrete verdenking. Zo kunnen hele woonwijken onder het vergrootglas van de politie komen te liggen. In Den Bosch leidde dat recent tot een grootscheepse politie-inval in de Gestelse buurt, waarbij de hele buurt werd afgesloten, al het verkeer werd gecontroleerd, en diverse invallen werden gedaan. Van grootschalige misdaad bleek overigens geen sprake te zijn. Wel werden er twee bijstandsuitkeringen stopgezet en werden er spullen afgepakt van mensen met schulden. Ondertussen wordt een hele wijk gecriminaliseerd en worden alle inwoners daarvan als verdachten behandeld.

In een artikel op de website van The Guardian worden Facebook en andere sociale netwerksites als mogelijke belangrijke partners voor de politie aangewezen. Facebook beschikt immers over heel veel informatie over mensen, en de mogelijkheden om daaruit via statistische analyse informatie te halen zijn aanzienlijk. Het Nederlandse bedrijf TomTom verkocht met het systeem verkregen gegevens over het rijgedrag van automobilisten aan de politie die ze gebruikte om verkeerscontroles te plannen. Bedrijven als Facebook zouden dat soort dingen ook kunnen doen en andere bedrijven zijn daar al mee begonnen. Bedrijven als Accenture en ECM Universe maken reclame voor hun mogelijkheden om met analyse van de sociale media de politie te assisteren. Ze maken daarbij net als DataDetective gebruik van technieken die zowel voor marketingdoeleinden als voor gebruik door de politie kunnen worden ingezet.

Maar niet alleen de politie maakt gebruik van de alomtegenwoordige data. Ook de Belastingdienst, geheime diensten, bedrijven, banken, verzekeraars en woningbouwcorporaties maken er gretig gebruik van. Bedrijven doen dit voor marketingdoeleinden en analyse van klantgedrag, belastingdiensten voor fraudedetectie en verzekeraars om risico’s te minimaliseren.

Ook hier geldt dat je al snel verdacht kunt zijn. Zo blijkt woningcorporatie De Unie in Rotterdam een systeem te gebruiken met twintig indicatoren voor onderverhuur, bijvoorbeeld het soort woning, overlastmeldingen en hoe lang iemand ergens woont. “Het is raar als iemand na twintig jaar nog steeds in een startersflatje woont, drie hoog”, meent de systeemontwerper van MB-All, dat het systeem aan de corporatie leverde. Dat daar legio verklaringen voor zijn – je woont er gewoon prettig of je hebt een hekel aan verhuizen – is voor het programma en degenen die er achter zitten kennelijk niet van belang. Je hebt toevallig de pech dat je bepaalde kenmerken met je meedraagt die als een verhoogd risico gelden.

De wervende website van Sentient vermeldt: “Door datamining toe te passen op claimhistorie kunnen verzekeringsmaatschappijen risicoprofielen sneller en nauwkeuriger ontdekken. Met deze profielen kan het acceptatieproces en het premiebeleid gerichter worden gestuurd om zodoende kosten te minimaliseren.” Het bedrijf speelt zo een zeer dubieuze rol doordat het verzekeraars helpt om mensen met een verhoogd risico te selecteren. Deze mensen kunnen zich dan alleen nog voor een zeer hoge premie of helemaal niet verzekeren tegen risico’s. Het zou interessant zijn om te onderzoeken over welke bronnen/databases (behalve de genoemde) het programma kan beschikken. Een vraag die des te belangrijker is omdat er steeds meer gegevens van mensen in allerlei databases worden opgeslagen.

Jacob Visser