Spring naar content
Opinie artikel

Drie handvatten om met Open Data aan de slag te gaan

Hoe je kwaliteit kunt verhogen en kosten verlagen

Veel organisaties zijn gestart met data-gedreven werken of ze zijn actief aan het onderzoeken hoe ze meer uit hun data kunnen halen. Data-gedreven werken kan een oplossing zijn om veel doelstellingen te halen. Daarnaast moeten we niet vergeten dat er ook veel mogelijk is met de open data die tegenwoordig beschikbaar is. Er zijn veel situaties waarin de inzet van open data op korte termijn veel waarde kan opleveren. In deze blog laten we zien hoe je deze gegevens kunt toepassen tot voordeel van je organisatie.

Open data is bij uitstek geschikt voor het verrijken en vereenvoudigen van je businessprocessen, omdat ze een duidelijk afgebakend domein beschrijven met herkenbare koppelvlakken (identifiers). Denk bijvoorbeeld aan de open datasets van het KNMI die gebruikt kunnen worden om processen op bepaalde locaties te laten reageren op veranderende weersomstandigheden. Vaak is data gratis te gebruiken, is de dataset van hoge kwaliteit en worden er regelmatig updates aangeboden. De kosten voor toepassing van open data zitten in de automatiseringsprocessen. Je business case is daarmee eenvoudig op te stellen.

Wat is open data?
Volgens de Open Knowledge Foundation is open data:

“Open data is data die vrij gebruikt kan worden, hergebruikt kan worden en opnieuw verspreid kan worden door iedereen – onderworpen enkel, in het uiterste geval, aan de eis tot het toeschrijven en gelijk delen.”

De rijksoverheid geeft een uitgebreide definitie van open data op hun Open Data Portaal. Voor alledaags gebruik is die definitie wat beperkend. Je kunt ook veel voordeel behalen met data die wel vrij toegankelijk en rechtenvrij bruikbaar is, maar niet voldoet aan alle criteria van open data. Zo kan data die niet eenvoudig vindbaar is wel van veel nut zijn. Een goed voorbeeld is de data die in het begin van de coronapandemie alleen via spreadsheets beschikbaar werd gesteld door het RIVM. Bedenk wel dat er vaak domeinexperts nodig zijn om dergelijke datasets te vinden en toe te passen.

Waar moet je rekening mee houden?
Als je open data wilt inzetten om de impact van je applicaties te vergroten dan zijn er een aantal zaken om rekening mee houden. Voor de meeste toepassingen zijn de volgende criteria voldoende om naar te kijken. Bij iedere vraag geef ik een voorbeeld aan de hand van de dataset met adresgegevens van Nederland, de Basisregistratie Adressen & Gebouwen.

  1. Kwaliteit
    • Hoe accuraat is de data?
    • Is een adres vastgelegd op de meter nauwkeurig?
    • Hoe betrouwbaar zijn de waarden in de dataset?
    • Is het 100% zeker dat een adres bestaat en dat de locatie klopt?
    • Welk formaat is gebruikt om de gegevens vast te leggen?
    • Als een adres geen huisletter heeft, is het veld dan NULL of een lege waarde?
  2. Validiteit
    • Hoelang is de data geldig?
    • Kan ik de dataset na een jaar nog goed gebruiken?
    • Welk gebied van het domein is gedekt?
    • Zijn adressen op Curaçao ook aanwezig in de dataset?
    • Is de data voor elke toepassing geldig?
    • Kan een architect de omtrek van gebouwen gebruiken voor een technische tekening?
  3. Actualiteit
    • Wanneer is de dataset geüpdatet?
    • Zijn adressen van huizen die in november 2022 (de huidige maand) zijn opgeleverd beschikbaar?
    • Hoe vaak of hoe snel wordt de data ververst?
    • Hoelang duurt het voordat een nieuw adres beschikbaar is in de dataset?
    • Welke bronnen zijn gebruikt om de dataset te genereren?
    • Zijn de adressen ingemeten door gecertificeerde landmeters of ingewonnen via crowd-sourcing?

In specifieke gevallen kan het zijn dat je meer eisen wil stellen, bijv. rondom automatisering en testbaarheid. Maar eerst wil ik iets langer stilstaan bij deze drie hoofdvragen. Let wel: hoewel ze kwantificeerbaar zijn, zegt dit niets over de toepasbaarheid in een specifiek geval.

Meer lezen:

https://tech-talk.the-experts.nl/drie-reden-om-je-organisatie-te-versterken-met-open-data-2d78a0beac22