Voorkomen is beter dan genezen, dat geldt al helemaal voor datakwaliteitsproblemen. Voor elke fout die je tegenkomt zijn er waarschijnlijk nog talloze op te sporen en te verhelpen! Inmiddels weet je dat we bij Siderian gebrand zijn op 100% correcte data; een streven waar nagenoeg altijd een datakwaliteitscan voor nodig is. Maar, we hebben uiteraard ook een aantal tricks up our sleeves om datakwaliteitsproblemen te voorkomen, in plaats van deze achteráf op te lossen!

 

6 tips om datakwaliteitsproblemen te voorkomen

 

1)      Kijk naar het begin; de invoervelden

Laten we beginnen bij de oorzaak van een groot gedeelte van de datakwaliteitsproblemen; de invoervelden. Om te voorkomen dat jijzelf of je collega’s fouten maken bij het invoeren van nieuwe gegevens, zou je als organisatie standaarden moeten bepalen voor invoervelden. Als voorbeeld; een formulier kan niet worden opgestuurd als een postcode niet bestaat uit 4 cijfers, opgevolgd door 2 hoofdletters. Hiermee dwing je eigenlijk al vanaf begin af aan af dat de data 100% juist wordt ingevoerd (en dan kan het ook eigenlijk niet meer fout gaan 😉).Hier

 

2)      Heb je écht al die data nodig?

Nee dat is niet sarcastisch; kijk ten tweede eens naar de data die je in huis hebt! Hierbij is het wederom belangrijk om dit te analyseren aan de hand van je invoervelden. Jij of je collega’s moeten wellicht dagelijks tientallen (digitale) formulieren invullen waarbij er een complete set aan informatie wordt opgevraagd. Maar wat wordt er met deze data gedaan? Heeft de data écht een doel of wordt het opgevraagd omdat dit vanaf het begin al zo was? Overweeg om de data zónder een doel te verwijderen, dan verwijder je de datakwaliteitsproblemen mee!

 

3)      Zorg voor gebruiksvriendelijke formulieren

Je moet een formulier invullen, krijgt een foutmelding, maar je hebt geen idee wát er precies fout is. Enorm frustrerend en enorm demotiverend als dit op de werkvloer gebeurt. Zorg er daarom voor dat je de formulieren zo gebruiksvriendelijk mogelijk formuleert. Een formulier dat niet prettig werkt wordt al snel genegeerd en men gaat op zoek naar alternatieven. Een foutmelding is zeker niet verkeerd; ze zijn er immers om datakwaliteitsproblemen te voorkomen, maar zorg dat ze de gebruiker zo goed mogelijk begeleiden naar de fout en hoe deze te verbeteren is.

 

4)      Dubbele data corrigeren

Een ander veelvoorkomend datakwaliteitsprobleem is het aantal dubbele records in de data. Dat wil zeggen dat hetzelfde record meermaals in een bepaald systeem staat (wat niet de bedoeling is). Als je weet dat deze dubbele data records aanwezig zijn in jouw bedrijfssystemen, onderneem dan actie! Bij de oorsprong is het belangrijk om goed te kijken naar de manier waarop de data wordt ingevoerd (zie stap 1). Zorg dat er duidelijke regels zijn met betrekking tot het invoeren van nieuwe data, zodat je niet achteraf hoeft te corrigeren. Gelukkig zijn er een aantal gratis tools beschikbaar die je helpen met het opsporen en verwijderen van dubbele records.

Het enige probleem is dat sommige records in betekenis hetzelfde zijn, maar dat ze nét iets anders staan omschreven. Denk bijvoorbeeld aan het record ‘Hogeschool van Amsterdam’. Ieder ander maakt het zichzelf makkelijk en omschrijft de hogeschool als de ‘HVA’. De betekenis is hierin hetzelfde, maar als je scant op ‘Hogeschool van Amsterdam’, zul je de HVA niet gaan vinden.

 

5)      Zorg voor Data-awareness

Het klinkt misschien voor de hand liggend, maar het is cruciaal dat de mensen op de werkvloer op de hoogte zijn van datakwaliteit en wat de gevolgen zijn als er fouten in de data zitten. Datakwaliteitsproblemen ontstaan immers vaak bij de mensen die ermee werken, des te belangrijker is het om ervoor te zorgen dat iedereen weet hoe je de problemen voorkomt!

 

6)      De data-steward rol

Tot slot is de kwaliteit van de data te borgen door één iemand eindverantwoordelijk te maken voor de data. Hiervoor is in de afgelopen jaren een nieuwe rol ontstaan: de data-steward. De data-steward is o.a. verantwoordelijk voor:

  • Het analyseren van behoeften vanuit het werkveld; wat vindt men van bestaande formulieren en waar liggen kansen?
  • Het verkennen van mogelijkheden die de datakwaliteit verbeteren en borgen; voornamelijk op het gebied van ICT-systemen
  • Het continue verbeteren van de datakwaliteit en brengt eventuele fouten in kaart

‘Waar moet ik beginnen?’

Terechte vraag; er zijn immers nogal wat aspecten waar je op moet letten om 100% correcte datakwaliteit te realiseren! Gelukkig ben je na het lezen van deze blogpost ook gelijk bij de juiste organisatie die jouw data weer op de rails krijgt. Bij Siderian zijn we gespecialiseerd op het:

  • Analyseren van jouw datakwaliteit (en ja, dubbele records als ‘Hogeschool van Amsterdam’ en ‘HVA’ vinden we ook 😉)
  • Het optimaliseren van de datakwaliteit; met onze datakwaliteitscan brengen we de problemen in kaart en verhelpen we deze binnen no-time
  • Het borgen van de datakwaliteit in onze datakwaliteitsmonitor, zodat je altijd op de hoogte bent van jouw datakwaliteit!

Meer weten over hoe wij jouw partner zijn op het gebied van datakwaliteit?

Spacelab 43
3824 MR Amersfoort

Telefoon: 085 130 1833

E-mail: info@siderian.com

Indien op deze website prijzen worden genoemd, ongeacht de valuta,
zijn deze altijd exclusief BtW. 

© 2021 Siderian B.V.


FOLLOW US