De meeste feedproblemen zijn geen feedproblemen. Ze zijn datakwaliteitsproblemen die zich pas op het kanaal als feedprobleem laten zien. Een afgekeurd product, een verkeerde prijs, een product dat niet vindbaar is: bijna altijd ligt de oorzaak stroomopwaarts, in de brondata. Wie datakwaliteit structureel borgt, lost het probleem op waar het ontstaat in plaats van het keer op keer met rules te maskeren. Deze gids geeft je een werkwijze om je brondata schoon te houden zodat je rules altijd voorspelbaar blijven werken.
Wil je eerst begrijpen waar in de keten data binnenkomt, lees dan de gids over de architectuur van een datafeed. Deze gids richt zich op de eerste schakel: de bron schoon en betrouwbaar houden.
01. Waarom datakwaliteit bij de bron hoort
Rules kunnen veel, maar ze kunnen niet toveren. Een rule die een ontbrekend veld telkens moet afleiden uit een ander veld is een pleister die ooit losraakt. Los je het probleem bij de bron op, dan klopt elke feed die erop volgt vanzelf, en blijven je rules eenvoudig en begrijpelijk.
De vuistregel: repareer zo vroeg mogelijk in de keten. Hoe verder stroomopwaarts, hoe meer producten een verbetering raakt en hoe minder logica je nodig hebt om de schade te beperken. Een bredere uitleg over wat schone data betekent, staat in het blog feed-datakwaliteit.
02. De drie pijlers
Goede feed-data rust op drie pijlers, en ze zijn allemaal even belangrijk:
- Volledigheid: verplichte velden zijn ingevuld, zodat producten überhaupt live kunnen
- Consistentie: dezelfde informatie staat overal op dezelfde manier, wat de vindbaarheid bepaalt
- Actualiteit: prijs en voorraad lopen mee met je shop, zodat klanten kloppende informatie zien
Ontbreekt volledigheid, dan komen producten niet live. Ontbreekt consistentie, dan worden ze slecht gevonden. Ontbreekt actualiteit, dan ontstaan oversells en prijsverschillen. Alle drie tegelijk op orde is het doel.
03. Praktische controles
Datakwaliteit borg je met concrete, herhaalbare controles. Een paar die in vrijwel elke shop lonen:
- Zijn er producten zonder afbeelding, zonder EAN of zonder verplicht attribuut? Die horen aangevuld of uitgesloten
- Staan prijzen binnen een verwachte bandbreedte, of zit er een product met een prijs van nul of een onmogelijk hoog bedrag tussen?
- Lopen voorraadaantallen synchroon met de bron, of zit er vertraging in het verversschema?
- Worden afgekeurde producten opnieuw aangeboden zodra ze gerepareerd zijn?
Een uitsluit-rule vangt incomplete producten op terwijl je ze aanvult, zodat een gat in de data nooit een afkeuring op het kanaal wordt.
04. Consistentie afdwingen
Inconsistentie is de stiekemste vijand van vindbaarheid. Als een kleur de ene keer "blauw" en de andere keer "navy" of "BLAUW" heet, ziet het kanaal drie verschillende dingen. Een mapping naar een vast vocabulaire lost dat in één keer op.
// rule: normalize_color
map color:
"navy", "donkerblauw", "BLAUW" -> "blauw"
"zwart/black", "BLACK" -> "zwart"
Bouw daarnaast een controle in op nieuwe, onbekende waarden, zodat je het merkt zodra een leverancier een variant met een afwijkende kleurnaam aanlevert. Hoe attribuut-waarden naar kanaalvelden worden gemapt, behandelt het blog feed-attribuut-mapping uitgelegd.
05. Een vaste controle-cadans
Datakwaliteit verslapt zonder ritme. Een werkbare cadans voor een gemiddelde MKB-seller:
- Wekelijks: afkeuringen en lege verplichte velden nalopen
- Maandelijks: consistentie van kleuren, maten en categorieën controleren
- Per nieuwe lijn: de randgevallen checken die elke nieuwe productgroep meebrengt
Deze cadans sluit aan op het bredere onderhoud uit de complete gids over feed-management. Datakwaliteit is een vast onderdeel van dat onderhoud, geen losse klus.
06. Nieuwe productlijnen opvangen
Elke nieuwe productlijn brengt nieuwe randgevallen mee: een categorie die nog niet gemapt is, een attribuut dat ontbreekt, een kleurnaam die niet in je vocabulaire zit. Wie een vaste werkwijze heeft om nieuwe producten te checken, voorkomt dat een uitbreiding stilletjes de datakwaliteit ondergraaft.
Maak van die check een vast onderdeel van het introduceren van nieuwe producten. Een korte controle vooraf is altijd goedkoper dan een berg afkeuringen achteraf.
07. Zelf doen of uitbesteden?
De controles en de mapping naar een vast vocabulaire zijn goed zelf te doen, en het loont om er grip op te houden: niemand kent je assortiment beter dan jij. Een vaste cadans aanhouden is vooral een kwestie van discipline.
Zit je data structureel rommelig en weet je niet waar te beginnen, dan brengt een gerichte audit en troubleshooting de grootste lekken in kaart. Wil je het lopende onderhoud uit handen geven, dan bestaat doorlopend feed-onderhoud op offertebasis. Twijfel je waar de meeste winst zit? Leg het voor via contact.
08. Veelgestelde vragen
Rules kunnen veel repareren, maar een rule die telkens hetzelfde brongebrek moet maskeren is een pleister, geen oplossing. Wat ontbreekt in de bron, moet een rule raden of afleiden, en dat gaat ooit mis. Los je het bij de bron op, dan klopt elke feed die erop volgt vanzelf en blijven je rules eenvoudig en voorspelbaar.
Volledigheid, consistentie en actualiteit. Volledig betekent dat verplichte velden zijn ingevuld, zodat producten live kunnen. Consistent betekent dat dezelfde informatie overal op dezelfde manier staat, wat de vindbaarheid bepaalt. Actueel betekent dat prijs en voorraad meelopen met je shop. Ontbreekt één pijler, dan ontstaan afkeuringen, slechte vindbaarheid of oversells.
Een vaste cadans werkt het best: wekelijks de afkeuringen en lege verplichte velden nalopen, maandelijks de consistentie van kleuren, maten en categorieën controleren, en bij elke nieuwe productlijn de randgevallen checken. Datakwaliteit is geen eenmalige opschoonactie maar een doorlopende bewaking die met je catalogus meegroeit.
Groepeer een veld op zijn unieke waarden en kijk naar de uitschieters. Zie je naast blauw ook navy, donkerblauw en BLAUW staan, dan heb je een consistentieprobleem dat de vindbaarheid schaadt. Een mapping naar een vast vocabulaire lost dat in één keer op, en een controle op nieuwe, onbekende waarden houdt het schoon.
Verder in de kennisbank: De architectuur van een datafeed: de complete gids · Een monitoringsysteem voor je feeds bouwen: de complete gids · Feed-management: de complete gids