Misleidende grafieken: onuitroeibaar als onkruid

Een opmerkelijke grafiek was de afgelopen dagen weer voer voor discussie. Misleidende visualisaties, die de werkelijkheid vertroebelen of domweg vertekenen, zijn een onuitroeibaar kwaad. Waar gaat het vaak mis? Het Medialab zet een aantal voorbeelden op een rij.

Kritiek lijkt soms aan dovemansoren gericht, vertekenende grafieken duiken met enige regelmaat op. Er zijn boekenkasten volgeschreven over ‘misleading’ en ‘deceptive’ charts, talloze blogs belichten de valkuilen, zoals eerder dit jaar De Nieuwe Reporter. Op twitter trekt NU.nl-datajournalist Jerry Vermanen ten strijde tegen zwabberende datavisualisaties.

De Y-as

Voorbeeld NOS Journaal (bron: tweet @JerryVermanen)

Zijn voorbeeld uit het NOS Journaal van eind vorig jaar, is een mooie illustratie van een probleem bij veel misleidende grafieken: de Y-as begint niet bij nul. Subtiele fluctuaties lijken opeens grote stijgingen en dalingen als het onderste stuk van de Y-as wordt afgeknipt. Een tweede voorbeeld, verschenen op het blog Visualising Data, maakt dat duidelijk:

Voorbeeld VisualisingData

Het is een van de euvels waarvoor wetenschapsjournalist Hans van Maanen steeds waarschuwt in zijn workshops op de jaarlijkse VVOJ Conferentie Onderzoeksjournalistiek.

De X-as

Ook met de X-as gaat het wel eens mis. Niet zozeer in de visualisatie zelf, maar juist in wat je níet ziet. Als de weergegeven data in een grafiek een selectie vormt van álle data, dan ligt het gevaar van vertekening op de loer. Een periode van drie of vijf jaar kan een grote fluctuatie in waarden laten zien, of waarden die opmerkelijk hoog of laag lijken. Maar als de grafiek zou uitzoomen naar een langere periode, dan komt die ontwikkeling in een breder perspectief te staan. Een vreemde uitschieter blijkt dan opeens onderdeel van een terugkerend patroon, of een vreemd patroon kan op zichzelf een eenmalige uitschieter zijn.

Selectief shoppen in data is een truc die door politieke spindoctors wordt gebruikt om het beleid van andere partijen in een kwaad daglicht te stellen. Zo werd er gretig gewinkeld in de werkloosheidscijfers tijdens de opeenvolgende Bush- en Obama-regeringen om een selectief beeld te presenteren.

Cirkels en bollen

Werken met cirkels en bollen om verhoudingen weer te geven, is vragen om problemen. In tegenstelling tot een staafdiagram geeft een cirkel geen goed beeld van verhoudingen, nog even los van de vraag of ze ook accuraat zijn getekend.

Voorbeeld op Quantum Forest

In het voorbeeld hiernaast, aangehaald op het blog Quantum Forest, is er een behoorlijk potje van gemaakt. Neem de Crime/Violence en Race relations-bol uit 2004. De rode cirkel vertegenwoordigt 28 procent, nog niet het vijfvoudige van het blauwe bolletje, dat er ogenschijnlijk wel tien keer in past.

Ook 3D-visualisaties lopen het gevaar van grote vertekening. Ze zien er fraai uit, maar ontnemen het zicht op de werkelijkheid. Een bekend voorbeeld is een grafiek uit de eerste weken van DeCorrespondent. In een video-interview met Medialab erkende Dimitri Tokmetzis dat sommige visualisaties in het begin niet goed uit de verf kwamen.

Esthetiek

Esthetische overwegingen spelen soms een grote rol bij de vormgeving van een visualisatie. Dat levert mooie plaatjes op, maar komt de ‘leesbaarheid’ van de grafiek niet altijd ten goede. Lezers die een visualisatie voorbij zien komen, gaan automatisch uit van bepaalde aannames, bijvoorbeeld dat waardes hoger op de Y-as oplopen.

IRAQ_verkleind

Voorbeeld van een omgekeerde Y-as

 

In bovenstaande grafiek van Simon Scarr over het aantal dodelijke slachtoffers in Irak  is de Y-as omgedraaid. Daarmee creëert hij een fraai effect: de roodgekleurde staven roepen het beeld op van druipend bloed, waarbij de grootste rode vlakken staan voor de meeste doden.

Een ander voorbeeld van een omgekeerde Y-as is de visualisatie waarover deze week werd gediscussieerd op VisualisingData. De data betreft het aantal doden door vuurwapens in Florida en de is geïnspireerd op de Irak-visualisatie.

Tweede voorbeeld van een omgekeerde Y-as

De uitvoering is anders, net als het effect. De grafiek schept vooral verwarring, doordat de met elkaar verbonden waarden voor het oog een simpele lijndiagram visualiseren. Het oog associeert juist het witte vlak onderin met een waarde, in plaats van het rode vlak erboven, en je leest de grafiek alsof de hogere punten op de lijn ook hogere waarden zijn. De data is tegenovergesteld. De maker erkent dat het misschien toch niet zo’n geslaagde visualisatie is.

Moedwil of misverstand

Er is een verschil tussen een misleidende grafiek en een ineffectieve, of slechte, grafiek. Maar in beide gevallen komt de data niet tot z’n recht. Ook als dat onbedoeld is, valt dat natuurlijk te betreuren.

Meer lezen?
A history of dishonest Fox charts
Webstatistieken: 10 aandachtspunten

Laat wat van je horen

*