Woordenwolken

Een woordenwolk geeft het relatieve gebruik van woorden in een tekst aan. Woorden die vaker voorkomen in de tekst, worden groter weergegeven.

Figuur 15. Een Wordle woordenwolk van NRC Handelsblad 

Datajournalisten gebruiken woordenwolken om een simpel overzicht te geven van een lange tekst of verbanden te zoeken binnen bepaalde woordenwolken. Voor schrijvers is het daarnaast een ideale manier om je eigen tekst op overmatig woordgebruik (bijvoorbeeld op het woordje ‘toen’) te controleren. Daarnaast gebruiken veel mensen woordenwolken om zichzelf te introduceren.

Online vind je veel tools om woordenwolken te maken. Vooral Wordle wordt vaak gebruikt. Wordle genereert na de invoer een eerste woordwolk, die je verder naar wens kunt aanpassen. Ook kun je invloed uitoefenen op de woorden die in de word cloud zijn opgenomen. Wordle probeert de taal van de tekst te herkennen en verwijdert vervolgens automatisch de stopwoorden ‘de’, ‘het’ en ‘een’. Toch werkt dit niet helemaal perfect. Het is dus handig als je de wolk zelf nog nakijkt.

Zo voorkomt Wordle bijvoorbeeld niet dat afgeleide woorden, zoals stoel en stoeltje, apart worden opgenomen. Na het aanpassen van de woordenwolk kan een journalist de woordenwolk kopiëren of embedden in een site.

Een andere woordenwolkdienst, Tagxedo, kent wat extra trucjes ten opzichte van Wordle:
• het herkennen van afgeleide woorden en het opnemen van de meest gebruikte vorm in de word cloud (vooralsnog Engelstalig);
• de mogelijkheid tot het inladen van een bestand;
• het bepalen van de vorm van de word cloud (bijvoorbeeld een hartvorm, rechthoek, ster of op basis van een tekst of afbeelding die je ingeeft);
• het bepalen van de verhouding van de word cloud (3:2, 4:3, 16:9).

Figuur 16. Visualisatie van afscheidsspeech van Mark Rutte met behulp van ManyEyes

 

ManyEyes gaat nog een stukje verder dan Wordle en Tagxedo. Het presenteert niet alleen resultaten op basis van de frequentie van woorden, maar probeert ook een relatie te leggen tussen bepaalde woorden. Het werkt niet perfect, maar kan wel binnen enkele secondes een eerste indruk geven van de relaties binnen een tekst. De woordenboom van ManyEyes geeft bijvoorbeeld de verschillende contexten van een woord of meerdere woorden aan. De context wordt getoond door middel van een boomstructuur.

 

 

Laat wat van je horen

*