De basis

Added July 2013: Keynotes by Henk van Ess (English)

1. Driven by data. Showcase of current data journalism projects, categorised in a. invisible data journalism b. interactive statistics c. non-linear storytelling d. Data is the story e. Data Porn f. Revealing stories – 2 examples each

2. Data do’s and dont’s. Addresses how to do data journalism if you don’t have any structure yet? What kind of skills are needed? How do you organize it?

3. Truth as a moving target. SRF asked me: can you ruin your name with data journalism? In this 3th keynote I try to give an answer what’s worse than bad data journalism.

 

De zeven tips van Jennifer LaFleur

Jennifer LaFleur van Propublica en David Donald van The Center for Public Integrity geven hier hun datajournalistieke do’s en dont’s. @winnydejong noteerde deze zeven tips, gepubliceerd op Datajournalistiek.nl 

Leen tools voor data-analyse uit de sociale wetenschappen. In vakgebieden ondermeer de politicologie, economie en sociologie wordt al veel langer met statistiek en data-analyse gewerkt. Vaak kunnen wetenschappers je daar veel meer over vertellen. Maar let op, stay tuned: leen niet de taal van sociale wetenschappers. 😉

  1. Praat met experts

    Vraag wetenschappers bij kans de hemd van het lijf. En dan niet alleen over de methoden die zij gebruiken voor het analyseren van data. Vraag ze bijvoorbeeld wanneer ze jouw artikel geloofwaardig vinden. ‘Geloof je mijn verhaal als ik de data via stap x, y en z analyseer?’ Met een relatief kleine moeite helpen ze je zo aan een betrouwbare methode voor je analyse – die je vervolgens zelf kunt gaan toepassen.

  2. Analyse is belangrijk

    Natuurlijk wil je dat jouw datavisualisatie er mooi uitziet; maar eerst moet je data-analyse goed zijn. Liever iets lelijks dat klopt, dan mooie graphic die bol staat van de fouten. Of zoals David Donald zei:

    Go beyond the ‘this is really neat’-fase. 

  3. Kopieer je resultaten

    Voor je een verhaal op basis van data publiceert zal je de uitkomst moeten controleren; een foutje is zo gemaakt. En als je later terug moet komen op je resultaten omdat ze niet klopten, gelooft een volgende keer niemand je meer. David Donald zegt zijn analyses daarom altijd meerdere keren uit te voeren. Het resultaat van die analyses moet drie keer op een rij hetzelfde zijn; anders klopt er iets niet. En als er ook maar het vermoeden bestaat dat iets niet klopt, wordt het niet gepubliceerd.

  4. Eerst zeker weten, dan delen

    Als je ergens niet zeker van bent, zal je dat nog niet publiceren. (Toch?) Veel vaker gaan datajournalisten de fout in door hun vermoedens te delen met collega’s. Niet handig, want die collega’s rekenen op jouw kunde en nemen graag aan dat het waar is. Jennifer LaFleur:

    If you tell your colleagues that you think you found something, they will believe it’s true. 

    Pijnlijk als je later aan je collega’s moet toegeven dat je je hebt vergist.

  5. Taalgebruik: statistisch vs. journalistiek

    Let op je taal in combinatie met statistiek. Statistisch gezien hoeft een toename niet ‘significant’ te zijn, terwijl dat journalistiek gezien dan wel het geval is. Denk aan een toename van het aantal verkeersdoden in een kleine stad van 35 naar 40 per jaar. Statistisch gezien geen schokkende toename, maar het zijn wel 5 extra doden ten op zichte van het jaar daarvoor.

  6. Publiceer je methode

    Nee, je wilt je lezers niet lastig vallen met de precieze aanpak van je steekproef; de draaitabel die je gebruikte; of de datasets die je in Access combineerde. Verreweg het grootste deel van het publiek heeft alleen interesse in het journalistieke verhaal waar je data-analyse in resulteerde. Toch kan het nuttig zijn om je methode te beschrijven in bijvoorbeeld een whitepaper. Bijvoorbeeld voor de wetenschappers die je hebben geholpen; voor je eigen archief en dat van collega’s; of voor de paar nerds die het wel willen weten. Zo publiceerde Jennifer LaFleur een whitepaper – ‘How ProPublica Analyzed Pardon Data‘ – over haar werkwijze voor het verhaal ‘Presidential Pardons heavily in favor of whites‘.

  7. Gebruik je verstand

    Als iets te mooi klinkt om waar te zijn, dan is dat vaak ook zo. Misschien is er voor de uitspraak ‘in een gebied met meer ooievaars, krijgen vrouwen meer kinderen’ wel statistisch bewijs te vinden. Toch zegt je boerenverstand dat het toeval is; het verband door andere factoren veroorzaakt wordt; en/of dat het niet de juiste correlatie is. Er is een reden waarom je met je boerenverstand zo ver kunt komen.

     

    Datajournalistiek is journalistiek

    Hoe kom je in drie stappen aan een goed verhaal?

    Stap 1 – Kies een onderwerp – een systeem – en zoek uit hoe het hoort te werken. Lees er alles over en praat met experts.

    Stap 2 – Zoek uit hoe het in de praktijk werkt. Praat met experts, ervaringsdeskundigen en doe onderzoek.

    Stap 3 – Zoek de verschillen en vindt jouw verhaal. Dit geldt voor journalistiek, maar ook voor datajournalistiek

    Check alles, en check het nog een keer. Donald is voorstander van wat hij de Reagan-methode noemt; gebaseerd op een uitspraak van de oud-president:

    Trust the Russians, but verify everything”

     Garbage in, garbage out

    Een verhaal is zo goed als de data waarop het gebaseerd is.Begin met onbetrouwbare data, en je krijgt een onbetrouwbaar verhaal – garbage in, garbage out. Natuurlijk is dat geen reden om niet meer met data te werken. David Donald:

    “Sometimes it turns out that data isn’t to reliable. People than sometimes asks me why I still use data for journalism. I tell them: You still interview people. People lie all the time. So when are you gonna stop interview people?”

    Data: reductie van de realiteit

    Data alleen is niet voldoende voor een verhaal: één bron is geen bron. Bovendien geeft data alleen maar antwoord op de vragen wie?, wat?, waar?, wanneer? en hoe?; nooit op waarom?. David Donald:

    “And data is always a reduction of reality. It is not reality.”

    Samenwerken is belangrijk

    Na data-analyse begint de traditionele journalistieke werkzaamheden.Verhalen gebaseerd op data moeten nog steeds geschreven, gefilmd en gemonteerd worden. Dan kan het handig zijn om in een team te werken.