Zoeken achter de schermen

Ja, met Google vind je maar een beperkt deel van alle online informatie. Toch is Google een zoekmachine met fantastische mogelijkheden. Ook om informatie te vinden die anderen liever niet op straat zouden zien liggen.

Ze hebben me al verschillende verhalen opgeleverd: open directories. Dat zijn mappen op website-servers die rechtstreeks, en dus buiten de website om, door te neuzen zijn. In de meeste gevallen zijn die directory listings afgeschermd en krijg je een foutmelding als je met een url probeert te spelen. Maar er zijn manieren om linea recta uit te komen bij server-mappen die, bewust of per ongeluk, wel wagenwijd openstaan. Je weet nooit wat je tegenkomt. Maar uiteraard kun je Google’s radar sturen.

Om te beginnen: waaraan herken je zo’n open directory?

In veel gevallen staat er ‘Index of/’ bovenaan, gevolgd door de naam van de map. Eronder staat de lijst met submappen en bestanden.

Een voorbeeld van een open directory

De eerste stap is Google te laten zoeken naar pagina’s waarin die combinatie voorkomt. Dat kan op verschillende manieren. Gewoon ‘Index of/’ in de zoekbalk tikken, of door te zoeken naar pagina’s waarin ‘Index of/’ in de titel voorkomt. Dat laatste doe je met de operator intitle, zoals je ziet in deze zoekopdracht:

intitle:”index of/”

Hoe je nu verder gaat, is aan jou. Je kunt alle kanten op. In de eerste plaats: je kunt via de gevonden server-map bladeren naar onder- of bovenliggende mappen. Klik op een submap of op Parent Directory. Op die manier vind je zaken die je niet zocht, of die door je zeef zijn geglipt. In elk geval is het soms verrassend wat je op die manier kunt tegenkomen.

Je kunt je zoekopdracht eindeloos verfijnen tot je niet meer met een sleepnet vist, maar met een schepnetje.

Wil je alleen treffers met een Nederlandse domeinnaam? Dan breid je je zoekopdracht uit met site:nl:

“index of” site:nl

Wil je zoeken naar bestanden op basis van een trefwoord? Het hangt er maar helemaal vanaf wat voor soort informatie je belangstelling heeft: begroting, jaarrekening, notulen, offerte

“index of” site:nl notulen

Wil je zoeken naar bestanden met een specifiek formaat? Breid dan je zoekopdracht uit met de operator filetype: Bijvoorbeeld

“index of” site:nl filetype:pdf

Of

“index of” site:nl filetype:xls

Bedenk bij pdf’s dat een deel van de pdf-documenten scans zijn van papieren documenten. En bedenk dat scan-software vaak standaard namen geeft aan zo’n ingescand document, zoals, nou vooruit, scan of scantopdf. En bedenk dat die namen niet altijd handmatig worden gewijzigd als iemand ze op een webserver zet. Je zoekt bestandsnamen op basis van een educated guess.

Wil je zoeken naar open directories binnen specifieke websites, zoals een politieke partij?

Handig is de operator inurl. Daarmee filter je de treffers af op basis van een term die in de url voorkomt. Politieke partijen hebben vaak hun partij-afkorting in de url staan.

intitle:”index of/” inurl:VVD

Het is een omgekeerde zoekmethode: je gaat niet op zoek naar informatie bij een onderwerp, maar je zoekt naar een mogelijk onderwerp voor een verhaal.

Tekst: Arno Kersten

Laat wat van je horen

*