DeepPeep piept en kraakt

Ineens dook het weer op: het diepe web. De Volkskrant van 26 februari publiceerde een vertaald artikel van Alex Wright uit de New York Times over dit fenomeen onder de titel "Een zee aan onontdekte informatie". Dat deed me direct denken aan een plaatje dat we altijd gebruikten om het diepe web te illustreren. Het bestaat nog steeds en wordt steeds dieper, tenminste als ik de getallen van Wikipedia over dit onderwerp bekijk. Niemand weet het precies, maar als we Wikipedia geloven (tja?) dan is minder dan 1% van de inhoud van het web vindbaar met gewone zoekmachines. Mevrouw Juliana Freire ontwikkelt een zoekmachine om het diepe web te kunnen doorzoeken. Die heeft de mooie naam DeepPeep gekregen. Ik heb daar eens wat rondgesnuffeld. Het is nog helemaal niet klaar, en ik ben benieuwd of het Juliana ooit gaat lukken. DeepPeep claimt in databases te kunnen zoeken, bijvoorbeeld naar prijzen van vliegreizen of vluchtschema’s van luchtvaartmaatschappijen. Dat heb ik uitgeprobeerd met mijn eigen vakantieplannen als zoekopdracht. Ik wil met het vliegtuig van Amsterdam naar Liverpool. DeepPeep vond 22 sites, waarvan enkele sites waarop je goedkope vluchten kunt vinden. Maar daarnaast kwamen er ook een flink aantal sites voor hotelboekeningen langs. En een paar sites waarop je alleen vanuit Ierland of Abudabi kunt vliegen. Helemaal goed gaat het dus nog niet; bovendien vind ik als hetzelfde zoek bij Google meer en relevantere sites van hetzelfde type internetreiswinkels.  Nu moet ik eerlijk zijn: DeepPeep heeft maar een klein aantal sites geinventariseerd, daar waar Google natuurlijk al jaren zijn crawlers over het web stuurt. Voorlopig moeten we databases en dergelijke nog maar met ouderwetse indexen als de Librarians index to the internet opsporen. Die blijft toch goede diensten bewijzen als we weer eens onze hersens laten kraken in de Krakerscompetitie.

Be Sociable, Share!

Leave a Reply