Harvard kiest Aquabrowser

Vorige week in het nieuws: de bibliotheek van Harvard heeft gekozen voor de Aquabrowser. Dat is goed nieuws voor een Nederlands product, van Medialab uit West-Friesland. In Nederlands is de Aquabrowser vooral te vinden in Openbare Bibliotheken en goed te bekijken in www.bibiotheek.nl. Ik vind het een prachtige zoekmachine, die je op nieuwe sporen zet. Soms ook onzin (ruis in jargon), maar heel vaak leveren de associaties van de zoekmachine een creatieve impuls. Bij Bibliotheek.nl worden ook de krantenbank, muziekweb en Keesings Historisch Archief doozocht. Met de uitgevers daarvan zijn afspraken gemaakt, zodat de bestanden doorzocht kunnen worden. Hoe ze dat bij Harvard gaan doen weet ik niet. Het lijkt erop dat ze vooral de boekencollectie (maar liefst 16 miljoen titels) gaan ontsluiten. Als ze ook externe databases (de digitale bibliotheek) gaan meenemen in de Aquabrowser wordt het interessant. Het grote probleem van digitale bibliotheken zijn al die verschillende zoekinterfaces, waarmee klanten worden opgezadeld. Eén zoekinterface voor alles, dat zou prachtig zijn.

Overigens meen ik me te herinneren waar de naam van de Aquabrowser vandaan komt. Was het niet de website van de Waddenvereniging die als eerste met deze browser werkte? Nu is ie niet meer te vinden op die site. Kan iemand mijn geheugen weer opfrissen?

 

DeepPeep piept en kraakt

Ineens dook het weer op: het diepe web. De Volkskrant van 26 februari publiceerde een vertaald artikel van Alex Wright uit de New York Times over dit fenomeen onder de titel "Een zee aan onontdekte informatie". Dat deed me direct denken aan een plaatje dat we altijd gebruikten om het diepe web te illustreren. Het bestaat nog steeds en wordt steeds dieper, tenminste als ik de getallen van Wikipedia over dit onderwerp bekijk. Niemand weet het precies, maar als we Wikipedia geloven (tja?) dan is minder dan 1% van de inhoud van het web vindbaar met gewone zoekmachines. Mevrouw Juliana Freire ontwikkelt een zoekmachine om het diepe web te kunnen doorzoeken. Die heeft de mooie naam DeepPeep gekregen. Ik heb daar eens wat rondgesnuffeld. Het is nog helemaal niet klaar, en ik ben benieuwd of het Juliana ooit gaat lukken. DeepPeep claimt in databases te kunnen zoeken, bijvoorbeeld naar prijzen van vliegreizen of vluchtschema’s van luchtvaartmaatschappijen. Dat heb ik uitgeprobeerd met mijn eigen vakantieplannen als zoekopdracht. Ik wil met het vliegtuig van Amsterdam naar Liverpool. DeepPeep vond 22 sites, waarvan enkele sites waarop je goedkope vluchten kunt vinden. Maar daarnaast kwamen er ook een flink aantal sites voor hotelboekeningen langs. En een paar sites waarop je alleen vanuit Ierland of Abudabi kunt vliegen. Helemaal goed gaat het dus nog niet; bovendien vind ik als hetzelfde zoek bij Google meer en relevantere sites van hetzelfde type internetreiswinkels.  Nu moet ik eerlijk zijn: DeepPeep heeft maar een klein aantal sites geinventariseerd, daar waar Google natuurlijk al jaren zijn crawlers over het web stuurt. Voorlopig moeten we databases en dergelijke nog maar met ouderwetse indexen als de Librarians index to the internet opsporen. Die blijft toch goede diensten bewijzen als we weer eens onze hersens laten kraken in de Krakerscompetitie.