Google loves Aquabrowser?

Op enkele weblogs wordt geschreven over een nieuwe manier waarop Google zoekresultaten wil gaan tonen. Google test het nog uit, maar er zijn al wat kijkjes in de keuken gepubliceerd. Een van de uitprobeersels is het "wonderwheel", waarmee relaties tussen zoekresultaten worden getoond. In een blogposting op Google Blogoscoped wordt hierover geschreven. Het wiel doet verdraaid veel denken aan de manier waarop Aquabrowser haar zoekresultaten presenteert.

Harvard kiest Aquabrowser

Vorige week in het nieuws: de bibliotheek van Harvard heeft gekozen voor de Aquabrowser. Dat is goed nieuws voor een Nederlands product, van Medialab uit West-Friesland. In Nederlands is de Aquabrowser vooral te vinden in Openbare Bibliotheken en goed te bekijken in www.bibiotheek.nl. Ik vind het een prachtige zoekmachine, die je op nieuwe sporen zet. Soms ook onzin (ruis in jargon), maar heel vaak leveren de associaties van de zoekmachine een creatieve impuls. Bij Bibliotheek.nl worden ook de krantenbank, muziekweb en Keesings Historisch Archief doozocht. Met de uitgevers daarvan zijn afspraken gemaakt, zodat de bestanden doorzocht kunnen worden. Hoe ze dat bij Harvard gaan doen weet ik niet. Het lijkt erop dat ze vooral de boekencollectie (maar liefst 16 miljoen titels) gaan ontsluiten. Als ze ook externe databases (de digitale bibliotheek) gaan meenemen in de Aquabrowser wordt het interessant. Het grote probleem van digitale bibliotheken zijn al die verschillende zoekinterfaces, waarmee klanten worden opgezadeld. Eén zoekinterface voor alles, dat zou prachtig zijn.

Overigens meen ik me te herinneren waar de naam van de Aquabrowser vandaan komt. Was het niet de website van de Waddenvereniging die als eerste met deze browser werkte? Nu is ie niet meer te vinden op die site. Kan iemand mijn geheugen weer opfrissen?

 

DeepPeep piept en kraakt

Ineens dook het weer op: het diepe web. De Volkskrant van 26 februari publiceerde een vertaald artikel van Alex Wright uit de New York Times over dit fenomeen onder de titel "Een zee aan onontdekte informatie". Dat deed me direct denken aan een plaatje dat we altijd gebruikten om het diepe web te illustreren. Het bestaat nog steeds en wordt steeds dieper, tenminste als ik de getallen van Wikipedia over dit onderwerp bekijk. Niemand weet het precies, maar als we Wikipedia geloven (tja?) dan is minder dan 1% van de inhoud van het web vindbaar met gewone zoekmachines. Mevrouw Juliana Freire ontwikkelt een zoekmachine om het diepe web te kunnen doorzoeken. Die heeft de mooie naam DeepPeep gekregen. Ik heb daar eens wat rondgesnuffeld. Het is nog helemaal niet klaar, en ik ben benieuwd of het Juliana ooit gaat lukken. DeepPeep claimt in databases te kunnen zoeken, bijvoorbeeld naar prijzen van vliegreizen of vluchtschema’s van luchtvaartmaatschappijen. Dat heb ik uitgeprobeerd met mijn eigen vakantieplannen als zoekopdracht. Ik wil met het vliegtuig van Amsterdam naar Liverpool. DeepPeep vond 22 sites, waarvan enkele sites waarop je goedkope vluchten kunt vinden. Maar daarnaast kwamen er ook een flink aantal sites voor hotelboekeningen langs. En een paar sites waarop je alleen vanuit Ierland of Abudabi kunt vliegen. Helemaal goed gaat het dus nog niet; bovendien vind ik als hetzelfde zoek bij Google meer en relevantere sites van hetzelfde type internetreiswinkels.  Nu moet ik eerlijk zijn: DeepPeep heeft maar een klein aantal sites geinventariseerd, daar waar Google natuurlijk al jaren zijn crawlers over het web stuurt. Voorlopig moeten we databases en dergelijke nog maar met ouderwetse indexen als de Librarians index to the internet opsporen. Die blijft toch goede diensten bewijzen als we weer eens onze hersens laten kraken in de Krakerscompetitie.

And the winner is: Google Scholar!

Uit vergelijkend warenonderzoek naar de prestaties van Google Scholar en 11 bibliografische databases blijkt dat Scholar op veel belangrijke punten het beste scoort. Dat staat in het artikel Google Scholar Search Performance: comparative recall and precision, van William H.Walters (portal: Libraries and the Academy 9 (2009) 1, 5-24). Scholar werd aan een zorgvuldig uitgedachte test onderworpen en vergeleken met databases zoals Academic Search Elite, ArticleFirst, EconLit, Medline (PubMed), Social Science Citation Index (World of Science) en Socindex. Het onderwerp waarmee getest werd kwam uit het domein van de sociale wetenschappen. Het artikel is te ingewikkeld om hier eventjes samen te vatten, maar een belangrijke conclusie die we kunnen trekken is dat wij (bibliothecarissen) ons beeld van de superieure bibliografische databases moeten bijstellen. Scholar doet het op sommige punten beter. Zelfs het gemis aan een gecontroleerde vocabulaire (keywords, trefwoorden, thesauri) wordt weerlegd: waarschijnlijk levert de enorme database waarin Scholar (vaak fulltext) zoekt veel winst op ten opzichte van de meer gespecialiseerde en dus kleinere bestanden mét gecontroleerde vocabulaires. De recall (vangst, de mate van effectiviteit van de database om relevante treffers te vinden) is groot; Scholar staat daarmee in de top 4. Vaak is het zo dat bij een grote vangst de precisie gering is. Precisie betekent hier het aantal écht relevante publicaties, de ruis is eruit gefilterd. In totaal staat Scholar hier op plaats 8, maar kijken we naar de eerste 20 treffers dan schiet Scholar naar de 3e plek! Kortom: in elk geval voor sociale wetenschappers is Scholar een prima startpunt voor literatuursearches. Je kunt bovendien (in de preferences) instellen dat je een link naar de collectie (e-)journals van jouw bibliotheek wilt hebben. Op die manier zoek je met Scholar en heb je een grote kans om het fulltext in je bibliotheek aan te treffen.  

Lance zoekt fiets

De fiets van Lance Armstrong is gestolen. Het was zijn speciale tijdritfiets. Lance laat dit weten via zijn Twitter. Het is natuurlijk niet zomaar een fiets, maar een speciaal op maat gemaakt geval. Wat denkt Lance nu te bereiken met deze twitter? Dekt hij zich bij voorbaat in tegen een verloren tijdrit? Zal een follower zijn fiets gaan zoeken of zelfs het gejatte exemplaar inleveren?  Is het een nieuwe variant op opsporing verzocht?  Het haalde in ieder geval vanavond het Sportjournaal. Mocht u onderstaand exemplaar aantreffen gelieve http://twitter.com/lancearmstrong te laten weten waar de fiets zich bevindt. Wellicht wordt u bedacht met eeuwige roem in een twitter van heer Lance.

Aanvuling 19 februari: de fiets is terug! Zie de site van de NOS.  

Valse doden schudden aan Wikipedia

Vorige week werd in Wikipedia vermeld dat Teddy Kennedy en Robert Byrd waren overleden tijdens de inauguratie van Obama. Hetgeen niet juist was, ze waren slechts "onwel". Dit was kennelijk de druppel die de emmer deed overlopen bij de oprichter van Wikipedia, Jimmy Wales. Hij roept op om voortaan aanpassingen van nieuwe onbekende gebruikers door een redactie te laten toetsen. Dat is niet in goede aarde gevallen bij de Wikipedia-gemeenschap. Rondom Wikipedia zijn veel discussiefora actief en die stromen momenteel vol met commentaar op dit plan. Een voorbeeld van deze discussies is te vinden op het platform dat zich de dorpspomp noemt.

Toevallig (of juist niet) heeft de online encyclopedie Britannica juist besloten om lezers het recht te geven voorstellen te doen voor het wijzigen of toevoegen van informatie. Redacteuren moeten deze voorgestelde wijzigingen eerst goedkeuren voordat ze geplaatst kunnen worden.

Als beide voorstellen doorgaan nadert de concurrentie elkaar aardig. Toch nog eens kijken naar de VPRO uitzending van Tegenlicht waarin ze elkaar nog naar het virtuele leven stonden.

  

Verward in het Witte Huis

Gisteravond gekluisterd aan de buis vroeg ik me ineens af hoe het toch zou zijn met de diverse sites die in hun url beginnen met Whitehouse. Jaren geleden gebruikten we ze bij internetinstructies om duidelijk te maken dat het laatste deel van een URL informatie kan verschaffen over de achtergrond of maker van de site. We kliken op www.whitehouse.com en er verscheen een "adult"site; daar heeft Bill Clinton zelfs nog eens brief aan de eigenaar over geschreven:)  Deze site heeft een wonderlijke geschiedenis. In 2005 verdwenen de blote dames en heren en werd het een vastgoedsite en vervolgens een online telefoongids.  Inmiddels is het een soort verzamelsite van nieuws over het Witte Huis. Meer informatie over de eigenaar van het domein is te vinden via http://whois.domaintools.com/whitehouse.com. Daar worden we overigens niet veel wijzer van. Ook Wikipedia heeft de informatie over deze site niet compleet.

Als we genoeg bloot hadden gezien (en dat was heel snel) dan klikten we op www.Whitehouse.org en speelden het Ronald Reagan Memory Game. Nooit kunnen winnen. Whitehouse.org wordt onderhouden door Satire on-line, en dat is te merken ook.  Ik ben benieuwd wat er mee gaat gebeuren; Bush was natuulijk wel een erg gemakkelijk slachtoffer. (Op 24 januari blijkt deze site definitief gestopt te zijn).

De enige officiele site van het Witte Huis, www.whitehouse.gov is sinds gisteren geheel vernieuwd, met als meest opvallende verandering een weblog op de voorpagina. Dat alles onder het motto "Change has com to whitehouse.gov"

Liegend leren?

In Amerika is beroering ontstaan over een geschiedeniscursus, waarbij studenten een aantal web2.0 publicaties moesten schrijven over een fake-onderwerp, een historische hoax. Over het onderwerp: de laatste amerikaanse piraat (genaamd Edward Owens) werden een blog, een aantal Youtube filmpjes, en een Wikipedia-item gemaakt. De verschillende onderdelen waren zo goed gemaakt dat menig serieuze historicus erin trapte.

Leerdoel van deze cursus was onder meer dat studenten met een meer kritische blik naar (historische) informatie leren kijken. Dat is een belangrijk leerdoel, want nog altijd blijkt dat er weinig kritisch omgegaan wordt met informatie die o.a. via Google wordt verkregen (zie ook mijn vorige post). Toch is het de vraag of met deze werkwijze het beoogde doel is bereikt. De studenten hebben zich zeker geamuseerd bij het verzinnen van de informatie over de piraat. Ze hebben ook geleerd om te publiceren op web2.0. Maar zijn ze nu ook kritischer geworden in hun omgang met informatie? Hebben ze geleerd hoe ze het kaf van het koren kunnen scheiden? Waar ze op moeten letten bij het beoordelen van bronnen? Ik denk dat je beter studenten kunt confronteren met een aantal informatiebronnen, waaronder nepsites  en ze dan moet vragen om te beoordelen welke sites serieus te nemen informatie verschaffen. Maar leuk was het wel, met die neppiraat die zomaar geloofd werd. 

Voor wie een hele serie nepsites wil bekijken: bezoek het museum van de hoaxes! Niet alleen sites, maar allerhande berichten die het niet zo nauw nemen met de waarheid; uitermate amusant.

 

Leerlingen en leraren niet kritisch met Google

Soms is een nieuwbericht een bevestiging van iets dat je al lang wist. Gisteren had ik dat gevoel bij het zien van een RTL4-nieuwsitem over het promotie-onderzoek van onderwijskundige Amber Walraven. Op vrijdag 19 december as. verdedigt zij aan de Open Universiteit haar proefschrift Becoming a critical researcher. Effects of instruction to foster transfer. Het is goed dat voor dit onderwerp nu media-aandacht is, want zorgwekkend zijn de resultaten van het onderzoek zeker.

Leerlingen blijken na een Google-search vooral te selecteren op Nederlandse informatie, snelle antwoorden, leuke sites en sites met plaatjes. Soms beoordelen ze de betrouwbaarheid van informatie, maar dan uitsluitend op grond van de titel of de samenvatting. Er wordt heel wat lukraak geknipt en geplakt!

Volgens Walraven kunnen ook leraren niet goed met informatie omgaan. “Docenten vertonen precies hetzelfde gedrag wanneer zij iets opzoeken dat buiten hun vakgebied valt. Dan kunnen ook zij betrouwbare pagina’s niet goed onderscheiden van onbetrouwbare. Soms slaan ze bepaalde sites over omdat daar te veel plaatjes op staan”, aldus Walraven in BN/De Stem.

Er is ook hoop: de door Walraven ontwikkelde lesmethode blijkt effect te hebben; de scholieren zijn veel kritischer geworden. Wat ik mooi vind is dat de lessen niet door de bibliotheek en als speciaal vak gegeven worden, maar dat leraren ze integreren in hun lessen. Leerlingen moeten in werkstukken verantwoordling afleggen over de gebruikte sites, en ook aangeven op grond waarvan ze de sites hebben uitgekozen. Ik pleit hier al lang voor: informatievaardigheid moet in elke vezel van het onderwijs doordringen en niet een kunstje van de bibliotheek zijn. Het onderwerp zou verplicht in de curricula van lerarenopleidingen moeten worden opgenomen.Bij de vormgeving en uitvoering daarvan willen bibliotheken graag helpen!

RTL4 nieuwsuitzending kijk naar bericht: Scholieren checkten slecht

Persbericht Open Universiteit

Bericht NRC