donderdag 18 november 2010

Verslag Masterclass Henk van Ess 'Het verborgen web' op #nvb10

Henk begint met een voorbeeld van hoe je out-of-the-box moet denken. Op een nieuwe iphone staat een foto die gemaakt lijkt in de fabriek. Waar staat deze fabriek. Uiteindelijk komen we er door in te zoomen op een bepaalde kabel op de foto. Daar staat een registratienummer, dit nummer in google inzoeken levert een chinees document op. De tekst die erbij staat in het chinees gekopieerd naar google en vervolgens vertalen.

Belangrijk is het na te denken welke bron het meest gezaghebbend is. Gebruik niet standaard de Nederlandse wikipedia, maar ga naar de lokale versie van het onderwerp.

Vb. een gedetailleerde kaart van de voormalige DDR
Zoek niet op deze tekst, zo wordt dat niet omschreven. Wat is een gedetailleerde kaart? Een grote afbeelding, gebruik dan een minimale imagesize. Wanneer bestond de DDR? Zet tussen die jaartallen 3 puntjes (ik dacht altijd dat twee puntjes volstond, want dat zegt google zelf ook, maar nee dus). Je kunt ook op delen van de kaart zoeken bijvoorbeeld de schaal.

Bedenk hoe iets in een document staat omschreven
"whiteboard markers contain"
of
"LSD was discovered in" (mijn eigen verbetering van deze zoekactie:"LSD was first * in 0...2010" want was het discovered of sybthesized of noemen ze het nog anders, en je forceert een jaartal achter de zin?)

Zoek je een omschrijving van iets wat je niet kent, gebruik dan is.
“ontwikkelingsperspectief is” “speciaal onderwijs”

Binnen een string kun je asterisks gebruiken. Die staan dan voor een woord. Je kunt meerdere asterisks gebruiken binnen een string, ook achter elkaar, maar plaats er dan een spatie tussen.

Zoek naar karakteristieke zinnen van een bepaald document. Zoek je een bedrijfsvisie, of missie of hoe ze dat ook maar mogen noemen van ING, zoek dan op

“ing wil een bedrijf zijn dat”

De wetgeving inzake kwaliteitszorg van schoolbesturen is gewijzigd. Welk woord staat er in elke wet? moet! dus:
“schoolbestuur moet” kwaliteitszorg

Zoek je naar een boek, zoek dan op het woord isbn.

Bij waarom vragen staat er in de tekst vaak ‘omdat’ of ‘doordat’.
“walvissen stranden omdat”

Waarom speelt het duitse elftal in zwart wit?
“Deutsche Mannschaft” “schwarz weiss weil”

Stappenplan:

  1. Stel geen vragen
  2. Voorspel het antwoord
  3. Check het antwoord
  4. Als je teveel krijgt slecteer dan de bron
  5. Kies een andere taal (engels of de taal van het gebied)
  6. Gebruik Translate.google.com

Page rank van google wordt bepaald door wordt er over je gepraat en door wie? Google heeft ongeveer 19% van het openbare web geïndexeerd. Alle zoekmachines samen vinden ongeveer 50%. Yahoo, bing en google proberen steeds meer van elkaar te onderscheiden. Gebruik ze naast elkaar als je meer wilt weten.

Google beinvloedt veel van de resultaten. Gebruik liefst www.google.com/ncr (no country region), de meest neutrale google versie. Google gaat namelijk steeds meer bepalen wat je bedoelt. Als je iets echt wilt gebruiken, maar google negeert het, zet er dan een + teken voor.

Soms krijg je een Error 404 melding omdat de pagina niet meer bestaat. Dan werkt de google cache soms nog, maar een andere oplossing is de wayback machine.

Vaak is er sprake van verborgen bronnen! Iets staat niet in de zoekmachine maar is wel op het web aanwezig. Eigenaar van websites mag een robot.txt plaatsen en zeggen dat bepaalde mappen niet doorzocht mogen worden, of bepaalde pagina's zijn dynamisch gegenereerd door middel van een formulier en kunnen niet worden gelezen door een zoekmachine. Dan moet je denken als een kind van 5 jaar.

Verborgen web: zoekmachines en databases waarvan google alleen de voordeur indexeert. Zoek dan de voordeur op met het woord 'zoek' of 'search' en een omschrijving wat je wilt vinden. Of zoek op belangrijke veldnamen (bijvoorbeeld "enter flight number").

Koester je bronnen, kennis etc, maar als je het niet meer weet voorspel een zin, en denk aan de vorm. Als dat mislukt, voorspel onderdelen van het antwoord. Gebruik anders andere zoekmachines, maar als dat niet lukt nog een kans van 50% om het toch te vinden door te zoeken naar de voordeur.

Geen opmerkingen: