vrijdag 16 juli 2010

ijland is een ijland

We hadden al eerder de contextgevoelige spellingchecker van Google Wave gezien (waarover je de laatste tijd overigens heel weinig meer hoort, een beetje te vroeg gepiekt). De daar gegeven demonstratie met icland is an icland kreeg de handen van het publiek op elkaar toen wave daar iceland is an island van wist te maken.

Deze toepassing is nu ook binnen google in gebruik, en niet alleen in het Engels. Wanneer je in google de zin 'ijland is een ijland' intikt, krijg je de suggestie: IJsland is een eiland.

'We had been soup' of 'It had bean soup' wordt echter nog niet verbeterd. Misschien ook omdat in de resultaten blijkbaar op zowel been als bean wordt gezocht.

woensdag 14 juli 2010

PubMed doet erg raar met truncatie

Hoe korter de getrunceerde woordstam hoe minder je vindt. Klinkt gek, dat kan niet, zul je denken. Toch werkt het bij PubMed vaak wel zo. Het is dus oppassen geblazen als je een zin trunceert.

Neem het volgende dat ik tegenkwam bij een recente zoekactie.

Ik wou een zoekactie naar child mental health[tw] (467 treffers), child mental disorders[tw] (7), child mental ilness[tw] (9) combineren. Dus ik zoek Child mental[tw]. Echter: geen resultaat!

Met child mental*[tw] worden 65.373 records gevonden. Blijkbaar wordt dit vertaald als child[tw] AND mental*[tw].

De enige juiste manier is child mental *[tw] dus met een spatie voor de asterisk, je vindt dan 485 records. Maar dit is wel heel erg vreemd.