woensdag 26 januari 2011

PubMed straft kennis van MeSH terms af!

Voor de Automatic Term Mapping van PubMed is het in je nadeel wanneer je weet hoe de MeSH term luidt. Geef je niet de echte MeSH term in maar een synoniem, wordt namelijk automatisch gezocht op dat synoniem als vrije tekst, de MeSH term als MeSH en de MeSH term als vrije tekst. Je krijgt dan meer resultaten.

Erythrocytes"erythrocytes"[MeSH Terms] OR "erythrocytes"[All Fields] OR "erythrocyte count"[MeSH Terms] OR ("erythrocyte"[All Fields] AND "count"[All Fields]) OR "erythrocyte count"[All Fields]176779
Red Blood Cells"erythrocytes"[MeSH Terms] OR "erythrocytes"[All Fields] OR ("red"[All Fields] AND "blood"[All Fields] AND "cells"[All Fields]) OR "red blood cells"[All Fields] OR "erythrocyte count"[MeSH Terms] OR ("erythrocyte"[All Fields] AND "count"[All Fields]) OR "erythrocyte count"[All Fields] OR ("red"[All Fields] AND "blood"[All Fields] AND "cells"[All Fields])200052

Dus maak je gebruik van Autmatic Term Mapping kies dan niet voor de MeSH benaming van je term, maar kies juist voor het belangrijkste synoniem.

Toch... geen van de zoekopties met ATM vindt wat je vindt wanneer je zoekt met veldnamen op:

red blood cell*[tw] OR erythrocyt*[tw] OR erythrocytes[MeSH] (224684)

2 opmerkingen:

Bianca zei

Als je al weet wat de relevante MeSH-term is (of dat opgezocht hebt in de MeSH Database) heeft het gebruik van ATM inderdaad geen toegevoegde waarde meer.

Ik ben het echter niet helemaal eens met je eens dat je dan beter op een synoniem kunt zoeken en ATM alsnog zijn werk moet laten doen...

groeten, Bianca
In dit voorbeeld neemt ATM bijvoorbeeld ook ongevraagd de MeSH-term 'erythrocyte count' mee - wil je dat wel?

Je bent m.i. het beste af met de aanpak die je zelf ook al noemt in je laatste voorbeeld: tekstwoorden (met veldcode tw of tiab) combineren met de relevante MeSH-termen. ATM heb je dan helemaal niet meer nodig, des te beter zou ik zeggen...

Wichor Bramer zei

Inderdaad Bianca. dat ben ik met je eens, maar het ging in dit geval niet om mijzelf, maar om mijn klanten die vooral ongemerkt gebruikmaken van de ATM omdat ze geen veldcodes toevoegen omdat ze die niet kennen.

inderdaad is het de vraag of erythrocyte count wel mee moet worden genomen, maar die wordt ook met mijn laatste samengestelde zoekvraag gevonden omdat gezocht wordt op erythrocyte*[tw]. Toch wil je die term niet achterwege laten omdat je anders weer relevante recente resultaten mist (NOT erythrocyte count[mesh] is niet aan te bevelen, het gebruik van NOT in een zoekstring sowieso niet).