zondag 7 juni 2009

h-index berekenen, dat kan makkelijker

Ik bedenk me een fout te maken bij het bepalen van een h-index bij ISI Web-of-Science. Wellicht doen jullie ook, we komen mogelijk te laag uit. WoS kan ons allicht helpen door het wat eenvoudiger te maken.

Hoe gaan we normaal te werk? Als een auteur bij ons komt voor zijn h-index doen we een vrij ruwe zoekactie op Web of Knowledge. Vervolgens schonen we de gevonden lijst met artikelen op door artikelen die niet door de betreffende auteur geschreven zijn te verwijderen. Op deze manier mis je geen artikelen waarin de voorletters van de auteur niet goed zijn opgenomen.

Het verwijderen bij Web of Knowledge gaat echter nogal lastig. Dit kan per pagina van 10 resultaten. Wanneer je op de eerste pagina 3 artikelen hebt verwijderd komen daar weer 3 nieuwe voor in de plaats, die je ook weer moet beoordelen. We beginnen daarom achteraan te werken, bij het artikel dat het rangnummer van de h-index draagt. Hier maken we de fout. Door een artikel uit de lijst te verwijderen neemt de h-index niet altijd af. Als het aantal artikelen dat overblijft gelijk is aan het aantal citaties van artikel h+1 blijft de h-index gelijk. Een artikel dat nog niet is beoordeeld wordt dan (mogelijk onterecht) meegenomen in de lijst.

Wat we moeten doen is de nieuwe lijst controleren door ook de artikelen die een aantal referenties hebben dat tussen de huidige h-index en de eerst berekende h-index ligt te beoordelen.

Web of Science zou veel voor ons kunnen doen door het controleren en verwijderen van de artikelen eenvoudiger te maken door:
  1. Het resultaatscherm kan pagina's tonen met meer dan 10 items. Wanneer er Bijvoorbeeld 100 artikelen op een pagina kunnen staan kan in de meeste gevallen de h-index op een pagina worden bepaald.
  2. Het vinkje voor een artikel om het te verwijderen wordt onthouden, ook wanneer de bezoeker naar een volgende pagina gaat, en wanneer uiteindelijk op 'go' wordt geklikt worden alle aangevinkte artikelen verwijderd. Liefst wordt de h-index herberekend bij ieder aangevinkt artikel, maar dat kost waarschijnlijk te veel server capaciteit.


Ander opvallende zaken bij het verwijderen:

Bovenaan de pagina staat een tekst die uitlegt hoe het werkt. Waarom die tekst alleen bovenaan staat is mij een raadsel, na het langslopen van de artikelen ben je onder aan de lijst beland. Je vind onderaan de resultaatlijst een knop [go] met exact dezelfde lay-out als de knop die je moet gebruiken, maar die herlaadt alleen maar de huidige pagina zonder de aanpassingen te verwerken.

De verklarende tekst luidt:
Use the checkboxes to remove individual items from this Citation Report or restrict to items processed between [1988] and [2009] [go].

Waar moet je klikken om individuele artikelen te verwijderen zonder de items op datum te beperken? Na bestudering van de resultaten blijkt dat de jaartallen die worden getoond standaard alle resultaten omvatten, maar dat is niet duidelijk.

Web-of-Science dat kan makkelijker. Ik zal ze eens dringend vragen of ze ons kunnen helpen.

Geen opmerkingen: