Archive for maaliskuu 2015

Viittausindeksejä keltanokille – tai miten sukellat pintaa syvemmälle sitaatioihin

8 maaliskuun, 2015

Julkaisufoorumiluokitus – eli meidän kesken jufo-vaan – on iskeytynyt viime aikoina humanistienkin tajuntaan. Yksi jos toinen jo puntaroi, missä ja kuinka paljon pitäisi (tieteellisesti) julkaista, jotta jufo-arvot saataisiin korkeuksiin ja tieteellinen elämä ihanasti hymyilisi. Muiden tieteenalojen edustajat saattavat naurahtaa humanistille ja todeta, että eihän tuo jufottelu ole vielä mitään. Naurahtelija voisi jatkaa ja kysäistä ohimennen, mikä on humanistipolon h-indeksi ja kuinkahan korkeaksi on noussut i10.

Tässä kirjoituksessa paljastan, että h-indeksi ei viittaa humanisti-indeksiin eikä i10 ole omenalaitteen uusi käyttöjärjestelmäversio. Teen myös omien tekstieni viittausluvuista pika-analyysin, joka on sovellettavissa h-luvuillaan hekumoivien tutkija-urarakettien saavutusten syyniin. Onko tutkijan laatu osoitettavissa parin klikkauksen päässä olevia lukuarvoja toisiin vertaamalla?

Mitä ovat h ja i10

Aloitetaan peruskäsitteistä. Nykytutkijan aivonjatke Wikipedia tietää kertoa, että h-indeksi on niinkin tuore kuin vuodelta 2005. Kehittäjänsä fyysikko Jorge Eduardo Hirsch mukaan indeksiä kutsutaan myös Hirschin luvuksi tai Hirschin indeksiksi. H-indeksi kuvaa sekä tutkijan tuotteliaisuutta että hänen julkaisujensa viittausten määrää. Indeksiluku on suurempi, jos paljon julkaisevalla tutkijalla on huippujulkaisuja, jotka keräävät suuren määrän viittauksia (ks. tarkemmat laskukaavat esim. Wikipediasta tai Hirschin tekstistä).

Suomenkielinen Wikipedia toteaa, että on ”tärkeää huomata, että h-indeksi on vertailukelpoinen vain saman alan sisällä ja silloinkin vain samaa aihepiiriä tutkivien tutkijoiden keskuudessa.” Minun nähdäkseni tämä yleensä unohtuu h-indeksihehkuttelussa. Esimerkiksi viime viikkoina olen törmännyt eri yhteyksissä jo kahdesti tilanteeseen, jossa indeksiuskoinen tutkija – jopa indeksifetisisteiksi voisi heitä nimittää – on uskonut lukuarvojen kertovan lähes yksiselitteisesti siitä, onko joku tutkija hyvä tai huono. Heidän mukaansa varsinkin tehtäväntäytöissä lukuarvojen tutkiskelu suunnilleen riittää asettamaan hakijat paremmuusjärjestykseen ilman, että itse julkaisuja tarvitsee edes lukea ja vertailla. Itse olen eri mieltä. On mentävä syvemmälle numeroiden taakse.

Englanninkielinen Wikipedia tarkentaa väitettä tieteenalakohtaisuudesta ja viittaa tutkimuksiin, joiden mukaan fyysikoiden h-indeksiluvut ovat korkeampia kuin esimerkiksi yhteiskuntatieteilijöiden. Humanisteista ei juuri edes puhuta tässä yhteydessä – luultavasti siksi, että humanistien julkaisukanavia ei edes niin kattavasti löydy viitetietokannoista. Pienillä tieteenaloilla erikoistunut yksin puurtava tutkija ei voi saada yhtä paljon viittauksia kuin suurta tutkimusalaa edustava tutkimusryhmän kanssa toimiva luonnontieteilijä. H-indeksiä kohtaan on esitetty monenlaista kritiikkiä, ja sille on ehdotettu kehitelmiä ja parannuksia.

Google Scholar laskee tutkijalle h-indeksin lisäksi myös i10-indeksin. Itse asiassa indeksi näyttää olevan Googlen esittelemä ja vieläkin uudempi kuin h-indeksi. Google esitteli I10-indeksin heinäkuussa 2011. Sen laskukaava on varsin yksinkertainen: lukuarvo paljastaa, kuinka moneen tutkijan tekstiin on viitattu vähintään kymmenen kertaa.

Indeksejä ja impaktilukuja eli vaikuttavuuskertoimia on paljon muitakin, mutta palaan niihin joskus toiste – jos jaksan. Seuraavaksi tarkastelen hieman omien julkaisujeni viittauksia. Arvaatteko esimerkiksi, kuka on viitannut minun julkaisuihini kaikkein eniten?

Luvuista viittaustietokantoihin

Scopus on tiedejulkaisijajätti Elsevierin omistama viitetietokanta, joka listaa 20 000 vertaisarvioidun julkaisun tietoja. Ihmistieteetkin (esim. yhteiskuntatieteet ja humanistiset tieteet), joten se kannattaa siksi mainita humanistiviitekehyksessä.

Yliopistolaiset pääsevät omien kirjastopalveluidensa kautta kiinni Scopukseen. Esimerkiksi Turun yliopiston sivuilta Scopus löytyy Nelli-portaalista aineistohaun kautta palvelun nimellä haettaessa. Minä löysin Scopuksesta kokonaista seitsemän julkaisua koko tuotannostani, jossa on aika lailla enemmän kaikenlaisia julkaisuja kuin nuo seitsemän. Scopukseen olivat tiensä löytäneet lähinnä jotkin tuoreet artikkelijulkaisut ja konferenssipaperit. Ainoastaan yhteen niistä Scopus löysi viittauksia muista teksteistä. Scopuksen hyvänä ja huonona puolena onkin pidetty valikoivuutta ja sitä, että se ei tunnista vanhempia julkaisuja. Scopus-uskoinen ihminen voisikin todeta: ”Säälittävää, Suominen, säälittävää. Tieteellinen toimintasi on hölynpölyä ja kohdistunut ihan vääriin asioihin.” Minun on pakko väittää vastaan ja todeta, että Scopus ei ole luotettavin instrumentti minun – eikä monen muunkaan ihmistieteilijän – tieteellistä toimintaa ja tasoa arvioitaessa.

Google Scholarin kanssa tilanne näyttää – minun kannaltani – vähän paremmalta, mutta siellähän nyt listataan sitä sun tätä. Niin ainakin palvelun kriitikot toistelevat. Käsittelen seuraavassa tarkemmin Google Scholarista löytyvien tekstieni viittauksia. Viittausmäärät näyttävät ensi vilkaisulla suomeksi paljon julkaisseelle humanistille varsin kohtuullisilta. Google Scholar kertoo h-indeksikseni 8 ja i10-indeksiksi 7. Kaiken kaikkiaan julkaisuihini on viitattu 263 kertaa ja vuodesta 2010 lähtien 191 kertaa. Listalla korkeimmalla komeilee 39 viittauksella Vastapainon 2003 julkaisema väitöskirjani Koneen kokemus. Väitän, että siihen on viitattu itse asiassa paljon useammin kuin mitä Google esittää. Viitelistauksesta puutuvat monet sellaiset teokset, jotka Koneen kokemuksen tavoin ovat ilmestyneet suomeksi ja vain painettuina. Olen nähnyt sellaisia. Sama Googlen viitetietojen puutteellisuus koskee myös muita minun ja muiden tutkijoiden paperijulkaisuja.

Mutta kukas on viitannut eniten julkaisuihini? Hetkonen, se on joku J. Suominen – joka siis itse itseään tekstistä toiseen siteeraa. Muita tyypillisiä viittaajia on esimerkiksi J. Suomisen kollega, samantyyppisiä aiheita tutkiva P. Saarikoski, johon Suominenkin ajoittain viittaa. Viittaamalla itseensä Suominen toimii kuin muutkin tutkijat, jotka perustavat uudet tutkimuksensa aiemmille tekemisilleen. Kyse ei siis useinkaan ole tietoisesta sitaatiolukujen pumppauksesta – ellei tutkijalla ole pakkomielle omista sitaatioluvuistaan. Verkko kertoo tapauksista, joilla esimerkiksi Googlen sitaatiolukuja voi väärentää jopa roboteilla, jotka generoivat automaattisesti sopivia viitteitä sisältäviä tekstejä.

Edellisen perusteella väitän, että tutkijalla itsellään on keskeinen merkitys siinä, miten hän rakentaa omaa tieteellistä uraansa ja mitä hän esimerkiksi määrittää avainteksteikseen. Rakentaminen ei tässä tarkoita siis pelkkää tietoista julkisuuskuvan muokkausta vaan tutkijan omaelämäkerrallista ymmärrystä omasta toiminnastaan ja sen muutoksista käännekohtineen ja merkkipaaluineen. Väitöskirja on siitä hyvä avainteksti, että sillä on symboliarvoa tieteellisen uran käännekohtana ja määrittäjänä. Symboliarvo on kenties laskenut ja vaihtelee tieteenalasta riippuen, mutta urallaan etenevä tutkija varmasti useimmiten kokee oman väitöskirjansa tärkeäksi tieteelliseksi kontribuutioksi ja myös siitä syystä viittaa siihen. Avaintekstejä ei tietenkään pelkästään määritä tutkija itse vaan myös toiset tutkijat sekä kolmantena tapauksena tutkija ja muut tutkijat vuorovaikutusprosesseissa.

Omien ja kollegaviittausten lisäksi teksteissäni on omien opiskelijoiden tekemiä viittauksia jonkin verran. Olettaisin että suurissa hankejulkaisujaan tuottavissa ja prosessia osiin paloittelevissa tutkimusryhmissä ristiviittaaminen vielä korostuu. Ulkopuolinen ei aina näe, ketkä kuuluvat samaan tutkimusryhmään, mutta se selviää joko kysymällä tai esimerkiksi henkilöitä googlaamalla tai julkaisujen kirjoittajien instituutiotietoja tarkastelemalla. Tutkimusryhmän tuotantoyksiköissä tapahtuva julkaiseminen selittää osaltaan sitä, miksi vaikkapa teknisissä tieteissä, luonnontieteissä ja lääketieteissä tehdään enemmän julkaisuja ja niihin myös viitataan enemmän.

Syvemmälle sitaatioihin

Viime vuosina olen julkaissut kollegoideni Petri Saarikosken, Riikka Turtiaisen ja Sari Östmanin kanssa kaksi laajaa teosta internetin ja sosiaalisen median kulttuurihistoriasta erityisesti suomalaisesta näkökulmasta. Myös näihin teoksiin Google Scholar löytää paljon viittauksia, toistaiseksi vähemmän tuoreempaan julkaisuun kuin vanhempaan. Myös niiden viittaukset sisältävät omia ja kollegaviittauksia sekä oppilasviittauksia. Niiden lisäksi viittaukset eroavat hieman väitöskirjani viittauksista. Funetista Facebookiin (2009) ja Sosiaalisen median lyhyt historia (2013) ovat selkeämmin asemoituneet oppikirjoiksi, joihin ovat viitanneet ainakin Google Scholarin tietojen mukaan graduntekijät ja vielä enemmän ammattikorkeakoulujen lopputöiden tekijät. Ammattikorkeakouluopiskelijoiden aktiivisuutta selittää omalta osaltaan se, että heidän lopputyönsä löytyvät verkosta kattavasti yhdestä paikasta, Theseus-palvelusta. Kaikki gradut eivät edelleenkään ole verkossa eivätkä verkossa ollessaan samassa paikassa.

On aika luonnollista, että suomenkielisiin julkaisuihini viittaavat toiset suomalaiset. Mutta entä mikä on tilanne tapauksissa, joissa olen kirjoittanut englanniksi? Otan kolme esimerkkiä lähempään tarkasteluun. Varhainen (?) retropeliartikkelini ”The past as the future? Nostalgia and retrogaming in digital culture” (2008) on kerännyt yhteensä 37 viittausta. Veikkaisin, että se ohittaa pian väitöskirjani viitatuimpana julkaisunani Google Scholarissa. Viittauksista omia ja yhteisjulkaisujani on 7, läheisten kollegoiden ja oppilaiden viittauksia 5 ja muita viittauksia 25. Muiden viittaajien joukossa on useampia tutkijoita, joita olen sittemmin tavannut ja joiden kanssa olen alkanut tehdä yhteistyötä, koska tutkimusintressit ovat lähellä toisiaan (8 viittausta). Yksi syy yhteistyölle on ollut nimenomaan se, että olen havainnut intressien yhtäläisyyden nimenomaan viittauksen ansiosta. Valtaosa viittaajista on muita kuin suomalaisia.

Mutta on joukossa myös useampia tutkijoita, joita en tunne, ja itse asiassa tämän artikkelin tapauksessa heitä on noin puolet kaikista viittauksista. Siitäkin syystä ”The past as the future?” on muodostumassa ulkoa määritellyksi avaintekstiksini. Kirjoittamishetkellä en ajatellut tekstiä yhtään sen kummallisempana kuin muita tekemiäni tutkimuksia tai julkaisuja. Retropelaamista koskeva teksti on ollut vain yksi sivupolku kaikessa tutkimuksessani, mutta tuo polku on vahvistunut muualta tulleen kiinnostuksen takia. Kaiken kaikkiaan olen menetellyt toisin kuin mitä monelle tutkijalle tänä päivänä toitotetaan. En ole selkeästi keskittynyt yhteen suppeaan tutkimussuuntaan vaan teen jatkuvasti monenlaisia asioita.

”The past as the future?” on saanut viittauksia, koska retropelaamista koskeva huomio on lisääntynyt ja koska tekstiin on voinut viitata myös muun populaarikulttuurin, teknologian ja nostalgian tutkimuksen yhteydessä. Teksti on julkaistu Fibreculture-nimisessä lehdessä, joka on saanut jufo-luokan 1, eli on luokituksen kannalta vain perustason julkaisu.

Toinen enemmän viitattu teksti on yhdessä Jussi Parikan kanssa kirjoittamani ”Victorian Snakes?” (2006), joka käsittelee mobiilipelaamista media-arkeologisesta näkökulmasta. Se on edellä mainitun retropeliartikkelin tapaan julkaistu vapaasti luettavassa open access -julkaisussa, mutta sen jufo-luokka on korkeampi eli kaksi. Omia tai kanssakirjoittajani Jussi Parikan tekemiä viittauksista on 5, läheisten kollegoideni viittauksia 2. Kanssakirjoittajani kollegoita en tunnista viittaajista, mutta osa viittaajista on minulle niminä tuttuja, vaikka en tunne heitä lähemmin. Myös tämän julkaisun arvo on siis pitkälti määrittynyt oman läheisen kollegaverkostoni ulkopuolella.

Kolmanneksi esimerkiksi nostan minun ja Jussi Parikan kanssa tekemän artikkelin ”Sublimated attractions” (2010), joka käsittelee varhaisen tietokonejulkisuuden aistimellisuutta Suomessa. Englanninkielisistä artikkeleista se perustuu eniten väitöskirjaani ja on julkaistu johtavassa mediahistorian alan julkaisussa Media History, joka ei ole vapaasti verkossa saatavissa vaan maksumuurin takana. Sen jufo-luokka on 2. Lieneekö syynä artikkelin sisältö vai julkaisumuoto, mutta artikkeliin on viitattu ainoastaan 5 kertaa – ja kaikki viittaukset ovat omiani. Aika heikkoa siis siihen nähden, että siinä on väitöskirjani keskeisiä tuloksia nykyisellä kansainvälisellä tieteen kielellä esitettynä.

Tutkija (viittausten) verkostoissa

Tämän blogitekstin tavoite on ollut osoittaa, että viittausindeksilukuihin ei voi tuijottaa pelkkinä lukuina. On mentävä lukujen taakse ja tutkittava, miten viittaukset ovat muodostuneet. On pohdittava, miten viittausindeksi ylipäätään sopii tarkasteltavan tutkijan ja tieteenalan tapauksessa. Löytyvätkö esimerkiksi kaikki viittaukset käsiteltävistä viitetietokannoista tai voiko sitaatioita ylipäätään käyttää vaikkapa tutkija tason määrittämisessä? Viittaukset eivät kerro pelkästään tutkimuksen sisällöllisestä laadusta vaan siitä, miten tutkija on onnistunut rakentamaan sosiaalisia verkostojaan ja millaisia merkkipaaluja ja käännekohtia hän on itse määrittänyt uralleen.

Tiivistän lopuksi vielä, miten voit analysoida omasi tai jonkun toisen viittaukset. Menetelmä ei ole ihan pikainen, varsinkin jos tutkijan teksteihin on paljon viittauksia, mutta pika-analyysin voi tehdä myös nopeammin ja karkeammin:

  1. Katso esimerkiksi Google Scholarista lista analysoitavan tutkijan teksteistä tai keskity niistä johonkin suppeampaan joukkoon (satunnaisotanta, rajaaminen tärkeämpiin, valikoima erilaisia tms.)
  2. Listaa valitsemistasi julkaisuista niihin kohdistuneet viittaukset ja kirjaa vaikkapa taulukkoon niiden tutkijoiden nimet, jotka ovat julkaisuihin viitanneet. Pidä samalla kirjaa, kuinka monta kertaa kyseinen henkilö on analysoitavan tutkijan tuotantoon viitannut.
  3. Selvitä, mikä on viittaavan henkilön suhde viitattuun. Jos kysymys on itsestäsi, sinun pitäisi hahmottaa suhde, mutta jos kyse on jostain toisesta, sinun on yritettävä päätellä yhteydet – tai sitten voit kysyä yhteyksistä suoraan analysoitavalta tutkijalta: käy läpi listaa ja kysy jokaisen listalla olevan osalta, tunteeko tutkittava viittauksen tekijän ja jos tuntee, niin mistä.
Advertisement