SKS:n pääsivulle
tietopalvelu
takaisin etusivulle

 

 

Digitoitu arkistoaineisto kulttuurin tutkimuksessa -projekti

Suomalaisen Kirjallisuuden Seura, Kotimaisten kielten tutkimuskeskus, Kalevala-instituutti sekä Turun yliopiston kulttuurien tutkimuksen laitoksen uskontotieteen osasto aloittivat vuonna 2001 vanhojen käsikirjoitusaineistojen digitoinnin humanistisen tutkimuksen tarpeisiin. Projekti jatkuu vuoteen 2004, ja se on Suomen Akatemian rahoittama. Hankkeen johtaja on Kotimaisten kielten tutkimuskeskuksen johtaja professori Pirkko Nuolijärvi.

Projektin aikana digitoidaan SKS:n Lönnrotiana-kokoelmasta noin 20 000 sivua. Käsikirjoitusaineisto sisältää Elias Lönnrotin Kalevalan ja Kantelettaren käsikirjoituksia, Lönnrotin keräämää tai hänen hallussaan ollutta kalevalamittaista lyriikkaa, epiikkaa ja loitsurunoutta, satuja, arvoituksia ja sananparsia sekä matkakertomuksia ja kirjeenvaihtoa.

Digitoinnin jälkeen aineisto valmistellaan tutkimuskäyttöön samalla arvioiden ja kehittäen jo olemassa olevia hakumenetelmiä ja tietokantaratkaisuja.

Alkuperäiset käsikirjoitukset digitoidaan kuvamuotoon kirjahissiin yhdistetyllä tasoskannerilla. Laitteisto mahdollistaa sidoksien nopean, laadukkaan ja turvallisen skannauksen. Käytännössä digitaalisen aineiston merkkimuotoisuus mahdollistaa tekstien systemaattisen rakenteistamisen tietokantaa varten XML-muodossa (eXtended Mark-up Language). Hankkeen eri työvaiheiden kuvaus ja analysointi tuottaa tietoa, jota voidaan myöhemmin hyödyntää eri aineistotyyppien ja tieteenalojen digitointihankkeissa.

Suomalaisen Kirjallisuuden Seuran kansanrunousarkistossa vuosikymmenien aikana puhtaaksi konekirjoitetut SKVR-tekstit on digitoitu ja tallennettu merkkimuotoon jo ennen Digitoitu arkistoaineisto kulttuurin tutkimuksessa -projektin alkamista (OCR eli Optical Character Recognition). Kotimaisten kielten tutkimuskeskuksessa tekstien strukturointia ja tietokantaratkaisuja kehitetään sekä Lönnrotianan että 1900-luvun alun tekstikokoelman osalta.

Hankkeeseen liittyvissä osatutkimuksissa tullaan analysoimaan digitaalisten aineistojen käyttömahdollisuuksia humanistisessa tutkimuksessa. Tutkimusaiheita ovat mm. suomalainen mytologia ja Lönnrotin työ Kalevalan kokoajana.

Digitoitu arkistoaineisto kulttuurin tutkimuksessa -projektin yleistavoitteena on laadullisesti korkeatasoisten mutta samalla taloudellisesti mielekkäiden ratkaisujen löytäminen seuraaviin digitaalisia tietovarantoja koskeviin osa-alueisiin:

  • aineiston muuttaminen digitaaliseen muotoon (skannaaminen, OCR)
  • aineiston säilyvyys (tallennusmuodot ja -välineet)
  • aineiston hallittavuus (hakujärjestelmät, tietokannat, XML-tiedostot)
  • aineiston sovellettavuus (julkaisut, tutkimukset)
  • aineiston saatavuus ja käytettävyys (etäkäyttö, käyttökopiot)

Hankkeen tuloksena suomalaisen kulttuuriperinnön kannalta merkittävien aineistojen saatavuus ja käytettävyys paranee. Merkkimuotoon digitoitavien tekstien rakenteistaminen mahdollistaa

  • monipuoliset hakuominaisuudet laajoista aineistokokonaisuuksista
  • merkkimuodossa olevien aineistojen pitkäaikaissäilytyksen
  • aineiston siirtämisen käyttöympäristöstä toiseen sekä
  • tarvittaessa uusien dokumenttien ja julkaisujen luomisen.

Pitkällä aikavälillä tarkasteltuna yhtä oikeaa tapaa digitoida tai käyttää digitoituja aineistoja ei ole olemassa. Tähän vaikuttaa teknologian nopea ja ennustamaton kehitys sekä toisaalta tutkijoiden muuttuvat tiedonintressit. Nykytutkimuksen keskeisenä haasteena onkin digitaalisten tietovarantojen säilyvyys ja käytettävyys tuleville sukupolville.

yhteystiedot
www.finlit.fi
www.kotus.fi
www.kalevalainstituutti.fi
www.utu.fi/hum/
uskontotiede


 

 

Elias Lönnrot, Kantele.
SKS KRA, Lönnrotiana

nimiölehti (224 kt)
esipuhe, s. 1 (319 kt)
esipuhe, s. 2 (342 kt)
esipuhe, s. 3 (337 kt)