Matka Fantastic Futures 2025 -konferenssiin Lontooseen 3.–5.12.2025

Teemu Hirvonen, Milla Eräsaari – Blogi – 23.3.2026

SKS:n tietojärjestelmäasiantuntija Teemu Hirvonen ja arkistotutkija Milla Eräsaari osallistuivat joulukuussa 2025 Lontoossa järjestettyyn Fantastic Futures 2025 -konferenssiin, joka on kirjastojen, arkistojen ja museoiden tekoälyyn keskittyvän ai4lam-yhteisön (Artificial Intelligence for Libraries, Archives & Museums) vuotuinen konferenssi. Tässä blogikirjoituksessa he avaavat kokemuksiaan ja ajatuksiaan matkasta.

Teemu Hirvonen:
Kertaan tässä lyhyesti matkaani Fantastic Futures 2025 -konferenssiin, jossa kävin kollegani, arkistotutkija Milla Eräsaaren kanssa. Mitä kaikkea siellä koin, näin ja kuulin sekä millaisia ajatuksia reissun jälkeen heräsi. Konferenssi oli eräänlainen kulttuurisektorin tilannepäivitys siihen, missä mennään generatiivisen tekoälyn kanssa: millaisia työkaluja missäkin on käytössä, mitä on testattu ja mitä aiotaan tehdä lähitulevaisuudessa.

Omat tuntemukseni olivat ennakkoon positiivisen jännittyneet: ensimmäinen kansainvälinen konferenssi paikan päällä ja posteriesittely tiedossa, paljon uusia alan ihmisiä tavattavana ja lukuisia mielenkiintoisia esityksiä kuultavana. Olin osallistunut aiemmin vastaavanlaisiin tapahtumiin vain etänä ja ilman omaa panosta konferenssin sisältöön. Etäosallistumisessa on puolensa, mutta siinä jää aina paitsi kahvitaukojen keskusteluista, verkostoitumisesta ja innostuneesta tunnelmasta, jota tässä konferenssissa riitti. Kiitos siitä Fantastic Futures 2025 -järjestäjille sekä ai4lam-yhteisölle!

Ensimmäisenä päivänä oli ohjelmassa kaksi työpajaa sekä opastettu kierros British Libraryn päärakennuksessa. Ensimmäisen työpajan aiheena oli, millä tavoin generatiivisen tekoälyn käyttöä kannattaa lähteä kouluttamaan – sivuhuomiona mainitsen tässä vaiheessa, että kun puhun tekstissäni tekoälystä, viittaan sillä ensisijaisesti generatiiviseen tekoälyyn. Päivän toinen työpaja keskittyi organisaation omien tekoälyprojektien käynnistämiseen. Työpajoista sai erinomaista oppia, sillä meillä SKS:ssa olemme vasta alkaneet pohtia isompien tekoälyprojektien käynnistämistä. Ensimmäisenä meillä on listalla tekoälylinjaukset, joista myös toisessa työpajassa puhuttiin: ne luovat pohjan kaikkeen organisaation tekoälyn käyttöön.

Ensimmäinen päivä, vaikka sekin oli tiedontäyteinen, tuntui suorastaan vetelehtimiseltä verrattuna toiseen päivään. Ensimmäisenä meille esiteltiin Oxfordin yliopiston kirjaston yhteistyötä OpenAI-yhtiön kanssa sekä Ranskan kulttuuriministeriön kehittämää compar.ia -sivustoa. Tauon jälkeen seurasi esitykset, joissa käsiteltiin tekstien louhintaa ja tekoälyn käyttöä arkistoaineiston arvonmäärityksessä. Jälkimmäinen herätti lukuisia ajatuksia, johon palaan myöhemmin. Sitten kuulimme mm. tekoälyavusteisesta kuvailusta, aineiston löydettävyyden parantamisesta sekä erilaisista tekoälyagenteista, joita oli rakennettu arkistojen ja kirjastojen tarpeisiin helpottamaan työntekijän arkea. Jälleen heräsi paljon ajatuksia, kuinka meille esitellyt työkalut voisivat pienellä viilauksella auttaa SKS:n arkistotutkijoita työssään tai asiakkaita löytämään aineistoja paremmin.

Kolmantena päivänä kierroksia nostettiin informaation jakamisessa. Aiheina oli mm. RAG-chatbotit arkistoissa ja kirjastoissa, AV-aineiston metadatan parantaminen koneellisesti, tekstien automaattinen tunnistus, museokokemusten parantaminen tekoälyllä, tekoälyn koulutus, visuaaliset kielimallit ja paljon muuta. Näin jälkeenpäinkin hengästyttää katsoa omia muistiinpanoja ja lukea, mitä kaikkea konferenssissa kuulin.

Itse olen tunnistanut lukuisia eri arkistotyöhön kuuluvia tehtäviä, joissa tekoälystä voisi olla apua ja lisää ideoita tuli konferenssissa. Meillä on paljon dataa aineistoista, joka ei ole järjestelmässä vaan digitaalisessa muodossa olevissa luetteloissa tai muissa hakemistoissa. Tämä tieto ei ole välttämättä asiakkaan näkökulmasta helposti käytettävissä. Mutta jos tieto olisi jonkinlaisen hakumoottorin piirissä, löydettävyys paranisi. Se, että tieto saataisiin tähän tilaan, vaatisi huomattavan määrän ihmistyötä, kliksuttelua ja näpsyttelyä. Tai vähän vähemmän ihmistyötä tekoälyavusteisesti, jossa kielimallille voisi syöttää aineiston ja pyytää esim. rakenteistamaan datan, jonka jälkeen voisimme ajaa tiedot järjestelmään ja hakujen piiriin. Ideaalitilanteessa tämä datan käsittely toimisi näin yksinkertaisesti, mutta… Suurin osa näistä luetteloista ja hakemistoista sisältää henkilötietoa, joten emme voi vain syöttää näitä esim. ChatGPT:lle ja pyytää sitä tekemään datalle asioita. Emme voi täysin varmistua siitä, etteivätkö henkilötiedot voisi valua EU/ETA-alueen ulkopuolelle ja ettei niitä käytettäisi muuhun, esim. profilointiin. Jos haluamme laajamittaisesti käsitellä henkilötietoja, tarvitsemme suljetussa ympäristössä toimivan kielimallin.

Tällaisia voisi toki rakentaa, mutta suljetun ympäristön malli vaatii toimiakseen laskentatehoa, etenkin jos haluaa laskettaa monimutkaisia tehtäviä tai kouluttaa kielimalleja ja parannella työkaluja. Suljetun ympäristön pyörittäminen vaatii myös osaamista ja ylläpitoa. Toki on olemassa palveluita, joissa lupaillaan henkilötietojen turvallista käsittelyä. Sellaisia tarjotaan monienkin tekoäly-yhtiöiden toimesta, mutta luottamus niiden datan käsittelyyn ei ole ainakaan allekirjoittaneen osalta kovin korkealla. Tietomurron tapahtuessa tällaiseen palveluun saattaisimme riskeerata luottamussuhteemme asiakkaisiin ja aineistonluovuttajiin: jos henkilötietoja vuotaisi julkisuuteen, kuka enää haluaisi luovuttaa aineistoa meille? Kysyin huvikseni ChatGPT:ltä, olisiko tällainen ostopalvelu luotettava. Sekin suositteli suljettua ympäristöä, mistä voinee vetää jonkinlaisia johtopäätöksiä…

Meillä on myös paljon kuvailematonta digitaalista aineistoa – valokuvia, videoita, ääntä ja tekstiä – joka vaatii ihmisen luetteloimaan ja kuvailemaan sen järjestelmään. Tästä näimme konferenssissa erilaisia esimerkkejä, joissa tekoäly kykeni avustamaan kuvailijaa louhimalla tietoa aineistosta ja käsittelemään dataa niin, että se tuli saavutettavaksi. Äänistä ja videoista on mahdollista tuottaa automaattisesti litteroinnit, joihin voi kohdistaa hakuja. Visuaalisten kielimallien avulla valokuvista voi tunnistaa erilaisia objekteja – jopa henkilöitä, jos kielimalli siihen koulutetaan. Isoista tekstimassoista, esim. käsikirjoituksista, tekoäly voi tuottaa tiivistyksiä sisällöstä. Mutta en haluaisi, että aineistoja ryhdyttäisiin arvottamaan tekoälyn avulla, ainakaan automaattisesti. Arkistotutkijan asiantuntemus on varmasti pitkään parempi kuin minkään kielimallin, vaikka sen kouluttaisi ymmärtämään meidän arvonmäärityksiä. Ihmisen on hyvä olla mukana toiminnassa.

Tekoälyllä on mahdollista tehdä monia hienoja, jopa maagiselta tuntuvia asioita, mutta… Jälleen löydämme edestämme henkilötietojen käytön dilemman, laskentatehon ja tietenkin resurssit. Kaikki käytetyt työkalut eivät tietenkään vaadi järjetöntä konesalia, mutta eivätpä sellaiset välttämättä tuota järin hyvää tulostakaan. Hyviä työkaluja, jotka pyörivät jopa tavallisella läppärillä, on olemassa. Meidän vain täytyy löytää ne. Niistä meille vinkattiin konferenssissa tulosten kera. Palasinkin Lontoosta ison työkalunimilistan kanssa. Ei muuta, kun testailemaan!

Meillä on arkistossa erittäin paljon dataa järjestelmässä, jonka käyttö vaatii hakumoottorin ymmärtämistä sekä erilaisten, monimutkaistenkin hakujen tekoa. Tätä ei välttämättä asiakas hallitse, emmekä me työntekijätkään välttämättä osaa tehdä ”täydellisiä” hakuja. Olisiko asiakkaalle apua chattibotista, joka käyttää järjestelmän koko tietokantaa kyselyihin vastatessaan? Tällaisia RAG-botteja, jotka käyttävät vastauksissaan jotain spesifiä tietovarantoa, esim. arkisto- tai kirjastotietokantaa, on useammassakin paikassa rakennettu. Lontoossa kuulimme testituloksia käytöstä ja itse olin ainakin vaikuttunut tuloksista. Näissäkin oli tietenkin omat miinansa. Vaikka chattibotti ammentaisi vastauksissaan tietoa vain tietystä tietokannasta, hallusinointi olisi edelleen mahdollista ja tämä olisi omiaan nakertamaan arkiston uskottavuutta. Tällainen ”tekoälykilke” aineiston etsimiseen olisi kiva, mutta sen pystyttäminen ja ylläpito voisi olla meidänkaltaiselle organisaatiolle liian suuri pala haukattavaksi. Toki järjestelmätoimittajamme voisi tällaista lähteä kehittämään, mutta kun emme ole heidän ainoita asiakkaita, heidän täytyisi investoida laskentatehoon paljon. Useiden käyttäjien pitäisi pystyä samanaikaisesti utelemaan botilta aineistojen saloista.

Napakkana yhteenvetona generatiivisen tekoälyn käyttö olisi tarpeen meillä arkistossa, todennäköisesti SKS:ssa laajemminkin. Mutta se ei ole taikuri, joka ratkaisee kaikki ongelmamme, vaan pikemmin ahkera apuri, joka ei ihan helpolla uuvu työtaakan alle. Jäädään kuulolle, millaista tulosta tulevat testailut tuottavat ja millaiset ohjenuorat laadimme meille SKS:aan tekoälyn käyttöön.

Kuva Delftin teknisen yliopiston pitämästä työpajasta.

Milla Eräsaari:
Joulukuun alussa British Libraryyn kokoontui laaja joukko kirjastojen, arkistojen ja museoiden asiantuntijoita jakamaan kokemuksiaan tekoälystä, kun vuosittainen Fantastic Futures -konferenssi järjestettiin 7. kerran.

Konferenssin teemana oli tekoäly kaikkialla ja kaikki kerralla. Kolmipäiväisessä konferenssissa jaettiin kokemusten kautta opittuja tietoja toteutetuista projekteista, palveluista, politiikan tekemisestä, kouluttamisesta, käytetyistä työkaluista, kielimalleista ja menetelmistä. Tapahtumasta teki valtavan kiinnostavan ja innostavan se, että osallistujat kertoivat avoimesti hankkeistaan ei vain jakaen lopputulosta, vaan myös projektien lähtökohtia, oppeja ja tehtyjä ratkaisuja sekä myös kriittistä tarkastelua hyödyistä ja haitoista.

Osallistujia oli maailmanlaajuisesti. Puheenvuoron saivat niin suuret ja vaikutusvaltaiset tahot, kuten Getty tai Oxfordin yliopiston Bodleian kirjasto, kuin pienemmätkin tahot. Oli tavallaan huojentavaa nähdä, että vaikka resurssit voivat olla erilaiset, ovat tekoälyn mukanaan tuomat haasteet kuitenkin pitkälti samoja, kuten myös tavoitteet, joita tekoälyn käytöllä haetaan. Ratkaisut eivät suinkaan aina vaatineet valtavia satsauksia. Itseäni puhutteli erityisesti yhteistyötä ja ihmislähtöisen kehittämisen tärkeyttä korostanut sanoma, joka toistui lähes kaikissa esityksissä.

Konferenssi antoi valtavasti ideoita ja vinkkejä tarjolla olevista tekoälysovelluksista ja kielimalleista. Ainakin ääntä litteroiva ja useaa kieltä ymmärtävä Whisper herätti kiinnostuksen ja sen hyödyntämistä haastatteluiden tallentamisessa on jo käyty tutkimaan. Muita välittömästi hyödyllisinä näyttäytyneitä palveluita oli ainakin Ranskan kulttuuriministeriön kehittämä Compar:IA, joka tarjoaa mahdollisuuden sokkona vertailla eri kielimallien tuottamia vastauksia sekä kertoo niiden ominaisuudet ja ympäristövaikutukset. Toimivien kielimallien valinta vaikuttikin esitysten valossa monimutkaisemmalta. Laajoissa kielimalleissa oli puolensa, mutta esimerkit osoittivat, että pienten kielten ja niiden erikoismerkkien kanssa usein parempi valinta olikin suppeampi kielimalli, joka oli opetettu kielellä, jolla sitä haluttiin soveltaa.

Uusien kirjainlyhenteiden ja kiinnostavien palveluiden ohella tärkein mukaani lähtenyt ajatus oli kuitenkin se, että tekoälyn käytön tulisi aina lähteä organisaation omasta tilanteesta ja tarpeesta. Fomo, ulosjäämisen pelko ei ole strategia, kuten Rachel Coldicutt sanoi mainiossa esityksessään. Tekoälyä on mahdollista hyödyntää toimivasti silloin, kun tiedetään, mitä sen käytöllä halutaan saavuttaa ja kenelle sekä ymmärretään tekoälyn käytön mukanaan tuomat riskit. Tekoälyn hyödyntämistä ei kannata kiirehtiä tai ottaa väkisin käyttöön, mutta sen mahdollisuuksia on hyvä tutkia ja kokeilla, olisiko jo olemassa oleviin haasteisiin löydettävissä apua tekoälyn soveltamisella.

Kahden päivän aikana saimme kuulla hengästyttävän määrän esimerkkejä kokoelmatyötä helpottavista tekoälyä hyödyntävistä projekteista. Tekoälyä hyödynnettiin mm. digitoinnin laadun varmistamiseen, kuvailun tuottamiseen automaattiseen tekstin tunnistamisen avulla ja transkriptioiden tuottamiseen, kuvien ja esineiden tunnistamisessa sekä hakupalveluiden parantamisessa. Esitykset havainnollistivat, mikä merkitys kielimallin valinnalla on lopputulosten tarkkuuteen, työn nopeuteen sekä hintaan. Konkreettisiin tapauksiin tutustuminen oli valtavan innostavaa!

Tekoälyllä on saavutettavissa monenlaisia hyötyjä, mutta konferenssi ei piilotellut haasteitakaan. Osa niistä on yhteisiä lähes kaikille organisaatioille. Tällaisia ovat esimerkiksi hallusinaatiot, tiedon luotettavuus ja vinoumat sekä tekijänoikeuksiin ja ympäristövaikutuksiin liittyvät kysymykset. Toisaalta monet haasteet ovat hyvinkin paikallisia ja liittyvät etenkin datan sisältöön, kuten American Archive of Public Broadcastingin esimerkissä. Heidän esityksensä käsitteli televisiolähetysten grafiikoiden tekstintunnistusta, jossa haasteita aiheuttivat sekä havaijilaisten nimien erikoismerkit että kuvien visuaalinen monimutkaisuus – kuten kukkakuosiset paidat tekstin taustalla.

Suuressa roolissa konferenssissa oli tekoälyn luotettavuus ja hallusinointi. Konferenssi tarjosi monta tapaa ratkaista ongelma. Esimerkiksi Luxemburgin kansalliskirjasto esitteli kehittämäänsä asiakkaidensa tiedonhakemista helpottavaa chattipalvelua, joka ei anna suoraa tekstikoostetta vastaukseksi, vaan ohjaa asiakasta luomaan tehokkaampia hakuja, joilla löytää toivomansa tiedon äärelle. Iso-Britannian kansallisarkisto puolestaan hyödynsi palvelussaan lähteinä vain hallinnon arkistoimia verkkosivuja ja tarjosi niihin viitteitä sitaattien sijaan. Tätä lähestymistä konferenssissa nimitettiin termillä RAG (Retrieval Augmented Generation) eli lähestymistapa, joka yhdistää generatiiviset kielimallit tiedonhakujärjestelmiin tarjoten käyttäjälle viitteitä lähteisiin.

Konferenssissa korostui vahvasti tekoälylukutaidon ja henkilöstön osaamisen merkitys. Useissa esityksissä todettiin, että teknologian kehittämisen rinnalla tarvitaan yhtä paljon panostusta osaamisen kehittämiseen ja koko organisaation valmiuksiin ymmärtää tekoälyn mahdollisuuksia ja rajoituksia. Keskusteluissa nousi esiin myös kysymys siitä, mitä tekoälylukutaito oikeastaan tarkoittaa eri rooleissa työskenteleville ihmisille ja kuinka syvällistä teknistä osaamista tarvitaan. Samalla esiteltiin henkilöstökyselyitä, joissa monet kirjastojen työntekijät toivoivat organisaatioiltaan investointeja osaamiseen ja infrastruktuuriin sekä ihmislähtöistä lähestymistapaa tekoälyn käyttöönottoon. Vastauksissa näkyi myös huolia: osa pelkäsi työnkuvien muuttuvan radikaalisti tai koki, että tekoälyyn liittyvä hype vie keskustelua eteenpäin nopeammin kuin organisaatioiden valmiudet todellisuudessa kehittyvät. Yhteinen viesti oli kuitenkin selvä: tekoäly ei korvaa asiantuntijoita, vaan parhaimmillaan tukee heidän työtään – kunhan organisaatiot panostavat koulutukseen, avoimeen keskusteluun ja uudenlaisten osaamisten rakentamiseen. Konferenssiin sisältyneissä työpajoissa painotettiin sitä, että paras tapa kasvattaa ymmärrystä tekoälystä ja sen moninaisuudesta on kokeilla konkreettisesti itse tekemistä. Pienimuotoisesti on aivan mainio tapa lähteä liikkeelle. Yhteistyöllä, uteliaisuudella ja rohkeudella kokeilla voi päästä hyvin pitkälle!

Hae sivustolta

Matka Fantastic Futures 2025 -konferenssiin Lontooseen 3.–5.12.2025

Kommentoi ja keskustele

Näytä aiemmat kommentit (0)

Teemu Hirvonen

Milla Eräsaari

Teemu Hirvosen ja Milla Eräsaaren blogikirjoituksia

”yksin ei tulisi aloitettua”

Uutiset ja puheenaiheet

Kuka sai pukeutua punaiseen, kuka siniseen? – Uutuuskirja vie värien ja väriaineiden historiaan

Iloistenkin laulujen maa

SKS:aan tuleva akatemiatutkijahanke tutkii omakohtaisia kokemuksia poliittisten valintojen ajureina