Tummansininen tausta, jossa on alhaalla keltaisia laatikoita ja vasemmassa ylänurkassa kuvataan vielä tummemmalla sinisellä jonkinlaista verkostoa. Oikealla on samantyyppinen verkosto, mutta valkoinen ja aivojen muotoinen.

Tekoäly on apuna kielen selkeyttämisessä. Kuva: Steve Johnson. Unsplash.

Iberian niemimaalla ja Latinalaisessa Amerikassa selkeä kieli kiinnostaa. Espanjan kuninkaallinen akatemia (Real Academia Española eli RAE) perusti vuonna 2022 espanjankielisten maiden selkeän kielen verkoston (Red Panhispánica de Lenguaje Claro). Verkoston tarkoitus on tukea selkeän virkakielen käyttöä.

Latinalaisen Amerikan maat, Argentiina, Brasilia, Meksiko, Kolumbia ja Chile etunenässä, ovat viime vuosina panneet alulle hankkeita, joissa on selvitetty muun muassa virkakielen tilaa ja selkeän kielen hyötyjä. Myös monet poliittiset päättäjät ovat havahtuneet selkeän kielen tärkeyteen, ja virkakieleen liittyvät tutkimushankkeet ja projektit ovat saaneet julkista rahoitusta.

Nämä edistysaskeleet on huomattu myös kansainvälisesti: Vuonna 2023 kansainvälisen selkeän kielen järjestön Plain Language Association Internationalin (PLAIN) konferenssi järjestettiin ensimmäistä kertaa Latinalaisessa Amerikassa, Argentiinan pääkaupungissa Buenos Airesissa. Konferenssissa kuultiin yli 200:aa puhujaa kymmenestä maasta ja käsiteltiin monia ajankohtaisia aiheita. Uutta oli se, että konferenssi oli kaksikielinen: englanti sai rinnalleen espanjan.

Yksi konferenssissa esille nousseista teemoista oli tekoäly ja selkeä kieli: miten uutta teknologiaa voidaan hyödyntää tekstien selkeyttämisessä?

Tekoäly auttaa kirjoittamaan selkeästi

Espanjalaisen UNED-yliopiston (Universidad Nacional de Educación a Distancia) soveltavan kielitieteen professori Iria da Cunha esitteli konferenssissa Artext-kirjoitusavustajaa (kirjoitetaan myös arText). Da Cunhan johtaman monitieteisen tutkimusryhmän kehittämä Artext on ensimmäinen espanjankielinen tekoälyä hyödyntävä kirjoitusavustaja, joka auttaa kirjoittamaan selkeästi. Maksuton ohjelma on suunnattu etupäässä julkishallinnon, turismin ja lääketieteen asiantuntijoille ja opiskelijoille, mutta myös suurelle yleisölle.

Kirjoitusavustajan kehittänyt työryhmä koostuu eri tieteenalojen edustajista: mukana on lingvistejä sekä tietotekniikan alan ja hallinto-oikeuden asiantuntijoita. Artextin tapaisia kirjoitusavustajia on jo käytössä myös muilla kielialueilla, esimerkiksi englanninkielinen Hemingway ja ranskankielinen Lisible.

”Kun valmistuin kielitieteen ja soveltavan kielitieteen tohtoriksi, mietin, miten voisin hyödyntää oppimaani siten, että siitä olisi konkreettista hyötyä yhteiskunnalle. Näin sain idean kehittää tietokoneohjelman, joka auttaa kirjoittamaan eri erikoisalojen tekstejä”, Iria da Cunha toteaa.

Artext tarjoaa käyttäjälleen kaksi erilaista tekstinmuokkaustyökalua: Ensimmäinen auttaa julkishallinnon työntekijöitä sekä turismin ja lääketieteen asiantuntijoita ja opiskelijoita kirjoittamaan oman alansa tekstejä. Tekstinmuokkaustyökalussa on 15 valmista tekstipohjaa näiltä aloilta. Ohjelmaan on syötetty tekstien prototyyppisimmät piirteet, joiden pohjalta se varmistaa, että kirjoittajan teksti vastaa mahdollisimman hyvin kyseisen tekstilajin piirteitä. Työkalu tarkistaa oikeinkirjoituksen sekä auttaa kirjoittajaa muokkaamaan tekstiään selkeämmäksi. Se varoittaa muun muassa liian pitkistä virkkeistä ja toistuvista ilmauksista.

Artextin toinen tekstinmuokkaustyökalu keskittyy pelkästään selkeään kieleen, ja sillä voi käsitellä mitä tahansa tekstejä. Työkalu antaa parannusehdotuksia kertomalla, miten tekstiä voisi selkeyttää. Se kiinnittää kirjoittajan huomion muun muassa raskaisiin partisiippi- ja infinitiivirakenteisiin, lyhenteiden käyttöön ja vanhahtaviin sanavalintoihin.

Artexin kehittänyt tutkimusryhmä ohjelman julkistamistilaisuudessa Madridissa keväällä 2023. Vasemmalta lukien Sara Pistola, M. Ángeles Escobar, Iria da Cunha, Amor Montané ja Susana Viñuales.

Tutkimushankkeessa kartoitettiin tekstitarpeita

Artextin kehittämisprosessissa da Cunhan johtama tutkimusryhmä selvitti, minkälaisia tekstejä julkishallinnon virkahenkilöt sekä turismin ja lääketieteen asiantuntijat ja opiskelijat kirjoittavat eniten. Ryhmä tutki myös sitä, mitkä tekstit tuottavat kirjoittajilleen eniten vaikeuksia. Tekstien yleisyys ja vaikeus olivat tärkeimmät kriteerit, joiden pohjalta kirjoitusavustajan 15 tekstilajia valittiin.

Julkishallinnon tekstilajeja kartoitettiin Espanjan tutkimus- ja innovaatioministeriön rahoittamassa hankkeessa, jossa tutkimusryhmä teki yhteistyötä Madridin kaupunginhallinnon kanssa. Hallinnon yli 27 000 työntekijälle lähetettiin kysely, jonka tavoitteena oli selvittää heidän virkatekstien kirjoittamiseen ja ymmärtämiseen liittyviä tarpeitaan. Kyselyyn vastasi 756 työntekijää.

Vastaajista 70 prosentilla oli ollut vaikeuksia vähintään yhden tekstilajin kirjoittamisessa. Melkein 90 prosenttia vastaajista piti kirjoitusavustajan kehittämistä mahdollisena ratkaisuna ongelmiin. Kyselyn vastausten ja aiemman tutkimuksen perusteella päädyttiin viiteen hallinnon alan tekstilajiin. Tyypillisiä tekstilajeja ovat esimerkiksi perustelu (alegación), kantelu (queja) ja hakemus (solicitud).

Artext auttaa, mutta ei vielä osaa kirjoittaa itse

Artextin käyttämät selkeän kielen suositukset perustuvat Espanjan kuninkaallisen akatemian yleiskieltä koskevaan ohjeistukseen sekä alan tutkimuskirjallisuuteen. Ohjelmaan on syötetty lähteissä useimmin toistuvat kielen selkeyttämiseen liittyvät suositukset.

Artext määrittää tekstin selkeyden asteen tekoälyn avulla prosentuaalisesti. Ohjelma analysoi tekstejä kolmella tasolla: Diskursiivisella tasolla (nivel discursivo) se kiinnittää kirjoittajan huomion esimerkiksi pitkiin lauseisiin ja kappaleisiin tai siihen, että jokaisessa kappaleessa olisi hyvä olla vain yksi pääasia. Morfosyntaktisella tasolla (nivel morfosintáctico) kirjoittajaa ohjataan muun muassa välttämään passiivin käyttöä ja käyttämään myöntölauseita kiellon sijaan. Sanaston tasolla (nivel léxico) ohjelma varoittaa esimerkiksi ympäripyöreistä ilmauksista ja erikoissanaston käytöstä.

Tarkoitus on, että työntekijät oppivat prosessissa itse kirjoittamaan selkeämmin. Artext antaa kirjoittajalle vinkkejä esimerkiksi tähän tapaan: ”Huomaa, että tämäntapaisissa teksteissä voi käyttää erilaisia vaihtoehtoisia ilmauksia, esimerkiksi synonyymejä [– –]”.

Tarkoitus on, että työntekijät oppivat prosessissa itse kirjoittamaan selkeämmin.

Tulevaisuudessa Artext voi kenties myös tuottaa itse selkeäkielistä tekstiä tekoälysovellus Chat GPT:n tapaan. Tällöin ohjelmaan voisi syöttää minkä tahansa tekstin, jonka ohjelma ikään kuin ”kääntäisi” selkeälle kielelle. Tähän liittyy da Cunhan mukaan kuitenkin toistaiseksi vielä ongelmia: Tekoäly ei osaa ottaa huomioon esimerkiksi eri sukupuolten ja vähemmistöjen näkyvyyteen liittyviä seikkoja. Tekoälyn tuottamaan tekstiin ei myöskään vielä voi täysin luottaa; se ei ole lähdekriittinen tiedonhakija ja saattaa jopa lisätä tekstiin itse keksimäänsä tai epäolennaista tietoa.

”Koska tekoäly osaa kirjoittaa sujuvasti, ei asiavirheitä välttämättä huomaa. Ihmistä tarvitaankin aina tarkistamaan työ”, da Cunha toteaa.

Selkeä kieli kiinnostaa

Iria da Cunhan mukaan Artext on saanut Espanjassa hyvän vastaanoton. Esimerkiksi Madridin kaupunki on ottanut sen käyttöönsä: tekstinmuokkaustyökalu on saatavilla kaupungin intranetissä, ja lisäksi työntekijöille on tarjolla selkeän kielen koulutusta.

Myös muita espanjalaisia kaupunkeja kannustetaan käyttämään kirjoitusavustajaa – esimerkiksi Katalonian aluehallitus ja Baleaarit ovat osoittaneet kiinnostusta työkalua kohtaan. Tulevaisuudessa Artextistä voitaisiin myös tehdä englanninkielinen versio. Asiasta on jo ollut puhetta Euroopan komission kanssa.

Iria da Cunhan mukaan selkeä kieli kiinnostaa Espanjassa tällä hetkellä kovasti, ja vireillä on monia hankkeita. Aina näin ei ole ollut – da Cunhan mielestä Espanja on virkakielen selkeyttämisessä muihin maihin verrattuna jälkijunassa.

”Se, kuinka paljon selkeän kielen kehittämiseen saadaan resursseja, riippuu kulloisestakin poliittisesta tilanteesta. Taustalla on toki myös sinnikästä vaikuttamistyötä ja tieteellisen tutkimuksen kansankielistämistä”, da Cunha nauraa.

Lähteet

Artext-kirjoitusavustajan verkkosivut (englanniksi)(avautuu uuteen ikkunaan, siirryt toiseen palveluun)

Iria da Cunha & M. Ángeles Escobar 2021: Recomendaciones sobre lenguaje claro en español en el ámbito jurídico-administrativo: análisis y clasificación (Pragmalingüística)(avautuu uuteen ikkunaan, siirryt toiseen palveluun)

Iria da Cunha & Sara Pistola 2023: Writing administrative textual genres in scholarly and professional contexts in Spain (Íkala – Revista de lenguaje y cultura)(avautuu uuteen ikkunaan, siirryt toiseen palveluun)