’Arkistoa’ merkitseviä sanoja sisältävä kuori ja sanaliput Rapolan kokoelmasta. Kuva: Petri Lauerma, Kotus.

Martti Rapola (1891–1972) oli merkittävä suomen murteiden ja kirjasuomen tutkija. Hän käynnisti Vanhan kirjasuomen sanakirjan laatimisen, ja hänen kädenjälkensä näkyy myös suomen murteiden keruun ja sanakirjatyön organisoinnissa. Vähemmälle huomiolle on jäänyt, että Rapola oli kiinnostunut myös 1800-luvun kirjasuomesta, etenkin 1800-luvulta nykysuomeen johtaneesta sanaston kehityksestä. Nämä tutkimukset jäivät kuitenkin häneltä osin kesken.

Rapola alkoi 1930-luvulla tallentaa 1800-luvulla julkaistuista kirjoista, aikakausjulkaisuista ja sanakirjoista kokoamaansa materiaalia sanalipuille. Hän ei järjestänyt niitä aakkosjärjestykseen vaan merkityksen mukaan, koska hänen tavoitteenaan oli tutkia nykysuomeen vakiintuneen sanaston taustaa ja yksittäisten merkityskenttien kehitystä. Suurinta osaa lipuistaan Rapola säilytti käytetyissä kirjekuorissa, joiden päälle hän kirjoitti kuoressa olevien sanojen merkityksen. Kirjekuorten postileimoista voi päätellä, että suurin osa aineistosta on kerätty 1940-luvun alkupuoliskolla, vaikka viimeiset täydennykset ovat vasta 1950-luvulta. Sanalippuja kertyi kaikkiaan 24 arkistolaatikollista. Ne sisältävät arviolta 44 000 sanalippua.

Rapola hyödynsi aineistoaan lukuisissa 1940–1950-luvuilla julkaisemissaan artikkeleissa, jotka käsittelevät etupäässä erilaisten sanaryhmien ja sanojen kehitystä. Vuonna 1960 hän julkaisi kokoamansa aineiston pohjalta myös valikoiman Sanojemme ensiesiintymiä Agricolasta Yrjö-Koskiseen. Suurin osa aineistosta jäi kuitenkin julkaisematta ja hyödyntämättä.

Kokoelman vaiheita Kotimaisten kielten keskuksessa

Rapolan kokoelma siirtyi aikanaan Kotimaisten kielten tutkimuskeskuksen (nyk. Kotimaisten kielten keskus) eli Kotuksen arkistoihin. Se jäi varsin vähälle käytölle, sillä merkityksen mukaan järjestetystä sanalipustosta ei ollut helppo löytää yksittäisiä sanoja.

Käytön helpottamiseksi kokoelma päätettiin siirtää sähköiseen muotoon. Tästä suunnitelmasta luovuttiin kuitenkin pian, sillä kokoelman lähteiden identifiointi osoittautui niin vaativaksi työksi, ettei sitä katsottu voitavan jatkaa harjoittelijavoimin, kuten oli suunniteltu. Vuonna 1990 saatiin kuitenkin valmiiksi kokoelman ensimmäisen lippaan käsittävän tiedoston lisäksi laaja bibliografinen luonnos kokoelman lähteistä. Kesällä 2004 kokoelmaan laadittiin harjoittelijavoimin pelkistetty hakemisto.

Aineiston käsittelyä jatkettiin 2000-luvun puolella. Aineiston laajuus ja epätasaisuus oli jo selvillä, joten lipustosta päätettiin siirtää sähköiseen muotoon vain sen keskeisin osa, sanaston kehitystä nimenomaan 1800-luvun kuluessa valottava aineisto. Rapolan lipustoon sisältyy jonkin verran sekä tätä varhempaa että myöhempää aineistoa ja suoranaista murresanastoakin, mutta näiden osuus ja etenkin kattavuus jää varsin vähäiseksi 1800-luvun aineistoon verrattuna. Käytännön syistä tietokannasta on karsittu myös pelkän yhden esiintymän varassa olevat sanatiedot, sillä ne pohjautuvat usein sekundaarilähteisiin.

Lipuston rajaaminen tietokannaksi

Osa Rapolan aineistosta on nyt siis viety tietokantaan. Mukaan on otettu sellaiset käsitteet, joille on aineistossa esitetty 1800-luvulla kehittynyt ja sittemmin kirjakieleen vakiintunut suomalainen vastine. Tietokannassa hakumuotoina toimivat juuri käsitteet (ajattelun luomat abstraktiot), eivät niitä vastaavat kielelliset ilmaukset eli sanat: esimerkiksi käsitteen ’aate’ alta löytyvät kirjasuomeen vakiintunut sana aate sekä sen kanssa 1800-luvulla kilpailleet ehdotukset, kuten yline, selinko, kaave ja ajatelmakaava.

Tietokantaan on otettu mukaan myös sellaiset käsitteet, joille ei 1800-luvulla yrityksistä huolimatta vakiintunut suomalaista ilmaisua vaan lainasana. Tietokannassa on näin esimerkiksi sellainen lainasana kuin ananas, josta ei tullut kuninkaan eikä paratiisin omenaa eikä edes ananassi-asuista, millaisena sana ensi kerran tavattiin.

Tietokanta on suunniteltu täydentämään tietämystämme nimenomaan 1800-luvun sanastosta.

Sen sijaan esimerkiksi ’aapista’ tai ’holhoojaa’ merkitseviä ilmauksia ei tietokannassa ole, koska sellaiset sanat kuin aapinen ja holhooja vakiintuivat jo vanhan kirjasuomen kaudella (1543–1810). Tietokannasta ei löydy myöskään esimerkiksi ’kansanedustajaa’ tarkoittavia sanoja, sillä tämän käsitteen vakiintunut ilmaus tuli kieleen vasta 1900-luvulla. Tietokanta on näin suunniteltu täydentämään tietämystämme nimenomaan 1800-luvun sanastosta. Aiempien vuosisatojen kieleen keskittyvässä Vanhan kirjasuomen sanakirjassa on otettu huomioon ainoastaan 1800-luvun ensimmäisen vuosikymmenen sanasto, Nykysuomen sanakirjassa ei taas ole kuvattu 1800-luvun viimeisiä vuosikymmeniä vanhempaa sanastoa.

Tietokantaan on näiden rajausten myötä kertynyt tietoja kaikkiaan 5 600 sanasta, jotka jakautuvat 1 070 käsitteeseen. Alkuperäisestä aineistosta tämä muodostaa noin neljänneksen.

Tietokannan käytöstä

Käsitteet ovat tietokannassa aakkosjärjestyksessä. Hakusanojen ortografiaa ja yhdyssanojen kirjoitusasua on yleiskielistetty, esimerkiksi ize-rakas on asussa itserakas, yxi-waldias asussa yksivaltias ’yksinvaltias’, lämböisyden pundari asussa lämpöisyyden puntari ’lämpömittari’.

Tietokannasta voi hakea aineistoa paitsi hakusanoittain ja käsitteittäin myös kirjoittajittain, vuosittain sekä sana- ja julkaisutyypeittäin. Ilmaukset on jaoteltu johdoksiin, yhdyssanoihin, sanaliittoihin, lainoihin ja perussanoihin. Johdokset on koodattu johtimittain 94 ryhmään. Myös yhdyssanat ja sanaliitot on jaoteltu lukuisiin alakategorioihin.

Tietokannan käsiteselaussivun näkymä 'arkisto'-käsitteen kohdalta.

Lähteet on merkitty erilaisten lyhenteiden avulla. Sanakirjoihin viitataan pelkällä sk-lyhenteellä ja vuosiluvulla, lehdistä ja kirjoista on sen sijaan tehty omat sanalyhenteensä. Nämäkin tiedot saa hakusanaa klikkaamalla näkyviin auki purettuina. Saatavilla on myös tietoa vakiintumatta jääneiden ilmausten viime-esiintymistä, muotojen levikistä vanhassa kirjasuomessa ja murteissa sekä Rapolan käyttämistä sekundaarilähteistä. Hakusanoista voi tehdä myös lisäpoimintoja Kansalliskirjaston sanomalehtikokoelmasta ja Kotuksen omasta Varhaisnykysuomen korpuksesta.

Sanaston kehityslinjoja

Kirjasuomessa käytetyn sanaston ensiesiintymiä on lueteltu ja tutkittu pitkälti vain kieleen jääneen sanaston osalta. Vakiintumattomista sanoista on useimmiten nostettu esille vain joitain esimerkkejä. Nyt julkistetun Rapolan aineiston pohjalta voi hetkessä nähdä, kuinka valtava määrä ehdotuksia ja käyttöön vain tilapäisesti jääneitä sanoja on löydettävissä kirjasuomeen vakiintuneen sanaston takaa.

Aineistossa on vakiintunutta sanaa kohti keskimäärin yli viisi ehdotusta, mutta ehdotusten määrä vaihtelee suuresti. Joillekin käsitteille näyttäisi löytyneen osuva vastine lähes kertaheitolla, kun taas joillekin on etsitty suomalaista vastinetta pitkäänkin. Näin esimerkiksi sana aakkonen ei saanut myöhemminkään juuri kilpailijoita satunnaiseksi jäänyttä aakko-lyhennelmää lukuun ottamatta, mutta vokaalin vastineeksi ehdotettiin ensin sellaisia sanaliittoja ja yhdyssanoja kuin ihte äänellinen postavi ja itseääninen, sitten johdoksia ääneljäs, ääntäjä, äänike, äänikkä, äänikäs, ääntäin ja ääntäväinen, ennen kuin Elias Lönnrot muotoili pitkään käytössä olleen johdoksen ääntiö. Tämänkin jälkeen Jaakko Juteini ehdotti käyttöön vielä lyhyempää asua ääniö ja Volmar Kilpinen johdosta äänile. Merkitykseltään hankalan abstraktia sanaa mielikuvitus edelsivät puolestaan mm. sellaiset johdokset kuin into, hurme ja hurmaus ja yhdyssanat kuvatusvoima ja mielijuohto.

Rapolan aineiston pohjalta voi nähdä, kuinka valtava määrä ehdotuksia ja käyttöön tilapäisesti jääneitä sanoja on löydettävissä vakiintuneen sanaston takaa.

Vakiintumattoman sanaston vertailu kieleen jääneeseen sanastoon piirtää samalla kuvaa siitä, mihin suuntaan suomen kielen sanasto kehittyi 1800-luvulla. Varhaisnykysuomessa olivat vielä tavallisia sellaiset sanaliitot kuin kansallinen henki ’kansallishenki’, kiintonainen tähti ’kiintotähti’ ja sivistynyt kansa ’sivistyskansa’, jotka lyhenivät erilaisiksi yhdyssanoiksi, jotkin suoraan johdoksiksikin, kuten irtain tavara ’irtaimisto’.

Yhdyssanat kehittyivät puolestaan yleisemmin nominatiivialkuisiksi ja kaksiosaisiksi, esimerkiksi ilman-litistyspumppu ’ilmapumppu’, loppu-yhteensoindo ’loppusointu’. Genetiivialkuiset yhdyssanat harvinaistuivat: esimerkiksi alkuun käytetyistä muodoista kansankoulu ja opinaine päädyttiin nykyisiin muotoihin kansakoulu ja oppiaine. Genetiivialkuiset yhdyssanat eivät silti käyneet niin harvinaisiksi kuin lähes kadonneet paikallissija-alkuiset tapaukset, kuten edessälukeminen ’luento’ ja tuonille-pania ’säveltäjä’.

Muutamat johtimetkin jäivät vain päiväperhoiksi, kuten kuninkaanna ’kuningatar’, ja joidenkin suosio hiipui. Näin kävi etenkin -mus/-mys-johtimella muodostetuille johdoksille, kuten keskustelemus ’keskustelu’. Johdoksista tuli silti kaikkiaan tavallisempia kuin yhdyssanoista, sillä perussanoja, lainoja, sanaliittoja ja yhdyssanoja korvattiin eniten juuri johdoksilla.

Tarkkaan koodatusta aineistosta on kenen tahansa nyt helppo poimia lisää esimerkkejä näistä kehityskuluista tai löytää kokonaan uusia.

Aineisto on Kielipankin (CSC) sivustolla osoitteessa https://sanat.csc.fi/wiki/Rapolan_1800-sanasto(avautuu uuteen ikkunaan, siirryt toiseen palveluun).


Aiheesta enemmän

Lauerma, Petri 2018a: Martti Rapolan 1800-luvun sanakokoelma, sen tausta ja vaikutus. – Virittäjä 122 s. 255–281. https://doi.org/10.23982/vir.66978(avautuu uuteen ikkunaan, siirryt toiseen palveluun).

Lauerma, Petri 2018b: Finska språkets lånordsförråd i ljuset av Martti Rapolas ordsamling. – Nordiske Studier i Leksikografi 14 & Skrifter udgivet af Nordisk Förening for Leksikografi 15 s.178–185. Reykjavik: Nordisk Förening for Leksikografi & Árni Magnússon Instituttet for islandske studier.

Lauerma, Petri 2018c: The development of 19th century Finnish vocabulary in the light of Martti Rapola’s word collection. – Folia Uralica Debreceniensia 25 s. 133–152. Debrecen: Debreceni Egyetemi Kiadó. http://finnugor.arts.unideb.hu/fud/fud25/fud25_2.pdf(avautuu uuteen ikkunaan, siirryt toiseen palveluun).

Nykysuomen sanakirja. Porvoo: WSOY 1951–1961.

Rapola, Martti 1960: Sanastomme ensiesiintymiä Agricolasta Yrjö-Koskiseen. Tietolipas 22. Helsinki: Suomalaisen Kirjallisuuden Seura.

Vanhan kirjasuomen sanakirja. Kotimaisten kielten tutkimuskeskuksen julkaisuja 33. Helsinki: Kotimaisten kielten tutkimuskeskus 1985–. http://kaino.kotus.fi/vks/(avautuu uuteen ikkunaan, siirryt toiseen palveluun).