Vuonna 2027 tulee kuluneeksi 100 vuotta siitä, kun eduskunnassa tehtiin toivomusaloite ”suomen kirja- ja sivistyskielen kantasanakirjan” aikaansaamiseksi. Tämä aloite johti lopulta Nykysuomen sanakirjan toimitustyön aloittamiseen.
WSOY:n vuosina 1951–61 julkaisema Nykysuomen sanakirja sai vuosikymmeniä myöhemmin seuraajikseen ensin Suomen kielen perussanakirjan ja sitten Kielitoimiston sanakirjan. Vuonna 2024 Kotimaisten kielten keskuksessa eli Kotuksessa juhlitaan näiden molempien seuraajien pyöreitä vuosikymmeniä: Perussanakirjan kolmas eli viimeinen osa julkaistiin vuonna 1994 ja Kielitoimiston sanakirjan ensimmäinen, sähköinen versio vuonna 2004.
Nykysuomen sanakirjasta Suomen kielen perussanakirjaksi
Vaikka Suomen kielen perussanakirja ilmestyikin vasta 1990-luvulla, ensimmäisiä keskusteluja ”tiiviin jokamiehen käyttösanakirjan” tarpeellisuudesta käytiin aikoinaan jo Nykysuomen sanakirjan toimittajien kahvipöydässä. Vuonna 1964 asiasta pidettiin neuvottelukokouskin, mutta vasta 1971 laadittiin Nykysuomen laitoksessa – Kotimaisten kielten keskuksen edeltäjässä – työsuunnitelma tuolloin nimellä Nykysuomen perussanakirja tunnettua teosta varten. Tämän jälkeen varsinainen toimitustyö lähti käyntiin.
Alun perin oli tavoitteena, että Perussanakirja olisi yksiosainen, tiivis, selkeä, ajanmukainen, helppokäyttöinen ja edullinen, ”turhaa painolastia karttava normatiivinen jokamiehen käsikirja”. Sopivana laajuutena pidettiin aluksi neljännestä Nykysuomen sanakirjasta, myöhemmin kolmannesta, mutta lopullinen laajuus oli hakusanamäärällä mitattuna noin puolet, 98 000 hakusanaa.
Suomen kielen perussanakirja ilmestyi kolmiosaisena vuosina 1990–94. Työnimi Nykysuomen perussanakirja kulki mukana lähes julkaisuun asti, mutta 1980-luvun lopulla sanakirjan toimitus ehdotti nimen muuttamista. Syksyllä 1988 sanakirjan kustantajan eli Valtion Painatuskeskuksen (nyk. Edita Oy:n) Julkaisu-uutisissa kerrottiinkin, että tulossa olisi kaksiosainen ajantasainen sanakirja nimeltään Suomen kielen perussanakirja. Tuolloin sanakirjan hakusanamääräksi arvioitiin noin 94 000 ja ensimmäisen osan, A–N, ilmestymisajankohdaksi vuosi 1989.
Miten Perussanakirja erosi edeltäjästään?
Perussanakirja laadittiin kyllä yli 200 000 hakusanaa sisältävän Nykysuomen sanakirjan pohjalta, mutta sisältöä täydennettiin ja ajantasaistettiin uudella aineistolla. Lopulta kirjassa oli noin 20 000 sellaista hakusanaa, joita ei ollut vielä Nykysuomen sanakirjassa. Sanakirjan tiivistystyössä karsittiin pois vanhentuneita ja murteellisia sanoja sekä tarpeettomina pidettyjä yhdyssanoja ja erikoisalojen harvinaisia sanoja. Myös harvinaisempia merkityksiä jätettiin pois. Esimerkistössä pyrittiin lyhyyteen ja tiiviyteen.
Perussanakirjassa oli Kotuksen tutkijan Riitta Erosen uusima taivutustyyppitaulukko, joka oli tiiviimpi ja ajantasaisempi kuin ”toivottoman laajaksi ja epähavainnolliseksi” paisunut Nykysuomen sanakirjan taulukko. Lisäksi sanakirjan kaikkiin astevaihtelullisiin hakusanoihin oli lisätty Nykysuomen sanakirjassa olleen tähden perään kirjainkoodi, joka kertoi, millaisesta astevaihtelusta oli kyse. Koodeilla viitattiin sanakirjan uutuuteen, astevaihtelutaulukkoon. Esimerkiksi:
keto1*F
Koodi 1*F viittaa taivutustaulukon tyyppiin 1 (keto taipuu kuten taulukon mallisana valo), tähti ja kirjain F puolestaan viittaavat astevaihtelutaulukkoon, jossa F tarkoittaa vaihtelua t : d (mallisanat satu : sadun, pitää : pidän), siis keto : kedon.
Myös aineistonkeruussa toimittiin toisin kuin Nykysuomen sanakirjaa tehtäessä. Tuolloin järjestelmällinen aineistonkeruu lopetettiin kauan ennen sanakirjan ensimmäisen osan ilmestymistä eli jo vuonna 1938. Perussanakirjaa tehtäessä oli selvää, että sanakirjasta olisi tulossa uusia, ajantasaisia versioita, joten sanastamista eli uusien sanojen ja merkitysten keräämistä jatkettiin julkaisun jälkeenkin. Uutta aineistoa kerätään edelleen, nykyisin Kotuksen sähköiseen sana-arkistoon eli Nykysuomen sanatietokantaan.
Koska Perussanakirjan aineisto oli tallennettu (ruutupaperilta!) sähköiseen muotoon, aineisto oli helposti käytettävissä tulevien päivitysversioiden pohjana mutta myös hyödynnettävissä muissa sanakirjatuotteissa. Aineistoa onkin käytetty apuna muun muassa Suomi–ruotsi-suursanakirjan sekä Hollanti–suomi-suursanakirjan teossa.
Painetusta Suomen kielen perussanakirjasta CD-Perussanakirjaksi
Suomen kielen perussanakirjasta julkaistiin vuonna 1997 sisällöltään päivitetty versio, mutta sähköisenä. CD-Perussanakirjaksi nimettyä tuotetta tehtiin yhtä aikaa painetun sanakirjan kanssa, sillä prototyyppi valmistui jo vuonna 1994.
CD-Perussanakirja oli ensimmäinen suomen kielen sanoja suomeksi selittävä sähköinen sanakirja ja myös Pohjoismaiden ensimmäinen yksikielinen sähköinen sanakirja; Suomessa ja Ruotsissa oli aiemmin ehditty tehdä pari suppeampaa kaksikielistä sanakirjaa.
Painetun sanakirjan tallennuksessa oli käytetty tavallista tekstinkäsittelyohjelmaa, ja siten eri rakenteiden merkitsemisessä oli voitu hyödyntää vain tavallisia tekstinkäsittelyn keinoja, kuten lihavointia ja alleviivausta. Näistä merkinnöistä oli kuitenkin apua, kun aineisto muunnettiin uudenlaiseen muotoon, jossa kaikki sana-artikkelin rakenneosat oli nimettävä ja merkittävä täsmällisin tunnistein.
Jotta aineistosta saattoi etsiä tietoja monipuolisesti, oli sanakirjaan saatava sopivat haku- ja taivutusohjelmat. Nämä ohjelmat suunnitteli ja toteutti jo aiemmin prototyypin tuottanut Lingsoft Oy.
CD-Perussanakirjan käyttöliittymässä oli useita erillisiä ikkunoita, jotka oli nimetty tehtävänsä mukaisesti: Haku, Osumat, Näkymä, Taivutus ja Hakusanat. Hauissa saattoi käyttää jokeri- eli korvausmerkkejä, taivutussarjan sai näkyville Taivuta-nappia painamalla ja näytettäväksi saattoi valita muunkin näkymän kuin koko artikkelin. Käytössä oli myös jonkinlainen hakuhistoria. Hakuosumien enimmäismäärä oli CD-Perussanakirjassa 500.
Miten CD-Perussanakirja erosi edeltäjästään?
CD-Perussanakirjan merkittävin uutuus oli tietenkin sanakirjan sähköisyyden mukanaan tuomat monipuoliset ominaisuudet: Linkkien avulla pääsi näppärästi siirtymään sanakirja-artikkelista toiseen. Haulla pystyi etsimään myös taivutusmuotojen esiintymiä ja monisanaisia fraaseja. Haun saattoi kohdistaa hakusanojen lisäksi koko sanakirjatekstiin, selitteisiin, esimerkkeihin tai vain niihin artikkeleihin, joissa oli jokin kielenhuollollinen suositus tai jotka oli merkitty johonkin tyylilajiin tai jollekin erikoisalalle kuuluviksi.
Koska tilansäästämistarpeet eivät rajoita sähköistä sanakirjaa, voitiin painetun sanakirjan tiivistä esitystapaa avata selkeämmäksi. Suurin muutos oli se, että hakusanoja ei enää lyhennetty esimerkeissä. Esimerkiksi painetun sanakirjan ahdinko-artikkelin esimerkki Olla a:gossa on CD-Perussanakirjassa muodossa Olla ahdingossa. Kokonaisiksi avattuihin sanoihin oli myös helpompaa kohdistaa hakuja.
Helpommin luettaviksi ja haettaviksi avattiin CD-Perussanakirjassa myös niin sanotut paikallissijahakusanat. Esimerkiksi painetun sanakirjan hakusanaryhmä paikkeil|la, -ta, -le on CD-Perussanakirjassa muodossa paikkeilla, paikkeilta, paikkeille.
Myös CD-Perussanakirjan aineistoa hyödynnettiin toisessa julkaisussa: hakusanaston pohjalta tehtiin Kotuksessa 2000-luvun alussa Nykysuomen sanalista, jonka tarkoituksena oli toimia apuvälineenä suomen kieltä käsittelevien tietokoneohjelmien ja suomenkielisten käyttöliittymien kehitystyössä. Sanalistaa onkin hyödynnetty muun muassa monissa sanapeleissä, ja sitä päivitetään nykyään Kielitoimiston sanakirjan päivitysten tahdissa.
CD-Perussanakirjasta Kielitoimiston sanakirjaksi
CD-Perussanakirjan valmistuttua 1990-luvun loppupuolella toimituksen oli tarkoitus tehdä nopeasti seuraava, sisällöltään päivitetty versio. Sanakirjan ohjevihkosessakin lupailtiin rekisteröityneille käyttäjille päivitysversiota alennettuun hintaan. Vuodet kuitenkin kuluivat, eikä CD-Perussanakirjasta koskaan tullut uutta versiota.
Ilmestymisen jälkeen sanakirjan ympärillä tapahtui monenlaista, myös sanakirjatoimituksen kokoonpano muuttui jonkin verran. Uuden yhteistyökumppanin Kielikone Oy:n kanssa lähdettiin päivitysversion sijasta tekemään ulkoisesti ja toiminnallisesti uutta sähköistä tuotetta. Vaikka uuden sanakirjan sisältönä olikin CD-Perussanakirjan päivitetty sisältö, sanakirjalle annettiin uusi nimi. Pitkien pohdiskelujen jälkeen nimeksi valittiin Kielitoimiston sanakirja.
Sanakirjan ensimmäinen versio julkaistiin vuonna 2004. Tuolloin ilmestyi sekä cd-rom-versio että internet- ja intranetversio. Eri versioiden hakuominaisuudet poikkesivat hieman toisistaan, mutta itse sanakirjan sisältö oli kaikissa sama. Internetversio kuului Kielikone Oy:n MOT-sanakirjastoon, jossa käytetty ulkoasu ja johon valitut toiminnallisuudet vaikuttivat osaltaan siihen, millainen Kielitoimiston sanakirjasta tuli. Vuoden 2008 päivitysversion jälkeen sanakirjasta ei enää ole ollut saatavilla cd-rom-versiota.
Miten Kielitoimiston sanakirja erosi edeltäjästään?
Ulkoisesti Kielitoimiston sanakirja oli täysin uusi tuote. Tekninen alusta, käyttöliittymä, hakuominaisuudet, taivutusohjelma ja ulkoasu olivat kaikki uudenlaisia. CD-Perussanakirjan viiden erillisenä liikuteltavan ikkunan sijaan uudessa sanakirjassa oli vain yksi useampaan osaan jaettu ikkuna, jossa esitettiin kaikki tiedot.
Uudenlaiset hakuominaisuudet eivät tarkoittaneet kaikin puolin parannusta, sillä joistakin CD-Perussanakirjan ominaisuuksista jouduttiin muutoksessa luopumaan. Enää artikkelista ei voinut valita erilaisia näkymiä eikä hakuja voinut kohdistaa niihin artikkeleihin, joissa oli suositus tai jotka liittyivät johonkin tyylilajiin tai käyttöalaan. Myöskään selailtavaa hakusanalistaa ei enää ollut.
Mutta saatiin myös uusia ominaisuuksia. Sanan kirjoitusasusta epävarma saattoi Lähihaku-toiminnolla hakea sellaisia sanoja, jotka poikkesivat yhden merkin verran etsitystä. Esimerkiksi paneli-merkkijonoa haettaessa Lähihaku antoi osumiksi hakusanat kaneli ja paneeli. Tekstihaun tuloksena esitetyt tekstikatkelmat sai järjestettyä hakusanojen aakkosjärjestyksen lisäksi vaikkapa osumaa edeltäneen tai sitä seuranneen sanan mukaan. Myös hakuosumien enimmäismäärä kasvoi sadoista tuhansiin. Käyttöliittymän kieleksi saattoi valita suomen sijasta myös englannin.
Taivutustietojakin täydennettiin: nominien taivutusmuotosarjaan lisättiin monikon nominatiivi (kirjat) ja verbisarjaan potentiaali (tehnee). Adjektiivien taivutussarjaan tulivat uutuutena vertailumuodot eli komparatiivi ja superlatiivi (helpompi : helpoin).
Jo CD-Perussanakirjassa muutettiin paikallissijahakusanaryhmä (esim. paikkei|lla, -lta, -lle) kokonaisten sanojen ryhmäksi, mutta vasta Kielitoimiston sanakirjassa kukin näistä sanoista sai oman artikkelinsa. CD-Perussanakirjan hakusanaryhmä paikkeilla, paikkeilta, paikkeille oli Kielitoimiston sanakirjassa jaettu kolmeen artikkeliin, joista yksi on pääartikkeli ja kaksi muuta viittaavat siihen.
Myös jotkin sanakirjan varsinaista sisältöä koskeneet periaatteet muuttuivat. Vielä Suomen kielen perussanakirjan aikaan toimitus saattoi tarjota sanakirjan kautta omia sanaehdotuksiaan kieliyhteisölle. Esimerkiksi Perussanakirjan toimitussihteeri, sittemmin päätoimittaja Marja Lehtinen ehdotti ruoka-aineiden sekoittamiseen ja kääntelemiseen käytettävän haarukan mallisen työvälineen nimeksi haarukkalastaa ja ilmauksen bed and breakfast vastineeksi aamiaismajoitusta. Molemmat sanat ovat yhä käyttökelpoisia ja mukana sanakirjassa. Kielitoimiston sanakirjassa toimituksen omia sanaehdotuksia ei enää tarjota.
Uudistuneeseen sanakirjatuotteeseen sisältyi myös Kotuksessa tehty Asutusnimihakemisto, jossa oli tuolloin 21 000 paikannimeä taivutustietoineen. Tämä aineisto oli mukana vielä Kielitoimiston sanakirjan vuoden 2014 versiossa, mutta vuodesta 2016 lähtien se on ollut käytettävissä itsenäisenä verkkojulkaisuna.
Mikä Kielitoimiston sanakirjassa on muuttunut 20 vuoden aikana?
Kielitoimiston sanakirjasta on julkaistu kaiken kaikkiaan 14 päivitysversiota, kaksi painettua ja 12 sähköistä. Sisältömuutosten lisäksi sanakirjan kahteen vuosikymmeneen on mahtunut muitakin muutoksia. Vuonna 2014 tapahtui jotain kauan odotettua: sanakirjan ensimmäinen ilmaisversio julkaistiin verkossa. Viimein kaikki, joilla oli käytössään nettiyhteys, pääsivät käyttämään sanakirjaa.
Koska teknisen yhtistyökumppanin tuottamien taivutussarjojen tarkistaminen ja korjauttaminen vei liikaa aikaa, päätti toimitus alkaa lisätä itse käsin uusien hakusanojen taivutussarjat ilmaisversiosta lähtien. Näin esimerkiksi sitaattilainojen hankalat taivutukset saadaan heti oikeiksi. Usein uuden taivutussarjan pohjana voidaan käyttää jonkin vanhan hakusanan sarjaa, mikä nopeuttaa sarjojen lisäämistä.
Vuoden 2016 versiossa saattoi valita niin käyttöliittymän kuin oheistekstienkin kieleksi suomen ja englannin lisäksi ruotsin tai saksan. Nykyisessä versiossa saksa ei ole enää kielivaihtoehtona.
Kielitoimiston sanakirjasta on parinkymmenen vuoden aikana julkaistu kaikkiaan 14 päivitysversiota, kaksi painettua ja 12 sähköistä.
Ilmaisversion jälkeen Kielitoimiston sanakirjasta julkaistiin sisällöltään päivitetyt versiot vuosina 2016, 2017 ja 2018, mutta vasta 2020 oli suurempien muutosten vuosi. Silloin Kielikone Oy siirsi tuotteitaan uudelle tekniselle alustalle ja uuteen Sanakirja.fi-palveluun ja Kielitoimiston sanakirjankin oli sanottava hyvästit vanhalle tutulle käyttöliittymälle ja ulkoasulle. Uusi tekninen alusta mahdollisti kuitenkin sen, että sanakirjan käyttöliittymä mukautui vihdoin esimerkiksi puhelimen näytön kokoon.
Sanakirjasta tehtiin vuonna 2020 kaksikin päivitysversiota. Keväällä julkaistun, ominaisuuksiltaan yksinkertaistetun kevytversion rinnalla säilyi vielä käytössä aiempi eli vuoden 2018 versio, jossa oli uutta versiota monipuolisemmat hakutoiminnot. Vanhoja tuttuja ominaisuuksia palautettiin syksyllä 2020 ilmestyneeseen versioon, ja rinnalla ollut vanhempi versio poistui käytöstä. Uudelle tekniselle alustalle siirryttyä osa sanakirjan vanhoista ominaisuuksista jäi kuitenkin historiaan.
Uusin, koko sanakirjaa koskeva sisältömuutos tehtiin vuoden 2024 keväällä julkaistuun versioon. Siinä ovat ensimmäistä kertaa näkyvillä hakusanojen sanaluokkatiedot.
Kurkistus tulevaisuudennäkymiin
Kielitoimiston sanakirjan toimittajien työ jakautuu aineiston keräämiseen ja sanakirjan toimittamiseen. Jo 1970-luvulta lähtien on kaivattu aineistotyötä helpottamaan automaattista ”sanapoimuria”, joka tekisi tarkoitukseen sopivasta aineistosta sanojen alustavan poiminnan. Vaikka tietokoneohjelma keräisikin toimitukselle sanoja, joita ei vielä ole Kielitoimiston sanakirjassa eikä Nykysuomen sanatietokannassa, jäisi toimituksen työksi kuitenkin sanakirjan hakusanoiksi sopivien sanojen seulominen massasta.
Tietotekniikka voisi tulevaisuudessa auttaa myös toimitustyön tiedonkeruussa. Tekoälyn avulla toimittaja voisi ennen sana-artikkelin kirjoittamista etsiä tietoja esimerkiksi sanan merkityksistä, käyttötaajuudesta, käyttöyhteyksistä ja mahdollisista rinnakkaismuodoista. Näiden tietojen pohjalta toimittaja pääsisi nopeammin rakentamaan sana-artikkelin aihiota.
Vaikka tietotekniikka helpottaisi ja nopeuttaisi joitakin sanakirjan tekovaiheita entisestään, hakusanojen valinnan lisäksi myös selitteiden ja esimerkkien muokkaus on silti jatkossakin samanlaista ihmisen ajattelutyötä kuin on ollut jo vuosisatojen ajan. – Vaikka työnteon tavat muuttuvat, yksi asia säilyy: Kielitoimiston sanakirjaa toimittavat ja sana-artikkelit tuottavat jatkossakin alan asiantuntijat eli Kotuksen sanakirjatyön ammattilaiset.
Kielitoimiston sanakirja(avautuu uuteen ikkunaan, siirryt toiseen palveluun)
Nykysuomen sanakirjan näköisjulkaisu(avautuu uuteen ikkunaan, siirryt toiseen palveluun)
Kielikello-juttuja yleiskieltä kuvaavien sanakirjojen vaiheista
Taru Kolehmainen: Viisikymmentä vuotta Nykysuomen sanakirjan alullepanosta (10/1977)
Risto Haarala: Suomen kielen perussanakirja – Nykysuomen sanakirjan perillinen (3/1994)
Marja Lehtinen: CD-Perussanakirja – uuden ajan sanasampo (1/1997)
Eija-Riitta Grönros: Kielitoimiston sanakirja (4/2004)
Eija-Riitta Grönros: Kielitoimiston sanakirja verkkoon (4/2014)