­­Suomen kielen järjestelmä rajoittaa yhdyssanojen muodostamista ja sanoissa käytettävien rakenteiden valintaa vain vähän. Yhdyssanan osina voidaan käyttää eri sanaluokkiin kuuluvia sanoja, osat voivat esiintyä sanoissa hyvin monenlaisissa eri muodoissa, eikä osien määrällekään ole mitään periaatteellista rajoitusta.

Suomen kielessä mahdolliset yhdyssanarakenteet on kuvattu useissa kieliopeissa ja sanastonkuvauksissa. Niistä monissa esitetään myös arvioita siitä, kuinka paljon eri rakenteita käytetään uusien sanojen muodostuksessa eli kuinka produktiivisia ne ovat. Koska kielioppien ja sanastonkuvausten tarkoitus on kuvata kaikki se, mikä on kielessä mahdollista, ne voivat antaa vääristyneen kuvan siitä, mikä uudissanojen muodostuksessa on oikeasti tavanomaista. Tarkka kuva uusien sanojen rakenteesta voidaan saada vain uudissanastoa tutkimalla. Tässä kirjoituksessa esitellään tietoja, jotka on saatu analysoimalla lähes 30 000 suomen kirjoitettuun yleiskieleen 2000-luvun alkupuolella tullutta uutta yhdyssanaa.

Kielenoppijalle voi kertoa helpottavana tietona, että suomen kielen yhdyssanat eivät ole niin pitkiä kuin usein väitetään.

Suurin osa yleiskielen uusista yhdyssanoista noudattaa kaikkein tavanomaisinta rakennetta: Ne koostuvat kahdesta sanasta eli leksikaalisesta osasta, jotka ovat molemmat substantiiveja. Alkuosa on nominatiivimuotoinen, eikä se seuraa jälkiosaa taivutuksessa. Keskimääräinen pituus on 11–13 merkin paikkeilla, ja sanat on muodostettu suoraan kahdesta sanasta yhdistämällä. Tätä yksinkertaisinta mahdollista ja samalla prototyyppisintä rakennetta noudattavat esimerkiksi sellaiset sanat kuin ideahautomo, kulissipressu ’julkista rakennusta remontin aikana peittävä näköispressu’ja punkkibussi ’bussi, jolla kierretään antamassa puutiaisaivokuumerokotteita’.

Yhdyssanat oletettua lyhyempiä

Suomen kielen yhdyssanassa voi teoriassa olla kuinka paljon osia tahansa. Pitkät yhdyssanat ovat kuitenkin usein hankalia käyttää ja hitaita ymmärtää. Suurimmassa osassa uusista yhdyssanoista onkin vain kaksi osaa. Tavallisia tapauksia ovat esim. aamiaiskahvila ’aamiaista tarjoava kahvila’, kainalomyymälä ’marketissa toimiva itsenäinen pienkauppa’ ja ötökkätarjonta ’esimerkiksi linnuille saatavissa oleva ravinto’ (”ötökkätarjonta on parhaimmillaan keskikesällä”). Myös kolmiosaisia uusia yhdyssanoja syntyy jonkin verran (esim. kauppakeskuspappi ’kauppakeskuksessa työskentelevä pappi’, lentopäästölaskuri ’laskuri, jolla voi laskea lentomatkansa aiheuttamat hiilidioksidipäästöt’ ja pieneläintunneli ’tunneli, jota pitkin eläimet voivat alittaa turvallisesti esim. moottoritien’). Neli- ja varsinkin viisiosaiset muodosteet ovat sen sijaan harvinaisia.

Mitä enemmän yhdyssanassa on osia, sitä lyhyempiä osat keskimäärin ovat. Näin sanan kokonaispituus ei pääse karkaamaan käsistä. Pitkien yhdyssanojen ymmärtämistä ja käyttöä helpottaa myös se, että niiden osina on usein toisia valmiiksi vakiintuneita yhdyssanoja (esim. elokuvateatterielokuva ’elokuvateatterilevitykseen tehty elokuva’ ja sateenkaariavioliitto).

Suomea vieraana kielenä opiskelevia on toisinaan jopa suoranaisesti peloteltu suomen pitkillä sanoilla. Senkaltaiset pitkät ja vaikeatajuiset sanahirviöt kuin kestomagneettitahtikonekäyttö ja lähialueministerivaliokunta ovat uudessa sanastossa kuitenkin poikkeustapauksia. Kielenoppijalle voikin kertoa helpottavana tietona, että itse asiassa suomen kielen yhdyssanat eivät ole niin pitkiä kuin usein väitetään. Pitkienkin yhdyssanojen ymmärtäminen helpottuu, kun niiden rakenteen hahmottaa ja ne osaa pilkkoa osiin.

Genetiivialun harvinaisuus yllättää

Suomen kielen järjestelmä ei aseta rajoja myöskään yhdyssanan alkuosan muodolle. Periaatteessa mahdollisia ovat kaikki sijamuodot, mutta yleensä tärkeimpinä mainitaan nominatiivi ja genetiivi. Uudessa sanastossa selvästi yleisin on nominatiivi, joka jättää yhdyssanan merkityksen hyvin avoimeksi. Esimerkiksi sanalla maamuuttaja on paljon enemmän tulkintamahdollisuuksia kuin sanoilla maahanmuuttaja, maassamuuttaja tai maastamuuttaja.

Nominatiivin ohella vanhastaan tärkeänä pidetyn genetiivin harvinaisuus uudessa sanastossa yllättää. Genetiivimuotoinen alkuosa on noin 4 %:ssa uusista yhdyssanoista, mikä on selvästi vähemmän kuin esimerkiksi yleiskielen sanakirjoissa. Uusien genetiivialkuisten yhdyssanojen joukkoon kuuluvat mm. taakanjako, elämänrekisteri ’älylaitteiden keräämä tieto ihmisen elämän aikana tapahtuneista asioista’ ja maailmanhalvaus ’esim. maiden sisäpoliittisista syistä johtuva kyvyttömyys ratkaista maailmanlaajuisia ongelmia valtioiden yhteisillä päätöksillä’.

Useissa genetiivialkuisissa ilmauksissa on mahdollista sekä yhteen että erikseen kirjoittaminen.

Uudessa yhdyssanastossa nominatiivialkua käytetään myös monissa sellaisissa sanoissa, joissa genetiivialku tuntuisi odotuksenmukaisemmalta. Tällaisia sanoja ovat esimerkiksi jalkalämmitin, tapahtumajärjestäjä ja islampelko. Yksi syy genetiivialkujen välttämiseen voi olla se, että niitä pidetään usein oikeinkirjoituksen kannalta hankalina. Useissa genetiivialkuisissa ilmauksissa on mahdollista sekä yhteen että erikseen kirjoittaminen sen mukaan, kuinka merkitykseltään kiteytyneenä kirjoittaja pitää ilmausta. Esimerkiksi tapahtumanjärjestäjä-ilmauksen osat voidaan toisissa konteksteissa kirjoittaa yhteen ja toisissa erikseen. Nominatiivialkuisessa rakenteessa valintaa ei tarvitse tehdä, joten se on epävarmalle kirjoittajalle helpompi valinta.

Toinen mahdollinen syy genetiivialkuisten yhdyssanojen vähäisyydelle uudessa sanastossa on kielissä yleinen rakenteiden yksinkertaistumisen tendenssi sekä se, että valmiiksi yleisin eli nominatiivialkuinen rakenne valtaa alaa muilta alkuosamuodoilta.

Harvinaista mutta mahdollista

Suomen kielessä yhdyssanan alkuosana voivat esiintyä myös muut sijamuodot kuin nominatiivi ja genetiivi. Uudessa sanastossa muut sijamuodot ovat kuitenkin erittäin harvinaisia: laajassa tutkimusaineistossa niitä esiintyi vain noin 0,1 %:ssa tapauksista (esim. maahanimeyttämö ’sepelikerros, jonka läpi jätevesi imeytetään maahan’ ja nukeillanäyttelijä ’nukketeatterissa nukkeja käsittelevä näyttelijä’). Muut sijamuodot kuin nominatiivi ja genetiivi päätyvät yhdyssanan alkuosaan yleensä sanaliitosta tiivistymisen kautta. Esimerkiksi sanaliitto työssä jaksaminen on termistyessään tiivistynyt yhdyssanaksi työssäjaksaminen. Toisinaan muodostuksessa yhdistyvät sanaliitosta tiivistyminen ja johtaminen (esim. hällä väliä > hällävälisti).

Uudessa sanastossa vielä harvinaisempi on rakenne, jossa myös yhdyssanan alkuosa kongruoi eli taipuu samaan tapaan kuin jälkiosa (vrt. hyvä omatunto : hyvällä omallatunnolla). Aiemmissa tutkimuksissa kongruenssin on todettu olevan katoamassa sellaisistakin yhdyssanoista, joissa sitä on vanhastaan esiintynyt. Voikin olla, että tulevaisuudessa tämä jo harvinaiseksi käynyt rakenne katoaa kokonaan.

Aiemmin huomiotta jääneitä rakenteita

Prefiksit (eli etuliitteet) ja prefiksinkaltaiset elementit ovat sananmuodostuksessa käytettäviä aineksia, jotka eivät edusta itsenäistä sanaa mutta joiden avulla voidaan kuitenkin muodostaa yhdyssanoja ja monissa kielissä myös johdoksia. Mallin prefiksinkaltaisten elementtien käyttöön on arveltu tulleen suomeen muista kielistä saatujen käännöslainojen kautta, eikä suomessa ole vanhastaan katsottu olevan lainkaan prefiksisysteemiä. Myös yhdyssanojen muodostusta käsittelevissä kirjoituksissa huomiot prefiksinkaltaisten elementtien käytöstä ovat olleet hajanaisia, vaikka todellisuudessa niitä on käytetty yhdyssanojen muodostuksessa jo pitkään.

Yhdyssanoissa on sekä kotoista että vierasta alkuperää olevia alkuosia.

Uudessa yhdyssanastossa prefiksinkaltaiset alkuosat ovat varsin yleisiä (esim. metateatteri, antikaunis, epälaulaja ja ulkokana). Käytössä on paljon sekä kotoista että vierasta alkuperää olevia alkuosia. Molempia käytetään uusien yhdyssanojen muodostuksessa enemmän kuin esimerkiksi vanhastaan tärkeinä pidettyjä genetiivimuotoisia alkuosia. Kaiken kaikkiaan prefiksinkaltaisten elementtien käyttö on yhdyssanojen muodostuksessa niin yleistä, että ne on jatkossa syytä ottaa paremmin huomioon myös suomen kielen kieliopeissa ja sanastonkuvauksissa.

Toinen kieliopeissa ja sanastonkuvauksissa tähän asti huomiotta jäänyt rakenne on -inen-loppuisista vierasperäisistä adjektiiveista käytettävä ‑i-loppuinen yhdysosamuoto. Sellainen on esimerkiksi sanoissa aktiiviseniori ja virtuaalilentäminen. Tällaisten muotojen käyttö on yhdyssanan alkuosana säännönmukaista, eikä -inen-loppuisista vierasperäisistä adjektiiveista käytetä lainkaan ‑s-loppuista muotoa, joka on tuttu kotoisten ‑nen-loppuisten sanojen yhteydestä (vrt. esim. ilmaiskanava ja satunnaistalvehtija mutta ei ”aktiivisseniori” tai ”virtuaalislentäminen”).

Yhdyssanatietoa tarvitaan opetuksessa ja kieliteknologiassa

Kielitietoisuuden lisääminen on yksi uuden opetussuunnitelman keskeisistä periaatteista. Äidinkielen opetuksessa kielitietoisuutta voidaan lisätä esimerkiksi aiempaa laajemmalla sananmuodostuskeinojen käsittelyllä. Vaikka suurin osa suomen kielen uusista sanoista on yhdyssanoja, sananmuodostuksen opetuksessa on perinteisesti keskitytty enemmän johdoksiin kuin yhdyssanoihin.

Teksteissä ja puheessa käytettävistä yhdyssanoista jopa yli puolet saattaa olla vakiintumattomia tilapäismuodosteita. Opetuksessa voidaankin korostaa esimerkiksi yhdyssanojen tarjoamia ilmaisumahdollisuuksia: ne ovat helppo ja niin haluttaessa myös hauska keino muodostaa uusia sanoja. Joissain tapauksissa kirjoittaja voi yhteen ja erikseen kirjoittamisella osoittaa omaa käsitystään yhtymän merkityksen kiteytyneisyydestä (esim. kohdun lainaus vai kohdunlainaus ’sijaissynnyttäminen’, pyöriäisten tarkkailija vai pyöriäistentarkkailija). Sananmuodostusta koskevan tietoisuuden lisääminen tukee myös oikeinkirjoitussääntöjen oppimista, johon varsinkin äidinkielisille puhujille suunnattu yhdyssanoja koskeva opetus on yleensä ensisijaisesti keskittynyt.

Äidinkielenopetuksessa voidaan korostaa yhdyssanojen tarjoamia ilmaisumahdollisuuksia: ne ovat helppo ja niin haluttaessa myös hauska keino muodostaa uusia sanoja.

Se, että suurin osa uusista yhdyssanoista noudattaa tavanomaista rakennetta, on tärkeä tieto varsinkin alkuvaiheen suomi toisena kielenä -opetuksen (S2) kannalta. Ymmärrettävien uusien yhdyssanojen muodostamiseen riittää yleensä yhden rakenteen tunteminen. Itselle vieraiden yhdyssanojen osien tunnistamisessa apua voi olla esimerkiksi yhdyssanan alkuosissa poikkeuksellisissa muodoissa esiintyvien sanojen (lyhyeksi jäävistä) luetteloista, jollaisia käytetään myös muiden kielen epäsäännöllisyyksien opiskelussa (esim. neljä > neli- mutta myös neljä-, sika > siko- mutta myös sika-). Tulevaisuudessa tällaisia listoja pystytään ehkä tuottamaan automaattisesti. Automaattisen prosessoinnin avulla voidaan tulevaisuudessa todennäköisesti toteuttaa myös erityisesti S2-oppijoita hyödyttävä mahdollisuus erilaisten yhdysosamuotojen käyttöön sanakirjahauissa (esim. hakusanalla hevos löytäisi selityksen sanalle hevonen).

Tietoa siitä, millaisia uudet sanat ovat (eikä vain millaiset rakenteet ovat periaatteessa mahdollisia), voidaan käyttää kieliteknologiassa myös muihin tarkoituksiin. Esimerkiksi kaikissa tilanteissa oikein toimivien korjauslukuohjelmien luominen on mahdotonta, jos myös uudissanastossa todennäköisesti vastaan tulevia rakenteita ei tunneta. Ohjelmissa on toki otettava huomioon kaikki kieliopillisesti mahdolliset rakenteet, mutta tieto uusien sanojen rakenteellisesta yksinkertaisuudesta auttaa painottamaan ohjelmia oikein.

Käytettävyys yksiselitteisyyttä tärkeämpää

Kaikki aiemmissa kieliopeissa ja sanastonkuvauksissa mainitut yhdyssanarakenteet ovat suomen kielessä edelleen mahdollisia. Niin kauan kuin yksikin sana noudattaa tiettyä rakennetta, siitä voidaan ottaa mallia uuden sanan muodostamiseen. Käytännössä osaa vanhoista rakenteista ei kuitenkaan enää käytetä kovin aktiivisesti uusien sanojen muodostuksessa. Niiden sijaan on saatu uusia rakenteita, joista selvästi käytetyimpänä erottuvat prefiksinkaltaiset alkuosat. Kaiken kaikkiaan suomen kielen uudet yhdyssanat ovat rakenteeltaan homogeenisempi joukko kuin kielioppeja ja sanastonkuvauksia lukemalla voisi olettaa.

Suomen kielen uudet yhdyssanat ovat rakenteeltaan varsin homogeeninen joukko.

Kuten tässäkin kirjoituksessa käytetyt esimerkkisanat osoittavat, yhteen yhdyssanaan voidaan tiivistää valtavasti informaatiota. Esimerkiksi sanoja kalakauppias ja katukauppias ei voi ymmärtää ilman tietoa kontekstista ja siitä, miten asiat maailmassa yleensä ovat: kaloja on tapana myydä mutta katuja ei. Mitä enemmän yhdyssanaan pakataan leksikaalisia osia, sitä yksityiskohtaisempi ja tarkempi sen merkityksestä saadaan. Viestin perillemenoa voidaan varmistaa myös käyttämällä alkuosassa sellaista sijamuotoa, joka osoittaa osien välillä olevan merkityssuhteen yksiselitteisesti.

Suomen kielen järjestelmä ei juuri rajoita yhdyssanojen muodostamista. Kielenkäyttäjä valitsee tilanteeseen sopivimman rakenteen useista eri vaihtoehdoista aina uutta sanaa muodostaessaan. Kielenkäyttäjien – yleensä tiedostamattaan – tekemät valinnat heijastavat esimerkiksi sitä, millaisia rakenteita pidämme riittävän helppoina sekä tuottaa että ymmärtää.

Useimmissa tapauksissa yksinkertainen rakenne riittää yhdyssanan sisältämän informaation tarkoituksenmukaiseen pakkaamiseen. Yksinkertaisen rakenteen valinta kertoo siitä, että käytettävyys ja nopea viestintä ovat yleensä yksiselitteisyyttä tärkeämpiä. Ymmärrämme toisiamme, vaikka kieli ei olisi yksiselitteistä, sillä maailmantieto ja tilanne ohjaavat tulkintojamme.