Joskus lapsena oli tapana esittää toiselle melkein mahdottomana pidetty tehtävä sanomalla: ”Kuvaile, millaista on kuohkea mutta niin, ettet näytä ollenkaan käsilläsi.” Silloin ei tullut mieleen, että jotkut ratkovat tämmöisiä ”melkein mahdottomia” kysymyksiä ammatikseen. Sanakirjantoimittajien ammattikunta ei Suomessa ole kovin suuri, eikä muilla ihmisillä yleensä ole oikein selvää käsitystä siitä, millaista työ on. Usein kysytään, ”mistä te ne sanat saatte” ja ”kuka sen päättää, mitä sanat tarkoittavat”.
Sanat ”saadaan” yleensä sanakirjaa varten erityisesti kerätyistä aineskokoelmista. Esimerkiksi Suomen kielen perussanakirja, jonka kolmesta osasta ensimmäinen ilmestyi viime vuonna, pohjautuu kielitoimiston laajaan sana-arkistoon. Siihen on tähän mennessä kertynyt jo yli viisi miljoonaa sanapoimintoa. Tähän määrään sisältyy myös se vanha aineisto, josta Nykysuomen sanakirja on aikoinaan tehty. Kokoelmia kartutetaan jatkuvasti; vuosittain tulee noin 15 000 poimintoa lisää. Nämä luvut eivät tarkoita uusia sanoja tai edes erillisiä sanoja vaan samojenkin sanojen erilaisia esiintymiä, tietoja sanojen erilaisesta käytöstä. Aineistoa on kerätty tieto- ja kaunokirjallisuudesta, sanoma- ja aikakauslehdistä, mainoksista, esitteistä ym. Tämän käsin poimitun aineksen lisäksi on käytettävissä myös ATK:n avulla laadittuja tekstisanaluetteloita, joissa on esimerkiksi joidenkin aikakauslehden numeroiden kaikki sanat aakkosjärjestyksessä esiintymisympäristöineen.
Kaikesta tästä sana-aineksesta suodattuu vain pieni osa itse sanakirjaan. Mukaan otettavien sanojen valintaan vaikuttaa se, minkä tyyppinen ja laajuinen sanakirja on ja mikä on sen tehtävä. Suomen kielen perussanakirja on keskisuuri sanakirja; siihen tulee lähes 100 000 hakusanaa. Vaikka kirjan tarkoituksena on kuvata suomen nykyisen yleiskielen sanavarat, kaikkia kielen sanoja ei tämänkokoiseen kirjaan voi ottaa. Suomen kielessä voidaan esimerkiksi muodostaa yhdyssanoja ja johdoksia lähes rajattomasti. Näistä otetaan kirjaan vain merkityssisältönsä ja käyttönsä kannalta tärkeimmät. Monen tilapäisluonteisen yhdyssanan merkitys selviää, kun alku- ja loppuosan merkitykset tunnetaan. Esimerkiksi sellaista sanaa kuin elintasovertailu ei ole hakusanana, mutta sen merkitys voidaan päätellä hakusanojen elintaso ja vertailu merkitysten avulla. Mukana ei ole myöskään esimerkiksi sellaista harvinaisehkoa johdosta kuin hipaisunäppäiminen, koska sen voi mekaanisesti muodostaa sanasta hipaisunäppäin, joka on hakusanana. Kirjaan ei ole myöskään otettu kaikkia mahdollisia huippu-alkuisia adjektiiveja, vaikka siellä onkin huippuhyvä, huippujännittävä, huippusalainen ja muutama muu. Sanakirjan laatija luottaa siihen, että lukija osaa soveltaa saamaansa kaavaa.
Yleiskielen sanojen lisäksi Perussanakirjaan otetaan myös keskeisiä erikoisalojen termejä. Ne ovat yleensä sanoja, joihin erikoisalaa lähemmin tuntematonkin voi eri yhteyksissä törmätä ja joiden merkitys saattaa askarruttaa. Tällaisia ovat esimerkiksi joukkoviestimissä usein esiintyvät sanat, sellaiset kuin vaikkapa ekosysteemi, geenitekniikka tai futuuripörssi.
Kun päätös sanan mukaanotosta on tehty, edessä on vähintään kaksi ongelmaa: miten sana selitetään ja millä esimerkeillä sitä parhaiten havainnollistettaisiin. Esimerkkien tehtävänä on valaista hakusanan merkitystä sekä tyypillisiä lause- ja käyttöyhteyksiä. Niiden avulla osoitetaan muun muassa se, mihin muotoon sana vaatii siihen kytkeytyvät muut sanat (voidaan esimerkiksi tehdä esitys jostakin tai esitys joksikin: ”Komitean esitys määrärahan myöntämisestä tai myöntämiseksi”). Esimerkistöön pyritään saamaan mukaan myös hakusanaan liittyvät erilaiset sanonnat. Esimerkiksi käsi-sanaa käsittelevästä artikkelista löytyvät muiden muassa sanonnat hakea kättä pitempää, ottaa järki käteen ja elää kädestä suuhun.
Sanan määritelmän muotoilusta vastaa sanakirjan toimitus, mutta sen, mitä sana tarkoittaa, päättää koko kieliyhteisö, kaikki kielenkäyttäjät yhdessä. Merkitys muodostuu siitä, miten sanaa yleisesti ja vakiintuneesti käytetään. Tällä tavoin myös vanhat sanat voivat saada uusia merkityksiä: sanaa aletaan käyttää entisestä poikkeavalla tavalla. Jos uusi käyttö saa kannatusta ja vakiintuu, siitä tulee uusi merkitys sanalle. Sanakirjan tekijöiden tehtävä on tunnistaa sanojen erilaiset käyttötavat ja merkitykset sekä kuvata ne. Yksi esimerkki tällaisesta vanhan sanan uudesta merkityksestä on haastava merkityksessä ’vaativa ja kiehtova, haasteellinen’ (esim. haastava tehtävä). Tällaista käyttöä ei Nykysuomen sanakirjan haastaa-artikkeli vielä tuntenut.
Sanakirjamääritelmän ongelmana on, ettei se voi olla kovin pitkä. Muutamalla sanalla, korkeintaan yhdellä virkkeellä on kuvattava kaikki olennainen. Sen vuoksi on usein karkeistettava ja pelkistettävä. Sellaiset selitykset kuin ”eräs kiitäjäperhonen” tai ”eräs varsinkin mäntymetsässä elävä käpylintu” voivat tuntua ylimalkaisilta, mutta niin on tarkoituskin: sanakirjassa ei ole tilaa niin laajaan lajinkuvaukseen kuin erikoisalan teoksessa eikä toisaalta vain muutaman piirteen mainitseminen riitä aina erottamaan suvun lajeja toisistaan. On myös muistettava, että sanakirja antaa tietoja nimenomaan sanoista. Jos haluaa tietää, minkänäköinen on isokäpylintu, kannattaa katsoa eläinkirjoista. Sanakirjasta sen sijaan voi tarkistaa, että isokäpylintu kirjoitetaan yhdeksi sanaksi ja sitä voidaan taivuttaa kahdella tavalla: joko isokäpylinnun : isokäpylintua tai isonkäpylinnun : isoakäpylintua.
Jos onkin ongelmia erikoistermien määritelmissä, niin hankalimpia selitettäviä ovat kuitenkin usein ne kaikkein tavallisimmat ja tutuimmat sanat. Aikaa ja paperia saattaa kulua, kun yrittää kuvata, mitä on vaikkapa juosta, istua, ajatella tai ottaa. Tai miten selittää esimerkiksi penkki niin, ettei määritelmä tuo mieleen tuolia eikä sohvaa mutta sopii toisaalta niin puistonpenkkiin kuin kirkonpenkkiinkin. Määritelmässä pitäisi olla mukana kaikki ne ominaispiirteet, jotka erottavat sanan merkityksen muiden sanojen merkityksistä, mutta yhtään ylimääräistä, turhaa piirrettä siinä ei saisi olla.
Monisanaisesti kuvailevan määritelmän sijasta jotkut sanat voidaan selittää myös samaa tai osittain samaa merkitsevien sanojen avulla. Tällöin on vain pidettävä huoli siitä, ettei jäädä kiertämään kehää sanojen välille, vaan että ainakin jokin annetuista vastineista on selitetty perusteellisemmin omalla kohdallaan. Alussa mainittu kuohkea-sana on selitetty juuri tällaisten osittain samaa merkitsevien sanojen avulla. Kuohkea on – sanakirjan sanoin ja käsillä näyttämättä – ’huokoinen, ilmava, möyheä, pöyheä’.