Norsk til liks med til dømes tysk, svensk og dansk er eit språk med eit prinsipielt uendeleg ordtilfang. Språksystemet vårt legg nemleg til rette for at vi nesten utan måtehald kan lage nye ord av dei orda me har frå før. Kva har dette å seie for dei som prøver å kartleggje det norske ordtilfanget, nemleg leksikografane?
Av Mikkel Ekeland Paulsen, forskar og leksikograf ved Universitetet i Bergen
Ein leksikograf er kort sagt ein ordbokforfattar. Til skilnad frå språk er ordbøker ein type ting som har eit avgrensa omfang. Dette vil seie at ikkje heile språket kan få plass i boka – sjølv om ho er digital.

Om eg skal på ferie, kan det vere at eg treng noko god ferielektyre, som eg til dømes kan pakke i feriesekken min saman med ferieklede, feriesko og anna ferieutstyr. Vidare må eg sjekke at eg har godt med feriepengar, ferieplanar og feriemusikk. Ein som ferierer, treng gjerne mange ferieord til ferien sin. Men spørsmålet er kor mange ferieord ei ordbok treng.
Svaret på dette spørsmålet vil naturleg nok variere avhengig av kva type språk den aktuelle ordboka har til føremål å skildre – og for kven. Om me tek allmennordbøker à la Bokmålsordboka og Nynorskordboka som utgangspunkt, kan me omformulere spørsmålet til kor mange ferieord som er tilstrekkeleg etablerte i det sentrale og moderne norske ordtilfanget, og kor mange av desse igjen ein språkinnlærar, ungdomsskuleelev, byråkrat i embetsverket eller omsetjar er truande til å søkje informasjon om. At ordet er etablert, tyder veldig kort sagt at ein viss andel språkbrukarar er relativt vande med å bruke eller høyre det.

Etablering er viktig for å skilje mellom gode og dårlege ordbokord. Etablering lyt faktisk vere eit kriterium for alle ord som kjem inn i ordboka. Ein viktig grunn til dette er at ordbøker som Bokmålsordboka og Nynorskordboka har til hensikt å skildre språket, ikkje lage det. Ordboka skal innehalde dei orda folk brukar allereie, ikkje innføre ord som få eller ingen brukar. Alle ferieorda eg nemner ovanfor, er moglege ord i norsk. Men dette tyder ikkje at alle kan seiast å vere etablert inventar i typisk eller vanleg språkbruk, og at ein heilt saumlaust kan bruke dei i alminnelege samtalar.
Ei side av etableringa er kor innarbeidd sambandet mellom eit språkleg uttrykk, til dømes eit ord, og eit omgrep er. Om me tenkjer oss omgrepet ‘musikk ein høyrer på i ferien’, kor sjølvsagt er det at ein som les eller høyrer ordet feriemusikk får fram nett denne forståinga av ordet? Og andre vegen – kor sjølvsagt er det at ein vel å bruke ordet feriemusikk om dette omgrepet? Dersom begge delar er ganske sjølvsagte, eller i det minste vanlege, kan ein seie at det finst eit konvensjonelt samband mellom ordet og omgrepet. Dette tyder at folk, gjerne utan medvit om det, er relativt samde om at me kan bruke feriemusikk når me skal peike på omgrepet, og at det er nett dette omgrepet me peikar på når me brukar ordet feriemusikk. Feriemusikk kan sjølvsagt òg nyttast for å peike på andre omgrep, til dømes ‘musikk ein komponerer i ferien’, eller ‘musikk som dei speler på typiske feriestader’. Så lenge ordet kan seiast å ha eit konvensjonelt samband med minst eitt omgrep, vil det ha ein rettkomen sjanse til å bli innlemma i ordboka.

Ei anna side av etablering er kor utbreidd sambandet mellom eit ord og eit omgrep er. Er feriemusikk gjengs blant språkbrukarar flest, eller blir det nytta kun innanfor mindre kretsar? Innanfor språkvitskapen nyttar me ofte ordet samansetningsfuge for å peike på omgrepet ‘orddel som står mellom dei to ledda i ei samansetning’ (slik som den midtre s-en i samansetningsfuge). Mellom språkvitarar finst det altså ei semje om sambandet mellom samansetningsfuge og det aktuelle omgrepet. Men denne semja finst truleg ikkje i alle delar av språksamfunnet. I slike høve må ein vurdere om ordethar ein stor nok plass innanfor det avgrensa feltet språkvitskap, og om språkvitskapen har ein stor nok plass innanfor språksamfunnet til at ordet fortener ordbokføring. Eg kan avsløre at ordbøker historisk har vore ganske rause med språkvitskaplege termar, men akkurat ordet samansetningsfuge har ikkje kome inn korkje i Bokmålsordboka eller Nynorskordboka.
Ei tredje side er kva samansette ord ordbokbrukarar har behov for å få informasjon om. Her er det relevant å ta omsyn til kor gjennomsiktige dei samansette orda er. Gjennomsiktigheit dreier seg grovt sagt om kor mykje tolkingshjelp forma til ordet gjev. Om ein er kjent med omgrepa eple og kake, vil ein sannsynlegvis ha lite problem med å tolke kva ordet eplekake tyder, jamvel om ein aldri har ete eplekake før. Kva så med blautkake? Er det kort og godt ei blaut kake? Er no eigentleg blautkaker blautare enn andre kaker?

Endå verre vert det truleg med kukake og morkake. Ein kan understreke kor ugjennomsiktige desse orda er med å omsetje dei direkte til eit anna språk:
- «Would you like a piece of wetcake?»
- «Oh no! I just stepped in a cowcake!»
- «Now it is time to remove the mothercake.»
For ein som veit tydinga på førehand, gjeld det berre å hugse sambandet mellom ord og omgrep. For ein som ikkje veit det, er forma til orda truleg utilstrekkeleg for å identifisere rett omgrep.
Så kor mange ferieord treng til dømes Nynorskordboka? Lat oss byrje med å undersøkje etableringa. Dette kan me få ein idé om gjennom å søkje etter orda i store tekstsamlingar. Om ordet ser ut til å bli brukt ofte eller mange gongar, er dette eit teikn på at ordet er etablert i språket.

Om me tek utgangspunkt i tekstsamlinga Leksikografisk bokmålskorpus, som inneheld mange tekster frå ulike sjangrar, kan me registrere følgjande tal: Feriepengar er den mest brukte feriesamansetninga. Denførekjem 319 gongar, hovudsakleg i sakprosa. Ferieplan førekjem 15 gongar, fordelt på aviser, sakprosa, skjønnlitteratur og undertekster frå TV-program. Ferielektyre har berre ein einaste førekomst. Dei andre ferieorda eg nemnde i starten, finst ikkje i Leksikografisk bokmålskorpus. Frå dette kan ein slutte at feriepengar ser ut til å vere temmeleg etablert, ferieplan har kanskje ei viss etablering, medan dei andre ser ut til å vere heilt uetablerte.
Vidare kan me påpeike at feriepengar har ei meir spesialisert tyding enn berre «pengar ein brukar i ferien». Snarare peiker feriepengar på ei særskild sum pengar som arbeidstakarar tener opp gjennom lønsarbeid, og som er knytt til ei spesifikk lov (ferieloven). Såleis kan ein ikkje forklare kva feriepengar tyder utan å ta i bruk ein rekke andre avanserte ord og omgrep. Dette er eit klart teikn på låg gjennomsiktigheit. Ferieplan verkar på si side å bli brukt i tydinga «plan for kva ein skal gjere i ferien». Her vil eg påstå at ein får atskilleg meir tolkingshjelp av forma til ordet ferieplan. Dei andre ferieorda treng ein ikkje vurdere gjennomsiktigheita til, for om dei ikkje er brukte skal dei ikkje inn i ordboka uansett. Eit ord har dessutan inga klar tyding om det ikkje er i bruk. Og om det ikkje har ei klar tyding, har ein inga tyding å vurdere gjennomsiktigheita til.

Så kor mange ferieord treng ordboka? Per no inneheld Nynorskordboka 20 samansetningar med ferie- som føreledd, mellom anna feriepengar og ferieplan. Det er ikkje sikkert at dette er nokon gullstandard, men det er i alle fall grunn til å tru at feriepengar er eit etablert ord i norsk, og at både etableringa og ugjennomsiktigheita gjer feriepengar til eit ord som ordbokbrukarar er truande til å søkje informasjon om. Orda feriesekk, feriemusikk og ferieklede er på si side for uetablerte til at dei er særskild nyttige for andre enn dei ferierande.
For å oppsummere kan ein slå fast at grad av etablering og gjennomsiktigheit er sentrale verktøy for å avgrense ordmengda i ei ordbok. Om eit samansett ord manglar i Bokmålsordboka og Nynorskordboka, tyder dette ofte at det berre har lågare etablering og er meir sjølvforklarande enn ein del av dei orda som er med. Det tyder på ingen måte at ordet ikkje kan brukast, eller at det ikkje er eit ekte ord. For den einaste måten eit ord kan kome inn i ordboka på, er nemleg ved å bli brukt.
Vil du vite meir?
Om du vil kike litt i tekstsamlinga eg viste til ovanfor, Leksikografisk bokmålskorpus, kan ein få tilgang gjennom Humit ved Universitetet i Oslo.
Om du er meir interessert i kva kriterium som styrer samansetningsutvalet i norske ordbøker, har eg skrive ei heil avhandling med dette temaet: Paulsen, M. E. (2024) Å skille klinten fra hveten. Hvordan kan ordbokaktuelle ord identifiseres?. Doktorgradsavhandling: Universitetet i Bergen.
Om du vil vite meir om ulike sider av ordas etablering og korleis dette heng saman med bruken av orda, kan eg tilrå boka The Dynamics of the Linguistic System (2020) av Hans-Jörg Schmid, Oxford University Press.
Om du vil lese meir om etablering av samansette ord, kan eg tilrå denne teksten av Jan Svanlund: Lexikal etablering: En korpusundersökning av hur nye sammansättningar konventionaliseras och får sin betydelse (2009), Stockholms universitet, < >
Om du vil få eit større innblikk i den mangslungne semantikken til samansetningar, vil eg tilrå to artiklar av professor i russisk, Tore Nesset, i Maal og Minne og ei avhanding av Eli Anne Eiesland:
Nesset, T. (2011). Metafor og metonymi: personkarakteriserende sammensatte substantiv i norsk. Maal og Minne, 101(1), 32–64.
Nesset, T. (2017). Spøkelsesfiske, makrellfotball og traktoregg: norske sammensetninger og konseptuell integrasjon. Maal og Minne, 108(2), 85–110.
Eiesland, E.A. (2015). The Semantics of Norwegian Noun-Noun Compounds: A corpus based study. Doktoravhandling: Universitetet i Oslo.
