Att singla slant, varsebli avvikelser och att lära sig språk
Låt oss tänka oss att ett eftertänksamt barn lär sig svenska som första språk. I något sammanhang noterar han att en viss typ av ord ibland slutar på -de och ibland på -er.
Naturligtvis försöker barnet lista ut när vilken form skall användas. Det kanske råkar sig så att alltid när barnet hör "slänger", då är den som omtalas närvarande, och när det hör "slängde" då är den omtalade inte närvarande. En bra hypotes vore kanske '-er används när göraren är närvarande, -de när hen inte är det'.
Med tiden borde barnet råka ut för exempel som motvisar hypotesen: personer som gjorde något närvarar, person som gör något frånvarar.
Men... tänk om omständigheternas nyck aldrig ger ett motexempel. Hur säker kan man vara på att man inte råkar ha samma otur som barnet i scenariet ovan?
Naturligtvis menar jag inte att någon gjort just det misstaget. Men vi kan ställa samma fråga om betydelsen hos varje ord i ordförrådet, om varje detalj i grammatiken, om uttalet av ord som stavas på märkliga sätt eller vars betoning avviker från det normala i någon region.
I medeltal är ordförrådets storlek någonstans mellan 20 000 och 50 000 ord. Tänk dig att sannolikheten att tillfälligheterna spelar dig ett spratt kring betydelsen hos ett ord (eller en konstruktion) är ett på tusen. Då vore väntevärdet att du har lärt dig mellan tjugo och femtio ord fel. Vi vet inte vad sannolikheten är, men det tycks mig rätt rimligt att den verkliga andelen är större än ett på tusen. Nu är dock inte hur många som är fel det viktiga, utan ... hur skall vi gå till väga för att säkerställa att vi inte har några fel?
Man kan ha missförstått ett ords betydelse på flera sätt:
- För snävt. Man har förstått "verktyg" så att det enbart innefattar sådant som hantverkare använder.
- För vitt. Man har förstått "potatis" så att det innefattar alla sopprötter.
- För snävt och för vitt samtidigt. Snett? Man har förstått "personbil" så att det innefattar "mopedbil" men utesluter "sportbil".
- Helt fel. Man har blandat ihop "llama" och "gnu". Här kommer oftast någon slags likartad betydelse ändå att finnas, men ibland kan lite grövre missförstånd förekomma (t.ex. då att man gissat att ett fransktklingande ord betecknar en möbel eller ett klädesplagg, när det egentligen är en typ av klinga.)
Felkällor
När vi lär oss ett ord genom att se hur det används har vi ingen aning huruvida den som använder det använder det korrekt.
Vi har heller ingen aning hur pass maximal eller minimal betydelseräckvidd talaren använder - vi vet inte nödvändigtvis hur stora eller små ting som kan kallas 'ask'. När du första gången hörde ordet 'tak' var du knappast genast helt säker på att det betecknar både rummets övre insida samt husets yttre ovansida. Dörr - är det bara själva dörrbladet, är det hålet, är det dörrkarmen? Här finns olika åsikter hos olika talare!
Vi vet ungefär vad som avsågs - oftast räcker det väl nog - men ur det kan vi sällan härleda exakt hur mycket som ingår i begreppet. Det är lätt hänt att vi drar en alltför snäv eller vid slutsats.
Hur upptäcker vi sådana fel? Det finns några sätt:
- Genom att upptäcka att någon använt ordet på ett sätt som inte stämmer överens med vad vi tror om ordets betydelse. (Denna eventualitet kan på sin höjd korrigera om vi har en helt felaktig eller en för snäv definition.)
- Genom att korrigeras av någon som upplever att vi använt ordet fel. (Detta kommer oftast att korrigera en alltför vid betydelse, eller helt felaktig definition. Om vi inte rakt ut säger något i stil med "ja men, det där är ju inte en chiffonjé" och får svaret "det är det visst det".)
- Slå upp ord i ordböcker eller stöta på det i någon mera definitionsorienterad kontext (exempelvis då dessa återkommande quizzar om ords betydelser).
Naturligtvis gäller samma förhållande för små detaljer i ett ords grammatik, speciellt då dess valens: kan man utrymma endast personer från en plats, eller platser på personer, eller går båda?
I flera av dessa fall torde det vara rätt uppenbart att man kan leva rätt länge utan att råka ut för en situation där man inser att åtminstone en annan person har en annan uppfattning huruvida 'floden' kan stå som subjekt vid 'floden avlagrar sand', eller om det enbart är sanden som avlagrar sig, eller huruvida allt brännvin är vodka och all vodka är brännvin.
För att resonera lite mera om detta behöver vi börja göra matematik av det.
Låt oss tänka att sannolikheten, när ett ord är fel, att någon inser att du med det faktiskt sagt något fel - du har talat om en möbel som du minns från barndomen - en pigtittare, men var och en som har lyssnat har tänkt sig en chiffonjé, för det är ordet du använde. Felet blir inte fångat. För att felet skall fångas upp måste kontexten ge tillräckligt med information. Låt oss vara vänliga och säga att det rör sig om 30% sannolikhet varje gång du använder ett ord.
Jag vill förklara varför jag väljer ett så pass lågt tal:
- Ofta ger vi förvånansvärt lite information när vi talar. Det minimala nödvändiga, s.a.s.
- Ett litet ovanligare ord tenderar inte att dyka upp jämt fördelat genom alla diskussioner: det kommer att förekomma flitigare i en diskussion, mindre flitigt i en annan. Men i en diskussion kommer informationen att öka vartefter; för varje användning i en diskussion minskar sannolikheten att felaktiga definitioner går ospårade vartefter. Låt oss tänka oss att sannolikheten att du skall upptäcka ett fel för varje gång ordet sägs är 30%. Säger du ordet två gånger är sannolikheten 0.7*0.7=0.49 att det går oupptäckt. En tredje gång? 65% sannolikhet att det upptäcks! Fjärde gången? Nästan 80% att det upptäcks!
Ett ord där vår definition överlappar, omsluter eller innesluts av den riktiga definitionen kommer inte att vara fel varje gång. Låt oss anta att för varje felaktigt ord av dessa typer gör vi misstag var fjärde gång.
Så, 25% av gångerna är felaktiga, och 30% av de gångerna har lyssnaren möjligheten att snappa upp att det är felaktigt. Sannolikheten att en feldefinition upptäcks är nere på 7.5%!
Hur många gånger måste vi säga ett ord för att vara 95% säkra att vi faktiskt använder det korrekt?
Detta är analogt med hur många gånger måste vi singla en slant för att vara 95% säkra på att den är "rättvis", men vi måste korva om matematiken lite.
För att få en situation där det rör sig om 50/50 att felaktigheter uppdagas om de finns, måste vi säga ordet ungefär 10 gånger - 10 gånger motsvarar alltså en slantsingling. För att vara 95% säkra på detta behöver vi använda ordet ungefär 3850 gånger. Hälften av gångerna använder vi avsiktligen ordet på ett sätt vi tror är fel, hälften rätt.
Vi vet inte på förhand vilka ord vi har fel definition eller grammatik för. Vi antar att vi har 50 000 ord men att de 10 000 mest frekventa är någorlunda korrekta; vi har isåfall 40 000 lågfrekventa ord som vi borde få testat åtminstone två gånger per ord i en konversation, d.v.s. 40 000 * 3850 gånger för att verifiera att vårt ordförråd är korrekt. Och detta borde göras åt båda hållen (d.v.s. försöka identifiera både om det är för brett eller snävt). Det är svårt att testa om våra ord är för snäva - vi behöver ungefär 40 000 utlåtanden av stilen "men det här är ju inte en pigtittare" (och då angående något som är snudd på att passa i kategorin). Alternativt behöver andra människor använda dessa 40 000 ord på sätt som utgår ifrån en vidare betydelse än den vi utgått från.
40 000 * 3850 är 154 000 000. Med normalt antal dagliga ord rör det här sig om ungefär 15 400 dagar innan man sagt så många ord. MEN! En stor del av de ord man säger på 15 400 dagar utgörs av de 10 000 vanligaste orden i svenskan (i, att, på, är, som, och, har, de, en, för, om, med, ska, till, inte, säger, den, men, jag, kan eller av kommer att ha en näst intill orättvist stor del av kakan). Enligt Zipfs lag kommer de tiotusende till femtiotusende vanligaste orden tillsammans att vara ungefär en sjättedel så frekventa som de tiotusen vanligaste orden. Med andra ord borde vi ha en sex gånger längre tid för att lyckas med detta*. Problemet är att 15 400 dagar rör sig runt 42 år. Få av oss har (o?)turen att leva 252 år.
Det finns tiotusentals ord där vi kan ha fel. Vi bär troligen hundratals felaktiga definitioner i våra huvuden, felaktigheter som vi aldrig haft tillfälle eller orsak att korrigera. Likväl fungerar språket rätt bra - trots att det alltså finns miljarder felaktiga orddefinitioner i svenskars huvuden. Vill man säkerställa att man inte har några fel utsätter man sig själv för ett omotiverat Sisyfosarbete.
En situation där varenda en kan den korrekta definitionen för varje ord de tror sig kunna är ouppnåelig. Likväl fungerar språket.
Jag har i denna essä valt uppskattningar som känns "orealistiskt" optimistiska. Likväl tvingar matematiken summorna att skena iväg. I verkligheten tror jag inte att man skulle kunna verifiera varje ord i ett helt ordförråd till 95% säkerhetsnivå på mindre än 10 000 år.
* Notera: detta är en grav underskattning, eftersom även nr 10 000 till 20 000 står i liknande förhållande till 20 001 till 50 000, etc. Men i det här skedet blir exakta siffror irrelevanta. Min inexakta matematik leder till en underskattning av den tid det kommer att ta. 250 år räcker inte. Påminn mig år 2250 om min slarviga matematik.
Comments
Post a Comment