Tuesday, April 23, 2013

Språkkomplexitet

Språk och komplexitet - ett perspektiv

Det är mycket vanligt bland folk som inte vet särdeles mycket om språk att tänka sig att olika språk har vilt olika mängd grammatik. Det är lätt att tänka sig att folk på söderhavsöar, i den afrikanska regnskogen eller i Amazonas inte behärskar någon knepig grammatik, och att grammatik är resultatet av kulturell utveckling - något som högkulturer i stil med Rom, Grekland, det moderna Europa och Japan kunnat utveckla, medan folk som bott i hyddor inte uppnått samma avancerade språkliga stadium. 

Det finns några intressanta fakta kring detta, och några mer metodologiska problem vars inflytande man inte nödvändigtvis inser även om man lärt sig ett flertal språk någorlunda väl. I Europeisk tradition har latinet och grekiskan haft något av en särställning - till och med språk som finskan har indirekt påverkats av latinets grammatiska tradition genom att språkstandardiseringen på 1800-talet tog latinet som en viktig förebild.

Förvisso har många språk i Europa gått genom ett medvetet design-skede, där t.ex. Svenska Akademien och dylika organisationer planerat och utvecklat detaljer i sina språk. Men även där som denna planering inte har skett har språken klarat av att hantera den moderna världens behov, och ett av de större språk i Europa som undgått en centraliserad planering är engelskan - idag världens lingua franca!

De som har gått latin eller grekiska - eller för den delen ryska eller finska - har lätt att tänka sig att grammatik är formlära. Det är lätt att tänka sig formläran som en betydande del av grammatiken - speciellt eftersom så mycket av exempelvis finskainlärningen (eller för den delen latin, grekiska eller biblisk hebreiska) handlar om att tillägna sig en mängd former.

Formlära är också enkel att illustrera: man lägger fram en tabell i stil med (hoppa över den här när ni läser, storleken på tabellen är det relevanta)
talo - talon - taloa - taloja
(ett hus - husets - ett hus/något hus - några hus/ husen
talo|-n  taloj|-a
talossa taloissa (i huset | i husen)
talosta taloista (ur huset| ur husen)
taloon taloihin (in åt ...)
talolla taloilla (på ...)
talolta taloilta (från ...)
talolle taloille (till ...)
taloksi taloiksi (till att vara, att bli ...)
talona taloina (varandes, såsom, i rollen av ...)
...

eller för den delen verb-paradigmet:
syödä - syön - söi - syönyt (äta, jag äter, jag åt,  ~ätit)
syön, söin, en syönyt, ... (jag äter, jag åt, jag åt inte)
syöt, söit, et syönyt ... (du äter ...)
hän syö, hän söi, hän ei syönyt ...
syömme, söimme, ette syöneet ...
syötte, söitte, emme syöneet ...
he syövät, he söivät, ei syöneet ...

participer
syövä, syötävä, syönyt, syöty (ätande, som ätes, som åt, äten)
syövän, syötävän, syöneen, syödyn (den ätandes, dens som ätes, den som åts, den ätnes)
syövää, syötävää, syönyttä, syötyä ...
syöviä, syötäviä, syöneitä, syötyjä
...

infinitiver
syö

syödessä, ...

syömä-, ...(ett ätande, ätandet...)

syöminen, syömisen, ...

.
.
.

Med lite mattesinne är det ännu enkelt att räkna ut att finskan har just precis väldigt många former. Om man tittar lite närmare kan man till och med sätta en siffra på substantivets eller verbets antal former, och sen vidare inser man att det finns sätt att ta fram nya substantiv och verb (och adjektiv) ur tidigare substantiv, verb eller adjektiv, och mitt i allt har man rejält stora siffror.

Jämför med kinesiskan vars substantiv och verb nästan helt saknar formlära. Ordet för hund är det samma oavsett om det är hunden som gör något, som görs något åt, som uttalandet i allmänhet bara råkar handla om, eller om den har någon preposition med sig.

Men hur jämför vi regler i stil med "dangling topics cannot be relativized"? Det finns inget snyggt sätt att lägga opp sådan grammatik - ofta stora mängder regler - i imponerande tabeller, och det är sannolikt att flera har svårt att ens förstå vad en sådan regel betyder ens om den beskrivs för dem - trots att denna regel följs av så gott som alla som talar mandarinkinesiska. Tyvärr ser det bara inte lika imponerande ut att rada upp en mängd sådana här regler - och här blir också storleken på reglerna svår att mäta: en skicklig analys kan troligen krympa antalet regler, men hur vet vi om språk A eller Bs analyser båda är maximalt komprimerade? Om vi jämför en bättre komprimerad analys med en mindre komprimerad analys kommer vi få en felaktig bild av vilket språk som har mera grammatik.

Som vi redan sett vinner finskan hands down över kinesiskan om vi är naiva och utgår ifrån formlära. Men låt oss fundera vidare över några kanske mera lättfattliga exempel kring grammatik. Vi går nu in i typologi - läran om enskilda språks egenskaper, och hur egenskaperna (statistiskt sett) tenderar att bilda liknande klungor i olika språk. Jag kommer dock enbart beskriva en dimension i språk - hur objekt markeras och särskiljs från subjekt. Det finns mycket mer komplikationer än jag beskriver här, t.ex. verkar inte subjektet som sådant finnas i alla språk, medan objekt troligen nog finns.  Vissa språk verkar också flytta vissa saker som vi gärna tänker oss som subjekt till att vara objekt. Vi struntar nu helt kallt i sådana komplikationer.

Många språk markerar objekt och subjekt på sätt jämförbara med finskan - Latinet och Grekiskan, till exempel, gjorde så i alla genus utom neutrum. Att neutrum-ord var undantagna beror troligen på det att neutrer oftast var icke-levande, och därför sällan sågs som subjekt i handlingar, och därmed var de sannolikt objekt även om man inte böjde dem i objektform. Liknande gäller i ryskan.

Andra språk - exempelvis svenska och engelska, men också kinesiska, markerar subjekt och objekt närmast genom ordföljd. Engelskan och svenskan har dock kvar spår av det tidigare systemet i sina pronomen: du vs. dig, vi vs. oss. Svenskan kan i och för sig vända ordföljden på ett sådant sätt att det ibland inte är möjligt på basen av ordföljden att avgöra vilkendera som är subjekt (särskilt om båda är substantiv snarare än pronomen), men ofta finns det semantiska eller kontextuella orsaker att tolka ena eller andra vägen. Samma gäller i de fall där ryskan, latinet eller grekiskan inte har objektskasus på någondera substantivet.

Kasus i modern lingvistik är inte nödvändigtvis ändelser heller - man har insett att prepositioner (och postpositioner, och även andra -positioner av märkligare slag) inte i sin funktion eller art nödvändigtvis skiljer sig på något grundläggande sätt från kasus.

Men detta är inte enda sättet, och i någon mån finns ett annat sätt delvis i användning i Europa också. Man kan markera vilket som är subjekt (eller för den delen objekt, eller båda) på verbet. I de europeiska språk som har verbkongruens hjälper detta endast om subjektet och objektet skiljer sig åt i person eller antal, utom i en del slaviska språk och dylikt där t.ex. verbet markerar subjektets genus i förflutna tidsformer.

Detta hjälper dock endast om subjektet och objektet är av olika genus - vilket ju bara förbättrar situationen lite. Ju fler genus ett språk har, desto mindre är dock risken att de sammanfaller, och i bantuspråken finns ofta rika genussystem. Verbet brukar i dessa markera flera olika funktioner med ett prefix som kodar för subjektets, objektets, det indirekta objektets, etc, genus och numerus.

Vilket av dessa sätt är "mera" grammatik? Nå, nu har jag till och med lite förhastat mig, för det finns ännu ett alternativ! Det finns nämligen språk som inte använder något av ovanstående och vars talare ändå mycket väl identifierar subjektet och objektet i meningar!

Hur går detta till? Något förenklat kan man beskriva det som att det finns en hierarki. Ett substantiv högre i hierarkin är mera sannolikt subjekt än ett längre ner. Det finns orsak att tro att de indo-europeiska språkens anfader - c.a. 5000 år tillbaka eller så - delvis hade ett sådant system. Därav, till exempel, de två rätt olika orden för vatten i denna språkfamilj, det ena roten till vårt vatten och ryskans vod, det andra roten till Latinets aqua : det ena var lågt ner i hierarkin, och kunde därmed vara därmed subjekt i meningar utan objekt, men objekt i meningar med ett annat substantiv, medan det andra var högt i hierarkin.

Det är lätt att missa att något sådant ens finns under huven i ett språk man forskar ytligt, och lätt att påstå att ett språk fullt av sådana system "saknar grammatik". Men hur väger vi vilket av dessa grammatiska system som är mera när vi väl känner till att det existerar - ha i åtanke att subjekt och objekt är bland de första distinktioner man lär sig i skolgrammatiken, och därför också en som forskare lagt ner en hel del tid på att försöka förstå. Det är då inget att undra på att de funnit även sådana högst osynliga sätt att markera subjekt kontra objekt. Grammatik har ingen objektiv vikt, så det är svårt att avgöra vilket av ovanstående alternativ väger mer, men ännu värre är att dess viktlöshet gör att vi inte kan veta när vi kartlagt all grammatik som används i ett språk - till och med om vi kom på något mått för den grammatik vi känner till kan vi helt enkelt inte veta om vår uppskattning ens är nära vad som faktiskt i praktiken är i bruk i ett språk.

I något skede kommer jag beskriva kort några mycket komplicerade grammatiska system i språk från diverse ursprungsbefolkningar i Australien, Papua Nya Guinea, Amerika och Sibirien i inlägg här.

No comments: