Hvorfor Språk Og Dialekter - Dette Er Helt Forskjellige Ting - Alternativt Syn

Hvorfor Språk Og Dialekter - Dette Er Helt Forskjellige Ting - Alternativt Syn
Hvorfor Språk Og Dialekter - Dette Er Helt Forskjellige Ting - Alternativt Syn

Video: Hvorfor Språk Og Dialekter - Dette Er Helt Forskjellige Ting - Alternativt Syn

Video: Hvorfor Språk Og Dialekter - Dette Er Helt Forskjellige Ting - Alternativt Syn
Video: Jon og Håvard konkurrerer i norske dialekter | Praktisk info med Jon Almaas | discovery+ Norge 2024, Kan
Anonim

Ofte har enkle spørsmål komplekse svar. For eksempel: hva er forskjellen mellom språk og dialekt? Hvis du bestemmer deg for å spørre en språkforsker om dette, så len deg tilbake. Selv om det ved første øyekast ikke er noe vanskelig i dette spørsmålet, kan det besvares på forskjellige måter.

Skillet mellom språk og dialekt kan avhenge av et eller annet synspunkt. Fra et politisk synspunkt er språk det folk vanligvis snakker som en nasjon. Fra 1850 til 1992 eksisterte for eksempel det såkalte serbokroatiske språket, som inkluderte flere dialekter, inkludert serbisk, kroatisk og bosnisk. Men etter at Jugoslavia delte seg i flere uavhengige stater på midten av 1990-tallet, ble disse dialektene anerkjent som separate språk. Denne politiske definisjonen fungerer delvis, selv om den fører med seg flere problemer enn løsninger: det er språk som snakkes i forskjellige land, et slående eksempel på dette er spansk i Latin-Amerika. Ingen vil hevde at meksikansk spansk og colombiansk spansk er forskjellige språk. Muligens spansk, snakket i deler av Spania,så forskjellig fra de latinamerikanske variantene at den fortjener å bli kalt et eget språk, men dette er ikke helt klart.

Hva om vi trekker grensen mellom språk og dialekt, ledet av kriteriet for gjensidig forståelse? Dessverre er heller ikke denne tilnærmingen ideell. En dansker vil forstå svensk noe bedre enn en svenske - dansk. På samme måte vil en person som snakker den særegne bondedialekten til britisk engelsk forstå en amerikaner fra Los Angeles mye bedre enn en amerikaner. Gjensidig forståelse avhenger ofte av eksterne faktorer - de er en ganske ukontrollerbar variabel - og ikke av iboende egenskaper til selve språket.

Så kanskje vi bør ta en rent språklig tilnærming. Tenk deg at vi systematisk kan måle forskjellen (D) mellom to talevarianter. Den spesifikke betydningen av D vil da tillate oss å definere grensen mellom to dialekter og to språk. Å finne en slik verdi burde ikke være veldig vanskelig, siden de to språkene kan sammenlignes på mange kriterier, for eksempel lydbeholdning, grammatiske egenskaper eller ordforråd.

Men hva om forskjellene mellom talevariasjoner er gradvise og sannsynligheten for å finne en gitt verdi på D er like stor som sannsynligheten for å finne en annen verdi? Da måtte vi velge en vilkårlig verdi av D som utgangspunkt, og en vilkårlig verdi ville kaste oss tilbake til hensyn av politisk eller praktisk art som vi ikke hadde tenkt å vurdere. Ønsker vi at skillelinjen vår skal være på nivået hvor serbisk og kroatisk er forskjellige språk eller ett? Katalogisering av verdens språk, hvor mange tusen språk vil vi sende til glemsel: fem? Eller syv? Kanskje ti tusen?

De siste årene har to hovedhindringer for å skille mellom språk og dialekt blitt overvunnet. Den første er hvordan man skal måle forskjellene mellom talevarianter - det vil si finne en verdi for D. I 2008 opprettet en gruppe lingvister Automated Similarity Judgment Program (ASJP), en daglig kurator og grunnlegger av hvilken du virkelig er din. ASJP har møysommelig utarbeidet et systematisk språksammenligningsdatasett som for tiden inneholder 7655 ordlister. De er relevante for to tredjedeler av verdens språk, forutsatt at språk for våre formål er definert av ISO 639-3-standardkoden. Siden hver ordliste inneholder et fast sett med 40 begreper som tolkes konsekvent, er det enkelt å sammenligne dem og dermed få et mål på forskjellen. Det mest brukte målet for forskjell mellom to ord er Levenshtein-avstanden, et begrep oppkalt etter Vladimir Levenshtein, en sovjetisk forsker som i 1965 utviklet en algoritme for å sammenligne to tegnstrenger. Han definerte "avstand" som minimum antall erstatninger, innsettinger og slettinger som kreves for å transformere en linje til en annen. Levenshtein-avstanden kan med fordel deles med lengden på den lengste av de to linjene, og dermed sette alle avstander på en skala fra 0 til 1. Dette fenomenet er kjent som den normaliserte Levenshtein-avstanden, eller LDN. Han definerte "avstand" som det minste antallet erstatninger, innsettinger og slettinger som kreves for å transformere en linje til en annen. Levenshtein-avstanden kan med fordel deles med lengden på den lengste av de to linjene, og dermed sette alle avstander på en skala fra 0 til 1. Dette fenomenet er kjent som den normaliserte Levenshtein-avstanden, eller LDN. Han definerte "avstand" som det minste antallet erstatninger, innsettinger og slettinger som kreves for å transformere en linje til en annen. Levenshtein-avstanden kan med fordel deles med lengden på den lengste av de to linjene, og dermed sette alle avstander på en skala fra 0 til 1. Dette fenomenet er kjent som den normaliserte Levenshtein-avstanden, eller LDN.

Det andre hinderet er at kanskje "språk" og "dialekt" er begreper som bare kan defineres i vilkårlig rekkefølge. Her har vi noen veldig oppmuntrende nyheter for deg. Hvis vi ser på alle språkfamiliene i ASJP-databasen, der prosjektdeltakerne har tatt med en betydelig andel nært beslektede varianter, kan vi begynne å søke etter forskjellige typer oppførsel av språk og dialekter. Et spennende bilde oppstår foran oss: avstander svinger som regel enten rundt en relativt liten verdi eller rundt en relativt stor, og det dannes en depresjon mellom dem. Som det viser seg, ligger dette trau oftest i et smalt område med et gjennomsnitt på 0,48 LDN. Vi tar ikke feil hvis vi sier at talevarianter ikke pleier å være delvis like hverandre i sitt grunnleggende vokabular. Enten er det en tendens til større likhet, i hvilket tilfelle talevariantene kan defineres som forskjellige dialekter, eller mindre likhet, i så fall kan de tilskrives forskjellige språk. Det er her grensen mellom språk og dialekt ligger.

Dette fenomenet var sannsynligvis et resultat av sosiale forhold. Dialekter avviker når folk bosetter seg i nye territorier og danner nye identiteter, men hvis det fremdeles er noen kontakt mellom dem, kan konvergens finne sted slik at talevarianter forblir mer enn 50 prosent like (og derfor tale handler om ett språk). Imidlertid kan et lite skyv mot divergens føre til at språkvarianter avviker relativt raskt, noe som øker Levenshtein-avstanden, i så fall kan vi kvalifisere dem som separate språk. Det kan være en sammenheng mellom grensen for avstandene mellom ord i standardlisten som brukes av ASJP og de tilsvarende avstandene i andre deler av språkstrukturen, noe som kan føre til alvorlig tap av forståelse. Med andre ord,terskelen til forståelse kan korrelere med terskelen mellom språk og dialekter. Vi har ennå ikke studert dette problemet, men som et objekt for forskning er det ekstremt interessant.

Kampanjevideo:

Etter å ha kommet frem til et objektivt og ikke vilkårlig kriterium for å skille språk fra dialekter, kan vi bruke det på verdens språk. Noen par talesorter som regnes som nasjonalspråk, som bosnisk og kroatisk, ligger godt under LDN-terskelen på 0,48 (noe som betyr at de er det samme språket uavhengig av eksistensen av Jugoslavia). Ikke langt fra denne terskelen ligger språk som hindi og urdu (de kan knapt kalles to forskjellige språk). Og varianter av arabisk og kinesisk, som ofte blir sett på som de samme språkene, svever over LDN = 0,48 (disse variantene er separate språk). Faktisk er det flere par varianter som vanligvis betraktes som forskjellige språk, men som svinger på grensen: for eksempel dansk og svensk, som har et LDN på 0,4921.

Til slutt kan en teknikk avledet fra datasett, kalt ASJP-kronologi, brukes for å fastslå hvor lang tid det tar for dialekter å distansere seg langt nok fra hverandre til å bli ansett som separate språk. Resultatet vi fant er 1059 år, hvis vi ikke tar hensyn til noen feil. Disse funnene støttes av hvor lang tid det tar for det generiske språket til en språkfamilie å bryte opp i datterspråk, som senere blir forfedre til underfamilier. For dette trenger vi andre analysemetoder, men resultatene er like: det tar omtrent et årtusen å gjøre dialekter til språk. Vi vet dette fordi vi nå kan skille det ene fra det andre.

Søren Wichmann er en dansk språkforsker som samarbeider med Leiden University (Nederland), Kazan Federal University (Russland) og Peking Linguistic University (Kina). Hans siste bok, Temporal Stability of Linguistic Typological Features (2009), ble skrevet sammen med Eric W. Holman.

Anbefalt: