Perché Lingue E Dialetti - Queste Sono Cose Completamente Diverse - Visualizzazione Alternativa

Perché Lingue E Dialetti - Queste Sono Cose Completamente Diverse - Visualizzazione Alternativa
Perché Lingue E Dialetti - Queste Sono Cose Completamente Diverse - Visualizzazione Alternativa

Video: Perché Lingue E Dialetti - Queste Sono Cose Completamente Diverse - Visualizzazione Alternativa

Video: Perché Lingue E Dialetti - Queste Sono Cose Completamente Diverse - Visualizzazione Alternativa
Video: TRADUCO il VOSTRO DIALETTO! 2024, Potrebbe
Anonim

Spesso le domande semplici hanno risposte complesse. Ad esempio: qual è la differenza tra lingua e dialetto? Se decidi di chiedere informazioni a un linguista, siediti. Sebbene a prima vista non ci sia nulla di difficile in questa domanda, è possibile rispondere in modi diversi.

La distinzione tra lingua e dialetto può dipendere da un punto di vista o da un altro. Da un punto di vista politico, la lingua è ciò che la gente di solito parla come nazione. Ad esempio, dal 1850 al 1992 esisteva la cosiddetta lingua serbo-croata, che includeva diversi dialetti, tra cui serbo, croato e bosniaco. Ma dopo che la Jugoslavia si è divisa in diversi stati indipendenti a metà degli anni '90, questi dialetti sono stati riconosciuti come lingue separate. Questa definizione politica funziona in parte, sebbene porti con sé più problemi che soluzioni: ci sono lingue parlate in diversi paesi, un esempio lampante di questo è lo spagnolo in America Latina. Nessuno sosterrebbe che lo spagnolo messicano e lo spagnolo colombiano siano lingue diverse. Possibilmente spagnolo, parlato in alcune parti della Spagna,così diverso dalle sue varietà latinoamericane che merita di essere definito una lingua separata, ma questo non è del tutto chiaro.

Ma cosa succede se tracciamo il confine tra lingua e dialetto, guidati dal criterio della comprensione reciproca? Sfortunatamente, neanche questo approccio è l'ideale. Un danese capirà lo svedese un po 'meglio di quanto uno svedese capirà il danese. Allo stesso modo, una persona che parla il peculiare dialetto contadino dell'inglese britannico capirà un americano di Los Angeles molto meglio di un americano. La comprensione reciproca dipende spesso da fattori esterni - sono una variabile piuttosto incontrollabile - e non da proprietà intrinseche della lingua stessa.

Quindi forse dovremmo adottare un approccio puramente linguistico. Immagina di poter misurare sistematicamente la differenza (D) tra due varianti del parlato. Il significato specifico di D ci permetterebbe quindi di definire il confine tra due dialetti e due lingue. Trovare un tale valore non dovrebbe essere molto difficile, poiché le due lingue possono essere confrontate secondo molti criteri, come l'inventario del suono, le caratteristiche grammaticali o il vocabolario.

Ma cosa succede se le differenze tra le variazioni del discorso sono graduali e la probabilità di trovare un dato valore di D è pari alla probabilità di trovare qualche altro valore? Allora dovremmo scegliere un valore arbitrario di D come punto di partenza, e un valore arbitrario ci riporterebbe a considerazioni di natura politica o pratica che non intendevamo considerare. Vogliamo che la nostra linea di rottura sia al livello in cui serbo e croato sono lingue diverse o una? Catalogando le lingue del mondo, quante migliaia di lingue vogliamo consegnare all'oblio: cinque? O sette? Forse diecimila?

Negli ultimi anni sono stati superati due principali ostacoli alla distinzione tra lingua e dialetto. Il primo è come misurare le differenze tra le varianti del discorso, ovvero trovare un valore per D. Nel 2008, un gruppo di linguisti ha creato l'Automated Similarity Judgment Program (ASJP), un curatore quotidiano e fondatore del quale è veramente tuo. L'ASJP ha preparato meticolosamente un set di dati di confronto linguistico sistematico che attualmente contiene 7655 elenchi di parole. Sono rilevanti per due terzi delle lingue del mondo, assumendo che, per i nostri scopi, le lingue siano definite dal codice standard ISO 639-3. Poiché ogni elenco di parole contiene un insieme fisso di 40 concetti interpretati in modo coerente, è facile confrontarli e quindi ottenere una misura della differenza. La misura della differenza più comunemente usata tra due parole è la distanza di Levenshtein, un termine che prende il nome da Vladimir Levenshtein, uno scienziato sovietico che nel 1965 ha sviluppato un algoritmo per confrontare due stringhe di caratteri. Ha definito "spaziatura" il numero minimo di sostituzioni, inserimenti e cancellazioni necessarie per trasformare una riga in un'altra. La distanza di Levenshtein può essere utilmente divisa per la lunghezza della più lunga delle due linee, e quindi mettere tutte le distanze su una scala da 0 a 1. Questo fenomeno è noto come distanza di Levenshtein normalizzata, o LDN. Ha definito "spaziatura" il numero minimo di sostituzioni, inserimenti ed eliminazioni necessarie per trasformare una riga in un'altra. La distanza di Levenshtein può essere utilmente divisa per la lunghezza della più lunga delle due linee, e quindi mettere tutte le distanze su una scala da 0 a 1. Questo fenomeno è noto come distanza di Levenshtein normalizzata, o LDN. Ha definito "spaziatura" il numero minimo di sostituzioni, inserimenti e cancellazioni necessarie per trasformare una riga in un'altra. La distanza di Levenshtein può essere utilmente divisa per la lunghezza della più lunga delle due linee, e quindi mettere tutte le distanze su una scala da 0 a 1. Questo fenomeno è noto come distanza di Levenshtein normalizzata, o LDN.

Il secondo ostacolo è che forse "lingua" e "dialetto" sono concetti che possono essere definiti solo in ordine arbitrario. Ecco alcune notizie molto incoraggianti per te. Se guardiamo a tutte le famiglie linguistiche nel database ASJP, dove i partecipanti al progetto hanno incluso una proporzione significativa di varietà strettamente correlate, possiamo iniziare a cercare diversi tipi di comportamento di lingue e dialetti. Davanti a noi si presenta un'immagine intrigante: le distanze, di regola, fluttuano intorno a un valore relativamente piccolo o attorno a un valore relativamente grande e tra di loro si forma una depressione. A quanto pare, molto spesso questo minimo si trova in un intervallo ristretto, con una media di circa 0,48 LDN. Non sbaglieremo se diciamo che le varianti del linguaggio tendono a non essere parzialmente simili tra loro nel loro vocabolario di base. O c'è una tendenza verso una maggiore somiglianza, nel qual caso le varianti del discorso possono essere definite come dialetti diversi, o una minore somiglianza, nel qual caso possono essere attribuite a lingue diverse. È qui che si trova il confine tra lingua e dialetto.

Questo fenomeno è probabilmente il risultato di circostanze sociali. I dialetti divergono quando le persone si stabiliscono in nuovi territori e formano nuove identità, ma se c'è ancora qualche contatto tra di loro, la convergenza può avvenire in modo tale che le varianti del riguarda una lingua). Tuttavia, una piccola spinta verso la divergenza può far sì che le varianti linguistiche divergano relativamente rapidamente, aumentando la distanza di Levenshtein, nel qual caso possiamo qualificarle come lingue separate. Potrebbe esserci una relazione tra il confine per le distanze tra le parole nell'elenco standard utilizzato da ASJP e le distanze corrispondenti in altre parti della struttura linguistica, che può portare a una grave perdita di comprensione. In altre parole,la soglia della comprensione può essere correlata alla soglia tra lingue e dialetti. Non abbiamo ancora studiato questo problema, ma come oggetto di ricerca è estremamente interessante.

Video promozionale:

Essendo arrivati a un criterio oggettivo piuttosto che arbitrario per separare le lingue dai dialetti, possiamo applicarlo alle lingue del mondo. Alcune coppie di varietà linguistiche che sono considerate lingue nazionali, come bosniaco e croato, sono ben al di sotto della soglia LDN di 0,48 (il che significa che sono la stessa lingua indipendentemente dall'esistenza della Jugoslavia). Non lontano da questa soglia ci sono lingue come l'hindi e l'urdu (difficilmente possono essere definite due lingue diverse). E le varietà di arabo e cinese, che sono spesso viste come le stesse lingue, salgono sopra LDN = 0,48 (queste varietà sono lingue separate). Esistono infatti diverse coppie di varietà che di solito vengono considerate lingue diverse ma fluttuano al confine: ad esempio, danese e svedese, che hanno un LDN di 0,4921.

Infine, una tecnica derivata dai set di dati, chiamata cronologia ASJP, può essere applicata per stabilire la quantità di tempo necessaria ai dialetti per distanziarsi abbastanza da essere considerati lingue separate. Il risultato che abbiamo trovato è di 1059 anni, se non si tiene conto di qualche errore. Questi risultati sono supportati dal tempo che di solito impiega il linguaggio generico di una famiglia linguistica a suddividersi in lingue figlie, che in seguito diventano gli antenati delle sottofamiglie. Per questo abbiamo bisogno di altri metodi di analisi, ma i risultati sono simili: ci vuole circa un millennio per trasformare i dialetti in lingue. Lo sappiamo perché ora possiamo distinguere l'uno dall'altro.

Søren Wichmann è un linguista danese che collabora con l'Università di Leiden (Paesi Bassi), l'Università Federale di Kazan (Russia) e l'Università Linguistica di Pechino (Cina). Il suo ultimo libro, Temporal Stability of Linguistic Typological Features (2009), è stato scritto in collaborazione con Eric W. Holman.

Raccomandato: