INTRODUCTION A LâINDO-EUROPEEN
Il a dĂ©jĂ Ă©tĂ© de nombreuses fois question dâĂ©tymologie et de comparaisons entre diffĂ©rentes langues sur ce blog, notamment lâĂ©tymologie latine dâun grand nombre de mots français, et le vocabulaire apparentĂ© en espagnol ou en italien. Nous avons Ă©galement tracĂ© lâĂ©volution du français depuis ses origines, et ce nâest donc pas un mystĂšre ou une information nouvelle : les langues Ă©voluent et changent au fil du temps ; tout comme les espĂšces biologiques, elles apparaissent, se dĂ©veloppent, et finissent par mourir, en laissant potentiellement derriĂšre elles une ou plusieurs descendances.
On peut alors regrouper le français, lâoccitan, lâespagnol, le catalan, le portugais, lâitalien et le roumain dans la famille des langues romanes, descendantes du latin ; ou bien lâanglais, lâallemand, le nĂ©erlandais, le danois, le norvĂ©gien, le suĂ©dois, lâislandais et le fĂ©roĂŻen dans la famille des langues germaniques. On peut ainsi sâamuser Ă faire dâautres regroupements entre diffĂ©rentes langues dâEurope en se basant sur leurs ressemblances et les traces historiques dâune origine commune.
La question de regrouper des langues de par leurs similitudes et leur passĂ© commun attestĂ© ou suggĂ©rĂ© ne date pas dâhier ; en effet si Aristote et Socrate ont dĂšs le Ve siĂšcle avant notre Ăšre Ă©mis lâhypothĂšse dâune Ă©volution linguistique avec modification par insertion, suppression, transposition et substitution de mots, sens et morphĂšmes, et si Giraud de Barri affirme au XIIe siĂšcle que le gallois, le cornique et le breton descendent dâune langue commune, le premier travail de grande ampleur a lieu au XVIe siĂšcle lorsque français Joseph Scaliger compare et remarque beaucoup de similitudes sur le mot Dieu dans diffĂ©rentes langues romanes, germaniques, slaves, ainsi quâen grec.
Au XVIIe siĂšcle, Marcus van Boxhorn est pourtant le premier Ă soupçonner une langue dâorigine commune (quâil appelle le scythique) au grec, au latin, au perse, ainsi quâaux langues germaniques, slaves, celtes et baltes. En 1786, William Jones donne une confĂ©rence sur le sanskrit (la langue liturgique de lâInde) et Ă©met lâhypothĂšse dâune origine commune aux langues dâEurope et du sous-continent indien, remarquant la proximitĂ© du latin, du grec ancien et du sanskrit.
« La langue sanskrite, quelle que soit son anciennetĂ©, est dâune structure merveilleuse ; plus parfaite que le grec, plus riche que le latin, et plus exquisĂ©ment raffinĂ©e que ce soit, mais en gardant de chacune dâelles une affinitĂ© plus forte, Ă la fois dans les racines verbales et les formes grammaticales, et quâun accident aurait créé ; aussi fort en effet, quâaucun philologue ne pourrait examiner toutes les trois, sans croire qu'elles sont issues Ă partir dâune source commune, qui, peut-ĂȘtre, nâexiste plus. »
William Jones, 1786
LâhypothĂšse indo-europĂ©enne se dĂ©veloppe ensuite dans le courant des XIXe et XXe siĂšcles, bien que le nom donnĂ© Ă la langue origine et Ă la famille de langues concernĂ©es varie au fil des siĂšcles. De langues scythiques ou japhĂ©tiques (de Japeth, personnage biblique frĂšre de Sem et Cham, et fils de Noé ; pour les personnes dĂ©fendant Ă lâĂ©poque le terme japhĂ©tique, la descendance de Sem serait Ă lâorigine des langues sĂ©mitiques), le XIXe siĂšcle va voir Ă©merger les termes « langues indo-germaniques », dĂ» aux premiĂšres langues Ă©tudiĂ©es et considĂ©rĂ©es dans lâhypothĂšse ainsi quâĂ un fort nationalisme naissant en Europe, et « langues aryennes ». Ce terme servira sur la deuxiĂšme moitiĂ© du XIXe et sur la premiĂšre moitiĂ© du XXe siĂšcle Ă lâidĂ©ologie nationaliste allemande puis nazie sur la race aryenne.
Le terme aryen dĂ©rive du sanskrit à€à€°à„à€Ż arya « noble » et est utilisĂ© dans certains textes sanskrits par les auteurs pour parler dâeux-mĂȘmes et de leur peuple. Le terme de « langues aryennes » a donc Ă©tĂ© dans un premier temps utilisĂ© de par lâhypothĂšse selon laquelle les ancĂȘtres communs des indo-europĂ©ens se nommaient Ă©galement ainsi. Pourtant, il semble ĂȘtre plus une Ă©volution spĂ©cifique Ă la branche dont vient le sanskrit, et Ă cause de sa connotation raciste aujourdâhui, il nâest plus utilisĂ© en linguistique que pour dĂ©signer un groupe spĂ©cifique de langues indo-iraniennes, localisĂ©es dans le nord de lâInde : les langues indo-aryennes. Dâailleurs, lâexpression antique avestique (langue liturgique de la religion zoroastrienne) AryÄnam xshathra « royaume des Nobles », a dĂ©rivĂ© en ÄrÄn shahr, puis Iran.
Aujourdâhui donc le terme « indo-europĂ©en » a remplacĂ© ses prĂ©dĂ©cesseurs et est plus que largement acceptĂ© et utilisĂ© dans la communautĂ© scientifique. Il dĂ©signe Ă la fois la langue dâorigine commune (lâindo-europĂ©en commun, ou Ă©galement dans la littĂ©rature anglaise le proto-indo-europĂ©en ou PIE) et le ou les peuples qui ont parlĂ© des langues indo-europĂ©ennes au cours de lâhistoire (les Indo-EuropĂ©ens, avec majuscules).
Les langues indo-européennes sont regroupées en dix familles :
les langues albanaises, dont le seul reprĂ©sentant actuel est lâalbanais avec 5,4 millions de locuteurs ;
les langues anatoliennes, originaires de lâactuelle Turquie au IIe millĂ©naire avant notre Ăšre et Ă©teintes au cours du Ier millĂ©naire avant notre Ăšre, desquelles faisait partie le hittite ;
les langues armĂ©niennes, dont le seul reprĂ©sentant actuel est lâarmĂ©nien avec entre 7 et 8 millions de locuteurs ;
les langues balto-slaves, originaires de la vallĂ©e de la Volga, bien que certains linguistes sĂ©parent encore les langues baltes (le lituanien et le letton) des langues slaves (comme le russe, le polonais ou le serbe) et attribuent les proximitĂ©s linguistiques des deux groupes plus Ă des interfĂ©rences linguistiques dues Ă une proximitĂ© gĂ©ographique quâĂ une origine commune dans la famille indo-europĂ©enne ;
les langues celtiques, originaires de la rĂ©gion de Hallstatt au nord des Alpes sur la fin du IIe millĂ©naire avant notre Ăšre et sâĂ©tant Ă©tendues sur lâEurope continentale et les Ăźles britanniques entre 750 et 250 av. EC, ne sont aujourdâhui plus reprĂ©sentĂ©es que par la branche des langues celtiques insulaires avec le gaĂ©lique irlandais, le gaĂ©lique Ă©cossais, le mannois, le gallois, le cornique et le breton, et sont toutes en danger dâextinction ;
les langues germaniques, originaire des rives de la mer Baltique et du nord de lâAllemagne actuelle, et aujourdâhui reprĂ©sentĂ©es sur tous les continents, majoritairement par lâanglais ;
les langues hellĂ©niques, reprĂ©sentĂ©es par le grec moderne et ses 15 Ă 22 millions de locuteurs, les autres langues de la famille Ă©tant aujourdâhui considĂ©rĂ©es comme Ă©teintes ;
les langues indo-iraniennes, prĂ©sentes dans lâactuel TurkmĂ©nistan dĂšs la fin du IIIe millĂ©naire avant notre Ăšre puis sâĂ©tendant vers lâAfghanistan et le nord de lâInde au dĂ©but du IIe millĂ©naire avant notre Ăšre, et desquelles font partie le sanskrit, lâhindi, lâurdu, le persan et le kurde ;
les langues italiques, originaires du sud des Alpes vers la fin du IIe millĂ©naire avant notre Ăšre, et liĂ©es selon certains linguistes aux langues celtiques dans une famille appelĂ©e langues italo-celtiques, desquelles le latin deviendra le seul reprĂ©sentant au Ier siĂšcle avant notre Ăšre, supplantant et faisant disparaitre le vĂ©nĂšte, le falsique, le picĂšne, lâosque, lâombrien et le sicule, avant de diverger autour du Ve siĂšcle de notre Ăšre vers les diffĂ©rentes langues romanes que nous connaissons actuellement ;
et les langues tokhariennes, peut-ĂȘtre parlĂ©es dĂšs le IIe millĂ©naire avant notre Ăšre mais attestĂ©es avec plus de certitude (grĂące Ă des Ă©crits en koutchĂ©en et en agnĂ©en retrouvĂ©s) entre 300 et 500 dans le bassin du Tarim en Chine actuelle, avant de disparaĂźtre vers lâan 900 lors des invasions OuĂŻghours.
Ăvolution du proto-indo-europĂ©en vers les diffĂ©rentes familles de langues indo-europĂ©ennes, dâaprĂšs « Two-point-equidistant-asia », par Mdf, licence CC-0, et « Kurgan map », par  Dbachmann, licence CC-0.
LâhypothĂšse actuellement la plus acceptĂ©e par la communautĂ© scientifique concernant lâorigine des Indo-EuropĂ©ens est lâhypothĂšse kourgane (du russe ĐșŃŃĐłĐ°Đœ kurgan « tumulus », terme dâorigine tatare de mĂȘme sens), basĂ©e sur des preuves linguistiques et archĂ©ologiques : le proto-indo-europĂ©en aurait Ă©tĂ© parlĂ© par un peuple originaire des steppes pontiques (au nord de la mer Noire et de la mer dâAzov) entre 5500 et 4000 av. EC, oĂč ils auraient domestiquĂ© le cheval ; ils se seraient ensuite Ă©tendus dans toute la rĂ©gion pontique entre 3000 et 2500 av. EC, puis auraient atteint les Balkans et les rives de la mer Caspienne avant 2000 av. EC, lâAsie centrale et le nord de lâInde entre 2000 et 1500 av. EC, lâEurope centrale et la pĂ©ninsule italique vers 1000 av. EC, et le nord de lâEurope avant 500 av. EC.
Dâautres hypothĂšses existent, plaçant le point de dĂ©part des Indo-EuropĂ©ens et le foyer de locuteurs du PIE en Anatolie entre les VIIe et VIe millĂ©naires avant notre Ăšre (thĂ©orie anatolienne de Colin Renfrew, 1987), ou en Inde vers le VIe millĂ©naire avant notre Ăšre (thĂ©orie de la Sortie de lâInde ou de lâInvasion Aryenne) ; certains remontent aussi loin que le Xe millĂ©naire avant notre Ăšre (thĂ©orie de la ContinuitĂ© PalĂ©olithique). Cependant, ces thĂ©ories sont principalement basĂ©es sur des donnĂ©es uniquement archĂ©ologiques, sans forcĂ©ment prendre en compte les langues parlĂ©es, et la plupart des linguistes rejettent ces hypothĂšses. Nous nous concentrerons donc sur lâhypothĂšse kourgane.
Toujours selon cette hypothĂšse, entre 3500 et 3000 av. EC a lieu le processus de satemisation et le proto-indo-europĂ©en commence Ă diverger selon deux groupes de dialectes (je tiens Ă rappeler quâĂ lâĂ©poque il sâagissait certainement de dialectes, mais aujourdâhui ce sont les ancĂȘtres de plusieurs familles de langues) : ceux dans lesquels la consonne palatale *áž± (sans doute le son /c/) perd sa palatalisation et devient /k/, et ceux dans lesquels elle dĂ©rive vers la fricative /s/. On parle alors de langues centum pour les premiĂšres (prononcĂ© /ken.tum/) et de langue satem pour les secondes (prononcĂ© /sa.tÉm/), dâaprĂšs le mot pour « cent » en PIE : *áž±mÌ„tĂłm.
Or, câest Ă peu prĂšs Ă lâĂ©poque oĂč le proto-indo-europĂ©en diverge et disparaĂźt que commence Ă se dĂ©velopper lâĂ©criture. Cette technologie arrivant Ă des stades diffĂ©rents de lâĂ©volution des peuples en Europe, certaines langues beaucoup plus rĂ©centes nâont, elles non plus, pas de trace Ă©crite : câest le cas par exemple du proto-germanique, encore parlĂ© vers lâan 200 mais jamais Ă©crit, alors que le latin par exemple sâĂ©crit dĂšs le VIIe siĂšcle avant notre Ăšre.
Le vocabulaire du PIE ainsi que sa grammaire sont donc reconstruits grĂące Ă un procĂ©dĂ© que nous dĂ©taillerons la semaine prochaine : la linguistique comparĂ©e. Cela Ă©tant, retenez que câest cette ignorance du terme initial exact et sa reconstruction qui amĂšne la notation Ă©toilĂ©e des termes indo-europĂ©ens que nous voyons depuis le premier article. Cette notation nâest dâailleurs pas spĂ©cifique Ă lâindo-europĂ©en commun et sâapplique pour toute forme non-attestĂ©e et reconstruite dâun mot.
Le proto-indo-europĂ©en est une langue complexe et ayant Ă©normĂ©ment de flexion : on compte 25 consonnes (les nasales *m et *n, les occlusives sourdes *p, *t, *k, *áž± et *kÊ·, les occlusives sonores *b, *d, *g, *Ç” et *gÊ·, les occlusives aspirĂ©es *bʰ, *dʰ, *gʰ, *ǔʰ et *gʷʰ, la fricative *s, les liquides *r et *l, les semi-voyelles *y et *w, ainsi que trois sons laryngaux notĂ©s *hâ, *hâ et *hâ) et 2 ou 3 voyelles (*e, *o, et selon Manfred Mayrhofer peut-ĂȘtre *a, ainsi que leurs Ă©quivalents longs, les diphtongues et les consonnes *hÌ„â, *hÌ„â, *hÌ„â, *mÌ„, *nÌ„, *lÌ„, *rÌ„, *i, *u Ă valeur vocalique) ; les noms sont classĂ©s selon 3 genres (masculin, fĂ©minin et neutre), 3 nombres (singulier, duel et pluriel) et se dĂ©clinent selon 8 cas (nominatif, vocatif, accusatif, locatif, gĂ©nitif, ablatif, datif et instrumental).
« *Hoi(H)nos, *duohâ, *treies,*kÊ·etuĆr, *penkÊ·e, *(s)uĂ©ks, *sĂ©ptm, *hâeáž±tehâ, *(hâ)nĂ©un, *déឱmt, *duidáž±mti, *trihâdáž±omthâ, *kÊ·eturdáž±omthâ, *penkÊ·edáž±omthâ, *ueksdáž±omthâ, *septmdáž±omthâ, *hâeáž±thâdáž±omthâ, *hâneundáž±omthâ, *áž±mÌ„tom, *Ç”heslo. »
Les nombres de 1 Ă 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 et 1000 en proto-indo-europĂ©en, dâaprĂšs Sihler et Beekes
En prĂšs de 7000 ans, lâindo-europĂ©en a Ă©voluĂ© pour donner prĂšs de 600 langues dont on possĂšde une trace aujourdâhui (soit un peu moins de 10% du nombre total de langues rĂ©pertoriĂ©es), et plus de 56% de la population mondiale parle une langue indo-europĂ©enne. Lorsque jâai dĂ©couvert ce quâĂ©tait le proto-indo-europĂ©en, ce quâil reprĂ©sentait pour lâĂ©volution des langues dâEurope et que je me suis renseignĂ©e sur ses origines, je suis tombĂ©e en admiration devant tant de complexitĂ© et de beautĂ©, et devant le travail des linguistes pour faire revenir des OubliĂ©s de lâHistoire cette langue qui est devenue lâune de mes prĂ©fĂ©rĂ©es. Je nâai pu ici quâeffleurer la surface de ce que reprĂ©sentent lâindo-europĂ©en et sa culture, et jâespĂšre pouvoir y revenir dans de futurs articles.