<
2013. november 5.

Szerző:
Szegedi Imre

Viruljon a magyar nyelv a neten!

A digitális korban, ami egyszer kikerült a webre, az többé nem vész el. Így gyarapodik a régen kihalt klasszikus kínai, a szanszkrit, az ógörög és sok más nyelv. Ugyanakkor egyre több nyelvről tudunk, amelyeket közvetlenül fenyeget a kihalás veszélye. Egy honlap 3200 ilyet sorol fel – a világ mintegy 8000 nyelvének (a pontos számot senki nem ismeri) mintegy 40 százalékát. Hogy valójában mi a helyzet, azt tárta fel Kornai András a tudományos világ legtekintélyesebb online folyó­iratában, a PLOS ONE-ban megjelent cikke.


A Digital language death (Digitális nyelvhalál) címet viselő tanulmányában a szerző először a nyelvek élet­képességének hagyományos kritériumait gondolta újra a digitális térben: a nyelvet beszélők száma helyett a nyelvet a hálózaton használók számára figyel. Az olyan, hagyományos értelemben kihalással egyáltalán nem fenyegetett nyelvek esetében, mint a mandinka, ez ha­talmas különbséget jelent, hiszen a sok millió beszélőt számláló nyelvet kevesebb, mint a lakosság 1 százaléka tudja írni is. Hiába hivatalos nyelv a mandinka ma két országban, Szenegálban és Gambiában is, hiába van mandinka nyelven rádió- és tévéadás, a digitális térben egyszerűen nincsenek jelen.

Kornai András

Kornai András hatalmas mennyiségű adatot gyűjtött munkatársaival (Zséder Attilával és Pajkossy Katalinnal) az MTA SZTAKI-ban a webről: minden nyelvet több mint harminc dimenzió alapján vizsgálták. Ezt követően négy csoportba sorolták a nyelveket: digitálisan mozdulatlan, örökségi, élő és viruló nyelveket különböztettek meg, nagyjából aszerint, hogy mennyi digitális kommunikáció zajlik az adott nyelven. A mozdulatlanokon gyakorlatilag semmi, a virulókon naponta több milliárd szónyi új anyag válik digitálisan elérhetővé. Az örökségi nyelvek, mint a latin vagy az ógörög, azért érdekesek, mert ezek hatalmas kulturális örökséget közvetítenek, de akik ezt felviszik a webre, azok nem anyanyelvi beszélők. Büszkén vallhatja valaki, hogy ő mandinka, vagy lengyel, vagy magyar, de senki nem mondhatja: én latin vagyok. Ettől még lelkesen szerkesztheti a latin wikipédiát. Amikor egy-egy nyelvet megmentünk a digitális nyelvhaláltól, akkor nem digitálisan élő, hanem örökségi nyelvek jönnek létre.

Az MTA SZTAKI közleménye szerint a magyar kutatók módszerének lényege, hogy világos és egyértelmű példákat választottak az egyes csoportokból, majd segítségükkel olyan matematikai modelleket állítottak fel, amelyek megmutatják, hogy melyik nyelv melyik csoportba tartozik. A különböző modellek lényegében mind egyetértenek abban, hogy a ma ismert nyelvek és nyelvjárások több mint 95 százaléka digitálisan halott. Nem arról van szó, hogy egyszer majd, talán, valamikor ki fog halni: a mozdulatlan tetemek itt fekszenek előttünk. De ezek digitális szempontból tetemek!

Mit lehet mégis tenni? Két dolgot. Egyrészt a digitálisan halott nyelvek döntő többsége a hagyományos értelemben még csak nem is veszélyeztetett: biztosak lehetünk benne, hogy mandinka vagy nynorsk (ez a norvég egy változata) anyanyelvű beszélőket még száz év múlva is fogunk találni. Ezek a nyelvek örökségi nyelvvé tehetők, sokan dolgoznak ezen. Másrészt van még négyszázvalahány nyelv, amelyeknek még van esélyük. Ezekkel ma kevesebbet foglalkoznak, pedig nem mindegy, hogy a kibertérbe magunkkal visszük-e őket, vagy sem.

A magyar, ezt világosan le kell szögezni, nincs veszélyben digitálisan sem. Amíg épül a magyar wikipédia (jelenleg nagyságra a 24. a nyelvek látogatottsági listáján, tehát nemhogy az életképes 4-5 százalékban, de még a felső 0,5 százalékban is benne van), magyarul csetelnek az ifjú párok, magyarul írnak a Facebookra, virágzó blog- és portálkultúra van, addig nagy baj nem lehet. Akkor a magyarral minden rendben? Kornai András szerint ezt azért nem lehet kijelenteni. A magyar gépi fordítást legjobban a Google, a magyar beszédfelismerést legjobban a Nuance csinálja. Autót már tudunk gyártani, minőségi nyelvtechnológiát sajnos nem, pedig meglenne a szellemi tőke hozzá. Ezek a szoftverek nagyok és bonyolultak, fejlesztésükön egyszerre sok-sok ember dolgozik. Az autókkal ellentétben, amelyeket külföldön is el lehet adni, a magyar nyelvtechnológia igazából csak magyaroknak kell, ám ezt a kis piacot is megfojtja, hogy a Google ingyen adja saját programját. Még ha nem is olyan nagyszerű a Google Translate, nem sokan adnának pénzt valami jobbért.

A magyar kultúrörökség digitalizálására, nagyon helyesen, volt eddig némi állami támogatás, mint ahogy a ki­sebb finnugor közösségek nyelvtechnológiai támogatá­sára is. Ám ezek a kicsi, néhány tízmilliós projektek csu­pán az örökségi státusz felé visznek – ha azt akarjuk, hogy a magyar nyelv ne csak túléljen, hanem viruljon is a digitális korszakban, nagyobb léptékben kell gondolkodni.•

 
Archívum
 2011  2012  2013  2014  2015  2016  2017  2018  2019  2020
Címkék

Innotéka