Viruljon a magyar nyelv a neten!
A Digital language death (Digitális nyelvhalál) címet viselő tanulmányában a szerző először a nyelvek életképességének hagyományos kritériumait gondolta újra a digitális térben: a nyelvet beszélők száma helyett a nyelvet a hálózaton használók számára figyel. Az olyan, hagyományos értelemben kihalással egyáltalán nem fenyegetett nyelvek esetében, mint a mandinka, ez hatalmas különbséget jelent, hiszen a sok millió beszélőt számláló nyelvet kevesebb, mint a lakosság 1 százaléka tudja írni is. Hiába hivatalos nyelv a mandinka ma két országban, Szenegálban és Gambiában is, hiába van mandinka nyelven rádió- és tévéadás, a digitális térben egyszerűen nincsenek jelen.
Kornai András hatalmas mennyiségű adatot gyűjtött munkatársaival (Zséder Attilával és Pajkossy Katalinnal) az MTA SZTAKI-ban a webről: minden nyelvet több mint harminc dimenzió alapján vizsgálták. Ezt követően négy csoportba sorolták a nyelveket: digitálisan mozdulatlan, örökségi, élő és viruló nyelveket különböztettek meg, nagyjából aszerint, hogy mennyi digitális kommunikáció zajlik az adott nyelven. A mozdulatlanokon gyakorlatilag semmi, a virulókon naponta több milliárd szónyi új anyag válik digitálisan elérhetővé. Az örökségi nyelvek, mint a latin vagy az ógörög, azért érdekesek, mert ezek hatalmas kulturális örökséget közvetítenek, de akik ezt felviszik a webre, azok nem anyanyelvi beszélők. Büszkén vallhatja valaki, hogy ő mandinka, vagy lengyel, vagy magyar, de senki nem mondhatja: én latin vagyok. Ettől még lelkesen szerkesztheti a latin wikipédiát. Amikor egy-egy nyelvet megmentünk a digitális nyelvhaláltól, akkor nem digitálisan élő, hanem örökségi nyelvek jönnek létre.
Az MTA SZTAKI közleménye szerint a magyar kutatók módszerének lényege, hogy világos és egyértelmű példákat választottak az egyes csoportokból, majd segítségükkel olyan matematikai modelleket állítottak fel, amelyek megmutatják, hogy melyik nyelv melyik csoportba tartozik. A különböző modellek lényegében mind egyetértenek abban, hogy a ma ismert nyelvek és nyelvjárások több mint 95 százaléka digitálisan halott. Nem arról van szó, hogy egyszer majd, talán, valamikor ki fog halni: a mozdulatlan tetemek itt fekszenek előttünk. De ezek digitális szempontból tetemek!
Mit lehet mégis tenni? Két dolgot. Egyrészt a digitálisan halott nyelvek döntő többsége a hagyományos értelemben még csak nem is veszélyeztetett: biztosak lehetünk benne, hogy mandinka vagy nynorsk (ez a norvég egy változata) anyanyelvű beszélőket még száz év múlva is fogunk találni. Ezek a nyelvek örökségi nyelvvé tehetők, sokan dolgoznak ezen. Másrészt van még négyszázvalahány nyelv, amelyeknek még van esélyük. Ezekkel ma kevesebbet foglalkoznak, pedig nem mindegy, hogy a kibertérbe magunkkal visszük-e őket, vagy sem.
A magyar, ezt világosan le kell szögezni, nincs veszélyben digitálisan sem. Amíg épül a magyar wikipédia (jelenleg nagyságra a 24. a nyelvek látogatottsági listáján, tehát nemhogy az életképes 4-5 százalékban, de még a felső 0,5 százalékban is benne van), magyarul csetelnek az ifjú párok, magyarul írnak a Facebookra, virágzó blog- és portálkultúra van, addig nagy baj nem lehet. Akkor a magyarral minden rendben? Kornai András szerint ezt azért nem lehet kijelenteni. A magyar gépi fordítást legjobban a Google, a magyar beszédfelismerést legjobban a Nuance csinálja. Autót már tudunk gyártani, minőségi nyelvtechnológiát sajnos nem, pedig meglenne a szellemi tőke hozzá. Ezek a szoftverek nagyok és bonyolultak, fejlesztésükön egyszerre sok-sok ember dolgozik. Az autókkal ellentétben, amelyeket külföldön is el lehet adni, a magyar nyelvtechnológia igazából csak magyaroknak kell, ám ezt a kis piacot is megfojtja, hogy a Google ingyen adja saját programját. Még ha nem is olyan nagyszerű a Google Translate, nem sokan adnának pénzt valami jobbért.
A magyar kultúrörökség digitalizálására, nagyon helyesen, volt eddig némi állami támogatás, mint ahogy a kisebb finnugor közösségek nyelvtechnológiai támogatására is. Ám ezek a kicsi, néhány tízmilliós projektek csupán az örökségi státusz felé visznek – ha azt akarjuk, hogy a magyar nyelv ne csak túléljen, hanem viruljon is a digitális korszakban, nagyobb léptékben kell gondolkodni.•