Oldalak

2016-09-04

Gépi fordítás

Pár hónapja olvastam egy cikket a gépi fordítás fejlődéséről, hogy hamarosan nem lesz szükség fordítókra, mert az algoritmusok és a rendelkezésre álló számítási kapacitás fejlődésével, a számítógépek elvégzik majd a munkájukat. Példaképp emlegették a magyar MorphoLogic céget, hogy milyen kiváló fordítóprogramjaik vannak. Régóta ismerjük a fordító egerüket (MoBiMouse), de van programjuk, ami komplett mondatokat, bekezdéseket, sőt dokumentumokat is lefordít. Kíváncsi lettem, letöltöttem a próbaváltozatot, és ráeresztettem az éppen fordított könyv néhány fejezetére. Titokban reménykedtem, hogy a munka oroszlánrészét megspórolja nekem, és legfeljebb majd igazítani kell kicsit a mondatokon. De a program komoly csalódást okozott. Mindez azért jutott az eszembe, mert rendet raktam az asztalomon, és megtaláltam a cetlit, amire felírtam pár mondat igazán jól sikerült fordítását.
Letting the quiet settle. = Bérbe adják a nyugalmat. (Hagyjuk, hogy ránk telepedjen a csend.)
I'll keep watch. = Órát fogok tartani. (Majd én őrködök.)
My hands run over his chest. = A kezeim elgázolják a mellkasát. (A tenyerem végigsiklik a mellkasán.)
What are you doing out here? = Mit takarítasz ki itt? (Mit csinálsz idekint?)
You have your life. I have mine. = Neked van életed. Nekem bányám van. (Megvan a saját életed. Ahogy nekem is.)
We are back to square one. = Visszajöttünk, hogy négyzetre emeljük az egyet. (Ott vagyunk, ahonnan elindultunk.)
A program egyértelműen mondatokat fordít, és nem figyel a bekezdésben, vagy a szöveg egészében található összefüggésekre. Ez persze javítható, és ha az algoritmus tanulni is képes lesz, és mondjuk rendelkezésére áll majd egy olyan adatbázis, amiben angol nyelvű szövegek és azok magyar fordításai szerepelnek, akkor sokat javulhat a teljesítménye, plusz a szövegben szereplő szavak lehetséges jelentéseit is csoportosítani tudja majd, és megvizsgálni, hogy azok közül melyek szoktak együtt szerepelni, akkor nem fog oda nem illő szótári jelentésekkel előállni. Valószínűleg adott szakterületre vonatkozó leírásokat, műszaki, jogi szövegeket az ominózus DVD-játékosnál sokkal jobb mínőségben lesz képes fordítani a számítógép, bár pont ezek azok a területek, ahol komoly kártérítési felelősséggel járhat egy tévedés, így elképzelhetetlennek tartom, hogy nélkülözhető legyen majd az emberi ellenőrzés a végeredményen.
Abban viszont biztos vagyok, hogy a szépirodalom igényes fordítását még sokáig nem fogják gépek végezni. Gondoljunk csak bele, pl. a Harry Potterben szereplő mugli, Roxfort, zsupszkulcs stb. szavak megalkotásához nem elegendő mindenféle algoritmikus lépések sorozata, ehhez olyasféle kreativitás szükségeltetik, aminek egyelőre se híre, se hamva a mesterséges intelligenciák háza táján. A Turing-teszt érdekes megközelítés, de nem nagy dolog chatelés közben meggyőzni valakit, hogy a válaszadó partner ember, ha mondjuk az időjáráról vagy a fociról van szó, de megnézném, ahogy a gépi intelligencia a bibliai szövegek lehetséges értelmezéseiről, vagy a mükénéi lineáris B írás megfejtéséről társalog. (Mondjuk ezt a tesztet az átlag magyar honpolgár is elbukná.)
A műfordításhoz idegennyelv-ismeret, az anyanyelv magas fokú ismerete, kifejezőkészség, kreativitás, általános műveltség és az adott téma elmélyült ismerete is szükséges. Plusz képesnek kell lenni ezeknek az ismereteknek, tudásanyagnak az összekapcsolására. És az agyműködésnek ez az asszociációs, intuitív, empatikus működése az, amitől a mesterséges intelligenciák még fényévekre vannak. A szavak jelentéseit könnyű megtalálni, ezek közül a helyzethez illőt is ki lehet választani, bizonyos stílusjellemzőket is rá lehet húzni egy szövegre, de azt, hogy egy olvasóra, egy adott szöveg különbőző megfogalmazásai közül melyik milyen hatással lenne, és hogy adott helyzetben, ezek közül melyik a leginkább kívánatos... nost ezt eldönteni egyelőre nem nagyon képes még egyik mest-int sem.
A jó hír, hogy még sokáig szükség lesz fordítókra, tehát lesz munkám. A rossz hír, hogy ebben a számítógép csak nagyon korlátozott segítséget tud majd nyújtani. Elsősorban a szótárazásban, idiomatikus kifejezések értelmezésében, releváns ismeretanyag felkutatásában (magyarul guglizás) lehet a gép a segítségünkre. De a magyar mondatokat továbbra is nekünk kell majd kiizzadni magunkból.

És ezt fordítsa le nekem élvezhető formára egy gép!

8 megjegyzés:

Szabi írta...

Megtennéd, hogy lefordítod a videót?

AncsaT írta...

Tele van lefordíthatatlan szójátékokkal. :)

A Kínai Népköztársaság újonnan megválasztott elnökének neve HU Jintao, és a "ki?" kérdőszó, angolul "who?", ugyanúgy hangzik. Ha azt mondom, "HU (Jintao) lett Kína új elnöke", azt ugyanolyan, mintha kérdezném, "Ki lett Kína új elnöke?".
YASSIR Arafat neve úgy hangzik, mintha azt mondanák, "yes, sir" vagyis "igen, uram".
Az ENSZ főtitkára, KOFI Annan neve pedig a "coffee", vagyis "kávé" szóval azonos kiejtésű.
A beszélgetőpartner, a külügyminiszter Condoleeza RICE nevének jelentése "rizs".

hobelevanc írta...

Elöbb leszel munkanélküli amiatt, hogy kihal a magyar nyelv, mint amiatt, hogy jön a forditórobot ;)

hobelevanc írta...

Ööö, ez vicces akart lenni... :)

AncsaT írta...

Ilyennel még csak ne is viccelődjünk. :)))

Az élő szöveg valós idejű felismerése és így a videók feliratozása már működik. Dolgoznak a gépi szinkrontolmácsoláson. Tehát a robotok fordítanak, csak egyelőre olyan minőségben, hogy arról már lehet velük társalogni, hogy hogyan kell eljutni a buszpályaudvarra, de verset még nem fordítanak.

Szabi írta...

Köszi! :)

hobelevanc írta...

Hu, pont most olvasom az eheti Spiegelben, hogy a konferenciatolmacs ugyanugy rajta van a veszelyeztett àllások listáján, mint a csomagkihordó, vagy 20 éve a fotolaborans. OK, valahol logikus, de a szepirodalom teljesen más kategória.

AncsaT írta...

Ebben reménykedem én is. Konferencián nem szoktak verselni, szójékokkal dobálózni, tájszólásban beszélni, hangutánzó szavakat használni, és a lefordított szövegnek a jelentéstartalma az elsődleges, az irodalmi stílussal nem nagyon bíbelődnek. Ami egy konferencián tökéletes, mert értik a résztvevők, hogy miről beszél az előadó, az könyvben leírva valószínűleg élvezhetetlen lenne.

Megjegyzés küldése