nyest.hu
Kövessen, kérem!
Legutolsó hozzászólások
A nyelvész majd megmondja
A legnépszerűbb anyagok
Írjon! Nekünk!
nyest.hu
nyest.hu
 
Mindenki fordítási memóriája – a Google Translator Toolkit

Kezdetben vala a fordító, aki pennával körmölte le az idegen, misztikus nyelv szépségeit egy másik nyelvre. Nagyot fordult azóta a világ. A pennák számítógép-billentyűzetre cserélődtek, a világhálón pedig korábban sosem látott nyelvek hódítanak egyre nagyobb teret maguknak. Bárki elérhet bármit, csak Ethernet-kábel vagy Wi-Fi kell hozzá. Hogy az esélyek csakugyan egyenlőek legyenek, az internet szolgáltatócsászára, a Google is előrukkolt egy meglepetéssel: egy új fordítói felülettel. Ez a Google Translator Toolkit.

Végh Fruzsina Judit | 2009. október 12.
|  

A nyár hagyományosan mindenhol uborkaszezon – a pangást a Google a június 9-én bevezetett kis masinával, a Google Translator Toolkittel pezsdítette fel, amelyről már mi is írtunk. Azóta eltelt lassan négy hónap. Ez éppen elegendő idő volt a kísérletezésre, no meg arra, hogy a (sokszor szélsőséges) vélemények kiforrják magukat.

Összecsavarozott eszközkészlet. Google Translation Toolkit
Összecsavarozott eszközkészlet. Google Translation Toolkit

Gépi fordítás és fordítási memória, egyben

Az átlag érdeklődő fejében homályos elképzelés él a fordításról mint szakmáról, és azokról is, akik művelik. Hiába az egyre több résztvevőt vonzó szakmai fórum, ha elsősorban a szakmaibeliek látogatják.

A Google Translator Toolkit (a továbbiakban: GTT) használatával viszont bárki fordító lehet. Az alkalmazás egyszerre nyújtja a gépi fordítás kétes csodáját (erről bárkinek eszébe juthat a Google Fordítóval való küszködés), és a fordítási memória használatának örömét. Kissé öszvér megoldás tehát.

A GTT-ről, röviden

Mielőtt azonban sorra vennénk a mellette és ellene szóló érveket, illik röviden bemutatni a főhőst.

Az eszköz számtalan dologra használható: egyszerre működik gépi fordítóként, fordítási memóriaként, szótárként és szószedetként, a rajta tárolt szövegek (pontosabban szövegpárok: az eredeti és a fordítás) pedig bárkivel megoszthatók.

A GTT sebessége elismerésre méltó: szinte azonnal elkészíti a feltöltött szöveg nyersfordítását. Mi egy tekintélyes nagyságú, angol nyelvű Wikipedia-szócikken teszteltük (ezen). A GTT imponálóan gyorsan készítette el a helyenként megmosolyogtató, de feldolgozásra alkalmas magyar szöveget (ez a villámgyorsaság gépi fordításokra jellemző). Emellett folyamatosan okosodik (ez pedig tipikusan fordítási memória-vonás): azaz minél többen bővítik és fordítanak vele, annál nagyobb adatbázist épít fel, és annál nagyobb az esélye, hogy az általunk lefordítani kívánt mondat vagy kifejezés felbukkan benne.

Különösen csábító, hogy ingyenes, a szociálisan érzékenyeket pedig a közösségi szellem fogja megérinteni (ami a többi Google-alkalmazásra, mi tagadás, nem kimondottan jellemző). A Wikipedia-rajongók pedig egyenesen el lesznek bűvölve a programtól, mivel – meglátásunk szerint – egyértelműen Wikire optimalizált megoldásról van szó; minden további funkciója másodlagosnak tűnik mellette.  A legfontosabb kérdés ezek után az, hogy kinek és mire használható.

Erre nem jó

Egyszerűbb a tagadással kezdeni, mert a GTT meglepően sok mindenre nem való.

Hivatásos fordítóknak például semmiképpen. Így hiába olvasható például olyan lelkes vélemény az interneten, miszerint a GTT olyan eszköz, amely – a hiányosságait elfogadva – „a profi, drága fordítószoftverek szolgáltatásaival is felveszi a versenyt”, erről nincs szó.

Az egyik korlátozó ok a feltölthető dokumentum típusa. A GTT pillanatnyilag az alábbi fájltípusokat támogatja: HTML (.html), Microsoft Word (.doc), OpenDocument szövegfájl (.odt), egyszerű szövegfájl (.txt), valamint Rich Text (.rtf). Azaz a választék igencsak szűkös. A hivatásos fordításokat ennél jóval szélesebb, szövegszerkesztőkkel nem feltétlenül kezelhető formátumban (PDF-ben, FrameMakerben stb.) adják ki és készítik el. Ehhez kapcsolódik, hogy a program nem feltétlenül őriz meg minden formázást, ami a feltöltött dokumentumban található (erre figyelmeztető üzenet hívja fel a figyelmet a feltöltés során) – ez szintén csökkenti a professzionális felhasználás esélyeit.

A másik ok a méret. A GTT jelenleg egyszerre 10 MB-nyi adat feltöltésére ad lehetőséget, ami olykor töredéke lenne a szükségesnek – egy nagyobb projekt fájljai több gigabájtnyi helyet is elfoglalhatnak.

A harmadik ennél megfoghatatlanabb, ámde igen kényes kérdés: az adatvédelemre és a szerzői jogokra vonatkozik. A fordítók legnépszerűbb nemzetközi portálján, a ProZon éles vitát váltott ki a GTT megjelenése, és ebben a fórumban – bár a vita maga rövid – minden, egy profi fordító fejében felmerülő aggály elolvasható. A probléma a következő: noha a lefordított szövegeket nem szükségszerűen kell megosztani mindenkivel, azaz privát fordítási memóriák is fenntarthatók, mivel ezek a Google felületén találhatók, a Google bármikor felhasználhatja őket. Ez egyébként a tartalomszolgáltatási szerződés kiegészítésében is szerepel, angol nyelven.

Komoly szakmai érv a nyilvános memóriák tartalmának felügyeletlensége: azaz a már lefordított, nyilvánosan elérhető szövegek nyelvtani-formai és tartalmi szempontból egyaránt hibásak, inkonzisztensek lehetnek, és felhasználásuk kritikusan kellene, hogy történjen. Erre azonban nincs mód és idő, bár a fenti fórumban hivatkoztak arra, miszerint a Google profi lektorokkal olvastatná át a memóriában összegyűlő szövegeket. Szakmai szempontból vajmi kevés rá az esély.

Jó, mert közkincs

Ha jól átgondoljuk a fentieket, egyértelmű, hogy a Google korántsem a profi ligába akart beszállni a GTT-vel; sokkal inkább egy közösségi, bárki által bármikor elérhető és használható alkalmazást kívánt létrehozni, amely, bár sok benne a hiba és a korlát, számos előnnyel is jár.

Az egyik a már korábbiakban említett közösségi szellem, idegen szóval crowdsourcing. A fordítás ugyanis  – akár profik, akár amatőrök végzik –, a legritkább esetben magánügy. Miért ne lehetne közhasznúan végezni? A felület, a használhatóság pedig egyértelműen a közösséget szolgálja, és a Google-t dicséret illeti az igényességért és a gyorsaságért, amilyennek a GTT-t megalkották. Így mindenki átélheti a profi fordítás élményét, kicsiben. Mindennek a mindmáig zárt és titokzatos fordítószakma számára is vonzó üzenete és pozitív hozadéka lehet.

A közösségi szellemet tovább javítja az ingyenesség: a GTT használata mindössze egy Google-fiókot igényel, de akinek már van például Gmail-címe, már ezzel sem kell bajlódnia.

Noha a fentiekben már megemlítettük a pontatlanság, a hibák és a következetlenség veszélyét (ezek a hivatásos fordítás folyamatában elfogadhatatlan tényezők), a GTT mindezt a sebességgel, azaz a könnyen és gyorsan elkészülő fordításokkal ellensúlyozza. Az alkalmazás használatával a szövegek hamarabb elkészülnek, mintha egy fordítóiroda gondjára bíznánk.

A GTT egyetlen, közösségi szempontból kirekesztő része, hogy a kezelőfelülete jelenleg csak angol nyelven áll rendelkezésre (így aki nem tud angolul, jó eséllyel inkább a már lokalizált Google Fordítónál marad), és forrásnyelvként csak az angolt lehet megadni – magyarról angol történő fordításra például nem alkalmazható.

A jövőbe tekintve

A Google Translator Toolkit forradalmi alkalmazás, de a nyelvi szolgáltatások piacát várhatóan nem fogja megrázni. Ahhoz túlságosan „liberális”. Olcsósága természetesen sok megrendelőt elgondolkodtathat arról, hogy a profik helyett esetleg a GTT-hez forduljon, de az adatvédelmi kockázatok és az igényesség vélhetően sokakat visszatartanak majd.

Ami a kínálati oldalt illeti: a csúcsszolgáltatók eddig is közzétettek ingyenes fordítóprogramokat és fordítástámogató eszközöket a weboldalukon (freeware vagy demó verzióban) – az SDL például az SDLX Lite-ot, a Kilgray a MemoQ-ot, a MorphoLogic a MobiCAT-et stb., bár korlátozott funkciókkal és/vagy időtartamra. Hogy konkrétan hogyan érinti őket a GTT megjelenése, arról a közeljövőben őket magukat kérdezzük meg.

Információ
X