-
szigetva: @Sándorné Szatmári: Kérlek, fejezd be a hülyeséget. Egyszer-kétszer talán vicces, de most ...2024. 11. 13, 12:05 Szótekerészeti agybukfenc
-
Sándorné Szatmári: @Sándorné Szatmári: 12 kiegészítés: -A mai angolban a "kulcs" szó időben csak oda helyezhe...2024. 11. 13, 11:33 Szótekerészeti agybukfenc
-
Sándorné Szatmári: @szigetva: "..„ké” milyen meggondolásból jelentene 'eszközt', abba bele se merek gondolni....2024. 11. 13, 10:55 Szótekerészeti agybukfenc
-
szigetva: @Sándorné Szatmári: Metaforák helyett akkor mondd azt, hogy nt > nn. (Egyébként ezt se ...2024. 11. 13, 10:42 Szótekerészeti agybukfenc
-
Sándorné Szatmári: @szigetva: 9 Gondolom félre értettél..: "....Csakhogy akkor a „keményebbé vált” volna" írt...2024. 11. 13, 10:06 Szótekerészeti agybukfenc
Kálmán László nyelvész, a nyest szerkesztőségének alapembere, a hazai nyelvtudomány és nyelvi ismeretterjesztés legendás alakjának rovata volt ez.
- Elhunyt Kálmán László, a Nyelvész, aki megmondja
- Így műveld a nyelvedet
- Utoljára a bicigliről
- Start nyelvstratégia!
- Változás és „igénytelenség”
Kálmán László korábbi cikkeit itt találja.
Ha legutóbb kimaradt, most itt az új lehetőség!
Ha ma csak egyetlen nyelvészeti kísérletben vesz részt, mindenképp ez legyen az!
Finnugor nyelvrokonság: hazugság
A határozott névelő, ami azt jelenti, hogy ‘te’
Az oroszok már a fejünkön vannak!
Vajon miről szólnak a slágerek? Az internet jóvoltából csak néhány gombnyomás, és máris rendelkezésre áll a szöveg. Angolul. Ha nem vagyunk elégedettek az automatikus fordítással, akkor szótárazhatunk. De melyik számítógépes szótárat válasszuk? A legfrissebb vagy a legnagyobb hagyományokkal rendelkező a legjobb? Kétrészes cikkünkben ennek járunk utána.
A lapozgatással járó szótárazás mára nagyrészt a múlté, kivéve a nyelvvizsgán. Egyre kevesebben bástyázzák körül magukat különféle nyomtatott szótárakkal, hiszen a számítógépen néhány billentyű lenyomásával megtalálható a fordítás. Most az angol–magyar, magyar–angol szótárak közül a számítógépen használható változatok közül vizsgálunk meg hármat. Jelen cikkünkben az angolról magyarra fordítás eredményességét vizsgáljuk.
A bemutatott szótárak
alapszókészlet: Vonyó Attila
szerkesztő: Pataki Balázs
szakszókincs: EU, zöldségtermesztés
méret: 185 ezer szópár (?)
jelenlegi változat: 1995
Akadémiai MobiMouse – Morphologic Kft.
alapszókészlet: Országh László (1960)
főszerkesztők: Magay Tamás, Futász Dezső, Kövecses Zoltán (1998)
szakszókincs: számos szakterület + informatika
méret: nyelvenként 120 ezer szócikk
jelenlegi változat: 2002
Lázár–Varga – Morphologic Kft.
alapszókészlet: Lázár A. Péter, Varga György (2000)
szerkesztők: Varga György, Lázár A. Péter
szakszókészlet: pénzügyi, gazdasági, jogi, oktatási, hazai közélet
méret: nyelvenként 75 ezer szócikk
jelenlegi változat: 2010 óta havonta frissül
A vizsgálat tárgyát képező három szótárat a legszélesebb körben használtak közül választottuk ki. Az első az ingyenesen, online használható SZTAKI-szótár. A második az Akadémiai Kiadó felújított angol–magyar, magyar–angol nagyszótárainak 2002-es kiadásából készült MobiMouse-szótár (a továbbiakban AMM). A harmadik pedig a Lázár–Varga féle egyetemes szótár MobiMouse-változata.
Mindhárom szótárban lehet úgy keresni, hogy begépeljük a keresett szót. A SZTAKI-szótárnál négy lehetőség közül választhatunk. Ezeket a pal – haver, cimbora szó példáján mutatjuk be. Az alapbeállítás az, hogy azokat a tételeket adja ki a szótár, amik a begépelt betűsorral kezdődnek (pl. a pal begépelése esetén a palm – tenyér szópárt is). Lehetőség van arra is, hogy pontosan a begépelt szót keresse (pal), illetve, hogy csak olyan tételeket keressen, amiben a begépelt betűsor önálló szót alkot (pen-pal – levelezőtárs). A „bármilyen egyezés” opciónál a begépelt szó a tétel bármely pozíciójában szerepelhet (napalm – ua.). Ezen kívül azt is választani lehet, hogy a kis- és nagybetűk, valamint az ékezetes és nem ékezetes betűk között különbséget tegyen-e a program.
Az oldal az ajánló után folytatódik...
Az AMM- és a Lázár–Varga-szótár keresőfelülete ugyanaz, egyszerre több szótárban is lehet keresni. A programba minden nyelvhez automatikus morfológiai elemzőt is építettek. Ez azt jelenti, hogy ha ragozott alakot keresünk (pl. goes – ő megy), a program akkor is megtalálja a szótövet és az összes erre a szótőre (go – megy) illeszkedő találatot kiadja. Ez különösen a ragozó nyelveknél praktikus, hiszen például a terhet szóra is megtalálja a teher szótőt. A tő megtalálására a SZTAKI-szótár nem képes. Ezen felül a két MobiMouse-szótárnál lehetőség van arra is, hogy ne kelljen begépelni a keresett szót. Ekkor egy szövegben az egérkurzorral a kérdéses szóra állva automatikusan feljön egy ablak a találatokkal. A MobiMouse keresőfelülete azonban különbséget tesz kis- és nagybetűk között. Így a bécs szót nem találja meg, csak a Bécs-et.
Az összehasonlításhoz először egy eléggé gyakori szavakat tartalmazó mondatot próbáltunk meg lefordítani a szótárakra támaszkodva. Vizsgálatunk során arra voltunk kíváncsiak, az egyszerű felhasználó szemszögéből miben különböznek a szótárak. Tesztmondatunk egy népszerű, angol nyelvű sláger egyik sora: I talked to your dad, go pick out a white dress ’Beszéltem apáddal, menj, válassz egy fehér ruhát’.
Az első benyomások
Vizsgálatunk során egyszerűen kikerestük a fenti mondat szavait a szótárakból. Az már a viszonylag szűk jelentéskörrel bíró szavaknál – mint például a dad ’apuka’ vagy dress ’(női) ruha’ – is kiderül, hogy míg az AMM- és a Lázár–Varga-szótár belső szerkezettel rendelkező szócikkeket ad ki találatként, a SZTAKI-szótárban egyszerű szópárokat találunk. Ez a különbség a széles jelentéskörrel rendelkező szavaknál még markánsabban jelentkezik. Az is hamar kiderül, hogy a SZTAKI-szótár valójában két adatbázisból dolgozik: egy alapszótárból és egy ún. „kibővített szótárból”. A második adatbázis találatai az első listától elkülönülten, az oldal alján jelennek meg. Ezt csak akkor veszi észre a felhasználó, ha nagyon rövid a találati lista vagy ha legörgeti az oldalt.
A két adatbázis találatai átfedik egymást. Például a dress szó megfelelője (alapbeállításnál) az első listában ruha, amit 43 másik olyan sor követ, amiben a dress betűsor megtalálható (köztük pl. to dress – öltözködik, dresser – fiókos szekrény, komód). A kibővített szótárrészben újra találkozunk a dress sorral: öltözik; öltözködik; ruha fordításokkal. Azaz a kibővített szótárban szereplő dress jelentései az alapszótárban már szerepeltek.
Kérdésünkre Pataki Balázs, a SZTAKI-szótár szerkesztője elmondta, hogy a szótár két adatbázisa összesen185 ezer szópárt tartalmaz. Minden sor külön szópárnak számít – tehát az átfedések miatt nem mondható meg pontosan, valójában hány különböző angol–magyar szópárból áll az adatbázis. Bár az adatpárok jó része mindkét nyelvből egy-egy szót vagy kifejezést tartalmaz, előfordulnak olyan sorok is, ahol valamelyik nyelven több ekvivalenst tartalmaznak, pl. pal, mate, friend – barát.
Szócikkek
Míg a nagyon kevés jelentéssel rendelkező szavaknál mindkét típusú szótárban könnyű kiválasztani a megfelelő fordítást, a több különböző jelentéssel bíró tételeknél – pl. talk ’beszél, beszélget, pletykál, beszéd stb.’ már markáns különbségek mutatkoznak. Az AMM- és a Lázár–Varga-szótárban a szócikkek belső struktúrával rendelkeznek. Szófaji és stílusbeli információk, magyarázatok és aljelentések segítik a szótárhasználót az eligazodásban. Egy-egy aljelentésen belül a leggyakoribb fordítást adják meg elsőként. Így a lehetséges fordítások köre elég jól leszűkíthető.
Az AMM szócikkei azonban igen bonyolultak. A finomabb jelentésárnyalatok elkülönítése érdekében esetenként négyszintű beágyazást tartalmaznak, így nehezen átláthatók. A komplikált struktúrába gyakran csúsznak hibák. A dress ’ruha’ címszónál az I. 1. a) és I. 1. c) jelentés teljesen megegyezik. Hasonlóképpen, a white ’fehér’ címszónál a ’fehér hajú, ősz’ jelentés kétszer szerepel: az I. 1. a) és I. 1. c) pontban. A szócikkek ilyen fokú bonyolultsága nehézkessé teszi a keresést.
Ezzel szemben a Lázár–Varga szótárban a különböző szófajú jelentések külön szócikket alkotnak. Egy szócikken belül számozott listában állnak a külöböző jelentések. Ezekhez magyarázat vagy példa tartozik, ám az aljelentések nincsenek további alosztályokra bontva. Ezáltal sokkal gyorsabban meg lehet találni a keresett fordítást, mert a lista áttekinthető.
Szócikkek nélkül
A SZTAKI szótár egész más megközelítést alkalmaz. Itt a célnyelvi jelentések – tekintet nélkül az ekvivalensek, azaz lehetséges fordítások szófajára, használati körére és gyakoriságára – egy sajátos ábécérendben (ékezetes betűk az „ábécérend” végén) jelennek meg. Ez roppant mód megnehezíti – kezdők számára lehetetlenné is teszi – a megfelelő fordítás kiválasztását.
A white ’fehér’ szó például – ami az AMM-ben egy, a Lázár–Vargában két címszó, több aljelentéssel – 45 szópárban található meg a SZTAKI-alapszótárban (a „teljes egyezés” opció esetén). Tehát ebből a 45 tételből kell minden fogódzó nélkül kiválasztani a megfelelő fordítást. A találati listában melléknevek pl. szeplőtlen, sápadt, főnevek pl. céltábla szélső köre, mellétalálat és a magyarban többértelmű szavak pl. ősz egyaránt előfordulnak. Ennyi fordítás el sem fér egyetlen ablakban.
Mindennek tetejébe a felsorolt fordítások egy része valójában nem ekvivalens, hanem magyarázat. Jó példa erre a szó ’kommunistaellenes’ jelentése. Ennek a jelentésnek a magyar megfelelője szintén fehér (vö. Amúri partizánok dala). Egy hagyományos szócikkekkel rendelkező szótárban ez legfeljebb így szerepelne: „[kommunistaellenes] fehér”. A „mázatlan porcelán” jelentésre pedig más forrásban nem sikerült rábukkanni.
Ugyancsak figyelemre méltó a go ’megy’ szócikke. A go az egyik leggyakoribb angol ige. Ennek a szónak van számos főnévi jelentése is, melyeket sokkal ritkábban használnak. A SZTAKI-alapszótárban a go-hoz ekvivalensként csupán tíz főnév (az alku-tól az üzlet-ig) van megadva. Ezek egy része csak bizonyos kifejezésekben használható valójában. Igei jelentést egyáltalán nem találunk. A „kibővített szótárban” bukkan csak fel a ’megy, menni’ fordítás, a többi igei jelentés pedig teljesen hiányzik. Ez azt mutatja, hogy a szótárban szereplő jelentések köre elég esetleges. Míg a white-nál számos, alig használt ekvivalenssel találkozhatunk, a go leggyakoribb jelentése csak elrejtve található meg a szótárban. Ha ugyanis az alapbeállítást választjuk, a go- kezdetű találatok nagy száma miatt (összesen 84) a „kibővített szótár”, s ebben az igei jelentés, csak a negyedik lap alján jelenik meg.
Ritkább szavak
Egy korábbi szótárvizsgálatban néhány szótárt három kifejezéssel teszteltek. Ehhez hasonlóan, egy angolul tanulók számára készített magazinból választottunk három ritkább szót, hogy ne csak a leggyakoribb szavakon teszteljük a szótárakat.
A sleepover ’ottalvós buli’ kifejezés csak a Lázár–Varga szótárban szerepelt, jó ekvivalenssel. A leafy ’zöld, zöldellő’ szó mindhárom szótárban megtalálható, helyes jelentésekkel, de a leafy suburb ’zöldövezet’ kifejezés egyikben sem jelent meg. A groovy szó számos nagy egynyelvű szótár tanúsága szerint kizárólag a ’klassz, menő, divatos’ jelentésben használatos. Ez mindhárom szótárban megtalálható – azaz a SZTAKI-szótárnak csak a kibővített részében. Ám az AMM és a SZTAKI „barázdás, hornyos, megszokott, rovátkás, rutin, rutinos, sablonos” jelentést is ad. A groove ’rovátka, megszokás’ szóból elvileg képezhető melléknév y képzővel. Ám a rovátkás jelentés kifejezésére inkább a grooved szót használják, míg a rutinos szóra az experienced egy jó megfelelő. Tehát a SZTAKI- és az AMM-szótárban szereplő – meglepően hasonló – ilyen értelmű jelentések hibásak.
Részeredmények
A három vizsgált szótár közül legeredményesebben a Lázár–Vargában lehet keresni a szócikkek átláthatósága miatt. A véletlenszerűen kiválasztott ritka szavak esetében is ez a szótár szerepelt legjobban. Az Akadémiai szótárban általában egy kicsit több ekvivalens van, de néha elavult fordítások is előfordulnak. A komplikáltabb szócikkek sokszor nem átláthatók, esetleg felesleges ismétléseket tartalmaznak.
A SZTAKI szótár csupán a szűk jelentéskörű szavaknál használható eredményesen. Legnagyobb hátránya, hogy nincsenek szócikkek, ami nagyban megnehezíti a megfelelő fordítás kiválasztását. Ugyanis a lehetséges jelentések minden magyarázat nélkül, előfordulási gyakoriságra való tekintet nélkül egy egyszerű listában jelennek meg. A szótárban sok a hibás fordítás is. Az ekvivalensek száma pedig nem feltétlenül tükrözi a szó forrásnyelvi jelentéseinek számát.
Cikkünk második részében azt vizsgáljuk majd, hogy magyar szavakat, mondatokat milyen eredménnyel lehet a fenti három szótár segítségével lefordítani angolra. Míg az angolról magyarra fordítás során egy magyar anyanyelvű embernek könnyű dolga van abból a szempontból, hogy az eredmény az anyanyelvén van, a másik irányban nem támaszkodhat ilyen mértékben a nyelvi intuícióra. Ilyenkor még hangsúlyosabb szerepet kap a használt szótár minősége.
A folytatás megjelenéséig arra biztatjuk olvasóinkat, hogy próbálják ki a három ismertetett szótárat. A SZTAKI-szótár teljes adatbázisa szabadon használható. Az Akadémiai MobiMouse szótár ingyenesen kipróbálható változata az a betűvel kezdődő szavakat tartalmazza, míg a Lázár–Varga egyetemes szótár a k betűig ingyenesen kereshető.