-
Sándorné Szatmári: @nasspolya: (Hátha ennyi idő után még elolvasod..) -29-ben ezt írtad: ".... mi a pontos kü...2024. 11. 23, 12:47 A nyitás tárgya
-
szigetva: @Sándorné Szatmári: Kétségtelen, hogy majd ha tudunk valamit a jelenleg ismertnél korábbi ...2024. 11. 22, 14:33 Szótekerészeti agybukfenc
-
Sándorné Szatmári: @szigetva: 14 "..az állítólagos "ősnyelvről" azért könnyű bármit (és annak az ellenkezőjét...2024. 11. 22, 14:17 Szótekerészeti agybukfenc
-
szigetva: @Sándorné Szatmári: Kérlek, fejezd be a hülyeséget. Egyszer-kétszer talán vicces, de most ...2024. 11. 13, 12:05 Szótekerészeti agybukfenc
-
Sándorné Szatmári: @Sándorné Szatmári: 12 kiegészítés: -A mai angolban a "kulcs" szó időben csak oda helyezhe...2024. 11. 13, 11:33 Szótekerészeti agybukfenc
Kálmán László nyelvész, a nyest szerkesztőségének alapembere, a hazai nyelvtudomány és nyelvi ismeretterjesztés legendás alakjának rovata volt ez.
- Elhunyt Kálmán László, a Nyelvész, aki megmondja
- Így műveld a nyelvedet
- Utoljára a bicigliről
- Start nyelvstratégia!
- Változás és „igénytelenség”
Kálmán László korábbi cikkeit itt találja.
Ha legutóbb kimaradt, most itt az új lehetőség!
Ha ma csak egyetlen nyelvészeti kísérletben vesz részt, mindenképp ez legyen az!
Finnugor nyelvrokonság: hazugság
A határozott névelő, ami azt jelenti, hogy ‘te’
Az oroszok már a fejünkön vannak!
Olvasónk kérdése kapcsán leleplezzük a helyesírás-ellenőrzőket. Ezek valójában nem azt ellenőrzik, hogy a leírt szó helyes-e, hanem azt, hogy létezik-e. Tévedni pedig nem gépi dolog, és ezeket a programokat is emberek készítik – arról nem is szólva, hogy a nyelvtanokat is emberek írják.
Olvasónknak, Marcellnek meggyűlt a baja a helyesírás-ellenőrzővel és egy online helyesírási tanácsadóval is. Lássuk beszámolóját küzdelmeiről:
Ma írtam egy levelet az egyik munkaadómnak, amiben éppen a feladatról kérdeztem, elmondtam a véleményemet. Egy kis holnapot programozok neki, már nemsokára el is készül.
A leveleimet mindig átnézem, találok-e benne hibát, meg kijavítom a böngésző által automatikusan aláhúzottakat is. Egy hasonló tartalmú mondatot írtam:
„A képet azért helyeztem lentre, mert szerintem ott jobban mutat, mint a táblázat mellett.”
Ebben a mondatban aláhúzta a „lentre” szót. Néztem, ezzel ugyan mi probléma lehet, mik a javaslatok, miért húzhatja alá. Se a Firefox, se a Chrome nem ismeri ezt a szót, ellenben a „fentre” szóval nincs semmi problémája. Van bármi tippjük, miért felejthették ki ezt a szót a böngészők helyesírási ellenőrzőjéből, vagy én tudom rosszul, és ez a szó tényleg nem helyes? Ha jól sejtem, nem egyesével írták össze a magyar szavak összes toldalékos alakját, hanem valamiféle algoritmussal ellenőrzik az egyes szavakat.
A legfurcsább talán az, hogy az alábbi oldal sem ismeri e „lentre” szót:
http://helyesiras.mta.hu/helyesiras/default/suggest
Itt szintén helyes a „fentre”, de a „lentre” nem.
Az oldal az ajánló után folytatódik...
Olvasónkat nyelvi intuíciója nem hagyta cserben: a lentre éppúgy helyes, mint a fentre. A párhuzamkeresés módszere egyébként általában jól működik, csak időnként hagy minket cserben: a fel és a föl ugyanazt jelenti, és ugyanaz a felett és a fölött jelentése is – a felé és a fölé jelentése azonban már különböző (természetesen a felé lóg ki a sorból), és a felől mellett nincs *fölől (legalábbis az irodalmi nyelvben – ráadásként még a felől a feléhez áll közel jelentésbelileg, így a a felett ~ fölött – fölé sorból hiányzik a honnan? kérdésre válaszoló alak; vessük csak össze az alatt – alá – alól sorral!). Elgondolkozhatunk például azon, hogy a fentre és lentre mellett miért nincs fennre és lennre – aligha tudunk okosabbat mondani, mint hogy csak.
Hogyan működik a helyesírás-ellenőrző?
Amiben Marcell téved, az az, hogy ha a helyesírás-ellenőrző aláhúzza a szót, akkor az azt jelenti, hogy a szó hibás. Valójában azt jelenti, hogy a szóalakot a helyesírás-ellenőrző nem ismeri. Így például a szerkesztőségben használt helyesírás-ellenőrző nem ismeri a fenti bekezdésben szereplő jelentésbelileg alakot, de nem ismeri a komment, kommentelő főneveket és a kommentel igét sem. De miért?
Az olyan programokat, melyek kitalálják, hogy egy betűsor melyik szótári szó milyen alakjának felel meg, morfológiai elemzőknek hívjuk. A helyesírás-ellenőrző magja a morfológiai elemző, de ezt más elemek is kiegészíthetik, például a szintaktikai elemzők, melyek a központozás (vesszőhasználat) szabályainak betartására figyelnek, vagy olyan modulok, melyek az egyes szavak esetleg meg írott szövegbe nem illő stílusértékére figyelmeztetnek.
A helyesírás-ellenőrző úgy dolgozik, hogy van egy szótára, melyben a szótöveket tárolja, és van egy nyelvtana, mely tartalmazza a nyelv toldalékait, illetve azokat a szabályokat, melyek alapján ezek a toldalékok a tövekhez kapcsolhatóak. Ez utóbbi határozza meg, hogy a ragozás (vagy szóképzés, esetleg szóösszetétel) során miként változik a szóelemek alakja. (Az is lehetséges megoldás, hogy a nyelvtant nem használjuk folyamatosan, hanem segítségével előre legeneráljuk az összes lehetséges szóalakot. Nyelvtől is függhet, mikor melyik megoldás a leghatékonyabb, legcélszerűbb.) A helyesírás-ellenőrző nem csinál mást, mint az általunk írt szövegben szereplő szóalakokat összeveti a szótárával és nyelvtanával, és amennyiben a szó nem szerepel a szótárban, és az abban szereplő tövekből és a toldalékokból sem tudja összerakni, akkor aláhúzza az alakot. A fenti példák esetében például valószínűleg azért nem ismeri fel az alakokat, mert nem ismeri a -belileg képzőkombinációt, illetve a komment (sem a kommentel, sem a kommentelő) tövet.
Sajnos azonban nem csupán azokat a szóalakokat utasítja el a helyesírás-ellenőrző, melyeket nem ismer, hanem elfogadja azokat is, melyeket ismer, függetlenül attól, hogy az adott helyzetben azok helyesek-e. Például a helység és a helyiség szavak megkülönböztetése a magyar helyesírás érzékeny pontja: sokan szeretnek lecsapni a kettő keverésére (bár ennek gyakorisága éppen azt mutatja, hogy a két szót a nyelvhasználók többsége nem különbözteti meg, akik pedig igen, azok is azért, mert helyesírásból ezt tanították nekik: a két szó a beszédben gyakorlatilag megkülönböztethetetlen). Fontos lenne tehát annak ellenőrzése, hogy a szövegalkotó a megfelelő formát használta-e, de ennek automatizálása gyakorlatilag lehetetlen. A szövegkörnyezet segítségével a számítógép ugyan megpróbálhatná kitalálni, hogy melyik alak illik az adott helyre, de ez a módszer sem lenne tökéletes. Az egyetlen jó megoldás az lenne, ha a helyesírés-ellenőrző bármelyik alak előfordulása esetén figyelmeztetne minket, hogy a helység alak csak akkor helyes, ha településre gondoltunk, a helyiség pedig csak akkor, ha egy épület belső, elválasztott részére.
Ez talán praktikus megoldásnak tűnik, de rendkívül munkaigényes, hiszen a fejlesztőnek valamilyen szabályt, tanácsot kell írnia az összes összekeverhető alakkal kapcsolatban: márpedig ezeket még megtalálni is nehéz. Ráadásul képzeljük el, ha – Mártonfi Attila egy példájával élve – a gólya szó leírásakor a gép mindig figyelmeztetne minket, hogy ez csak akkor helyes, ha a madárra gondoltunk: amennyiben valakinek a gó játékára, vagy nem zsidó származású ismerősére, abban az esetben a gója alak a helyes. Valójában tehát az eredmény akkor is inkább bosszantó, mint hasznos lenne, ha a fejlesztő mindenre gondol.
Ezért mondják a szakemberek, hogy a helyesírás-ellenőrző nem is a helyesírás ellenőrzésére, csupán az elgépelések kiszűrésére szolgál. Persze erre sem tökéletes: e sorok írója például gyakran gépeli a lenen betűsort a lenne helyett: mivel azonban a lenen értelmes szóalak (a len ragozott alakja), a helyesírás-ellenőrző nem segít.
Fentre és lentre
Ha mindezzel tisztában vagyunk, könnyen kitalálhatjuk, mi lehet a Marcell által jelzett probléma oka. Ehhez azonban észre kell vennünk, hogy sajátos esettel van dolgunk. A lentre szó egy tőből és egy esetragból áll: lent + -re. A felsorolt szóalakokat csak metanyelvi használatban ragozzuk így, azaz akkor, amikor magáról a szóról van szó: A szótárból kifelejtették a lentet; A szótár első kötete a lentig tart; A lentben csak egy magánhangzó van stb.Ilyen módon azonban minden, egyébként nem ragozható szó is ragozható (Az isről is beszéltünk), vagy akár ragozott szóalakokhoz, akár igékhez is fűzhetünk esetragokat (A szerző már megint elgépelte a lennét). Csakhogy ehhez a tőhöz a legtöbb esetragot nem tudjuk kapcsolni: nincs *lentet, , *lenten, *lentben, *lentbe, *lentből, *lentnél, *lenthez, *lenttől, *lentig, *lentként stb. Inkább az a kivételes, hogy a szóhoz valamilyen esetrag kapcsolódhat: lentről, lentre. (A szerkesztőségi helyesírás-ellenőrző a lentről alakot ismeri, a lentre alakot nem.)
A hagyományos (iskolai) nyelvtan ezt úgy magyarázza, hogy a lent nem névszó (nem főnév, melléknév vagy számnév, illetve ilyen „természetű” névmás vagy igenév), márpedig esetragok csak névszókhoz járulhatnak. Azt, hogy a lent nem főnév, az is igazolja, hogy ragtalan alakja a mondatban nem alanyként jelenik meg, mint a névszók (főként főnevek) esetében szokás, hanem olyan funkcióban, melyet a főnevek inkább ragos vagy névutós alakjukban szoktak betölteni: A kép lent van (vesd össze: A kép a falon / a házban / az óra alatt van). Éppen ezért a lent szót egy olyan szófajba sorolják, melyet határozószónak neveznek. A határozószó egyik jellemző tulajdonsága, hogy nem ragozható.
A helyesírás-ellenőrzők fejlesztői jobb módszer híján a szótöveket olyasmi kategóriákba sorolják, mint a hagyományos nyelvtan szófajai. Bár a lent szót a helyesírás-ellenőrző (pontosabban a benne levő morfológiai elemző) ismeri, úgy tudja róla, hogy nem ragozható – ezért nem képes rájönni, hogy a lentre szó a lent tőből és a -re toldalékból áll.
De mi a helyzet a fentre esetében? A helyesírás-ellenőrző nyilván ismeri a fent szót, bizonyára határozószónak tartja, hogyan ismeri fel mégis a fentre alakot? Nos, nem látunk bele, de nagyobb összeget tennénk arra, hogy ismeri a fentre határozószót is. Így, önálló határozószóként, semmit nem tudva arról, hogy a fentre szó a fent tőből és a -re toldalékból áll.
Ha ez így is van, olvasóink joggal kérdezhetik: miképp lehetséges, hogy a fentre alak szerepel a helyesírás-ellenőrző szótárában, a lentre viszont nem? Ha a fejlesztőknek eszükbe jutott, hogy az előbbit felvegyék a szótárba, az utóbbit miért nem vették fel? Nos, ismét csak tippelhetünk. A fejlesztők valószínűleg nem úgy dolgoztak, hogy végiggondolták, milyen ragos alakjaik vannak a határozószóknak, hanem nagy mennyiségű szöveget áttekintettek, és azokból kigyűjtötték az olyan szavakat, melyeket az elemző nem tudott megelemezni, de jó szavaknak tűntek. Nos, ebben az anyagban előfordult a fentre, de nem bukkant fel a lentre alak... Ezt a magyarázatot azonban gyengíti, hogy a lentre alak a Google szerint sokkal gyakoribb, mint a fentre és a föntre együtt!
(Nem annyira) független források
Már csak egy kérdést kell tisztáznunk: miként lehetséges, hogy mind a Firefox, mind a Chrome, de még az említett helyesírási tanácsadó portál is pontosan ugyanúgy hibázik. Innen már kézenfekvő a megoldás: gondolhatjuk, hogy nem sok magyar morfológiai elemzőt fejlesztettek eddig magyar nyelvre, és mindegyik alkalmazás hátterében ugyanaz a helyesírás-ellenőrző fut.