-
Sándorné Szatmári: @nasspolya: (Hátha ennyi idő után még elolvasod..) -29-ben ezt írtad: ".... mi a pontos kü...2024. 11. 23, 12:47 A nyitás tárgya
-
szigetva: @Sándorné Szatmári: Kétségtelen, hogy majd ha tudunk valamit a jelenleg ismertnél korábbi ...2024. 11. 22, 14:33 Szótekerészeti agybukfenc
-
Sándorné Szatmári: @szigetva: 14 "..az állítólagos "ősnyelvről" azért könnyű bármit (és annak az ellenkezőjét...2024. 11. 22, 14:17 Szótekerészeti agybukfenc
-
szigetva: @Sándorné Szatmári: Kérlek, fejezd be a hülyeséget. Egyszer-kétszer talán vicces, de most ...2024. 11. 13, 12:05 Szótekerészeti agybukfenc
-
Sándorné Szatmári: @Sándorné Szatmári: 12 kiegészítés: -A mai angolban a "kulcs" szó időben csak oda helyezhe...2024. 11. 13, 11:33 Szótekerészeti agybukfenc
Kálmán László nyelvész, a nyest szerkesztőségének alapembere, a hazai nyelvtudomány és nyelvi ismeretterjesztés legendás alakjának rovata volt ez.
- Elhunyt Kálmán László, a Nyelvész, aki megmondja
- Így műveld a nyelvedet
- Utoljára a bicigliről
- Start nyelvstratégia!
- Változás és „igénytelenség”
Kálmán László korábbi cikkeit itt találja.
Ha legutóbb kimaradt, most itt az új lehetőség!
Ha ma csak egyetlen nyelvészeti kísérletben vesz részt, mindenképp ez legyen az!
Finnugor nyelvrokonság: hazugság
A határozott névelő, ami azt jelenti, hogy ‘te’
Az oroszok már a fejünkön vannak!
Számokkal sokféleképpen lehet hazudni, de vannak olyan torzítások, amelyekhez még tényleges hazugságra sincsen szükség. Elég, ha csak nem közöljük az unalmas eredményeket... Márpedig a napisajtó erre igencsak hajlamos! Kikben bízzunk jobban, a tudósokban vagy az újságírókban?
Cikksorozatunk első két részében bemutattuk, mi is pontosan az adatújságírás, és hogyan vehet gyakorlatilag bárki részt az adatújságírás forradalmában. Azonban nem minden móka és kacagás. Most az új trendek árnyoldalairól is szólunk...
Érdektelen részletek
Az adatújságírók rengeteg információból szűrik le a lényeget, és ebből látványos szemléltetéseket készítenek. De ennek a módszernek megvan a maga hátránya: a legtöbbször nem maga a teljes elemzés terjed szét a neten, hanem csak egy-egy lényegretörő diagramot vagy infografikát mutogatnak egymásnak az olvasók. Ez azonban visszaélésekre adhat lehetőséget.
Arról már korábban részletesen írtunk, hogyan lehet hazudni grafikonokkal és számadatokkal. Azt szerencsére ezidáig elmondhatjuk, hogy az adatújságírók nem szoktak efféle trükkökhöz folyamodni, de maga a lehetőség fennáll. Amivel vissza lehet élni, azzal előbb-utóbb valaki vissza is fog élni!
Az oldal az ajánló után folytatódik...
A számok meggyőző ereje
Ha valaki arra hivatkozik, hogy egy nagy adatbázison elvégzett elemzések alapján jutott valamire, azt tapasztalhatja, hogy az olvasók gyakorlatilag bármit elhisznek neki. Pete Warden maga is átélte mindezt, amikor nekiállt elemezgetni a Facebookon nyilvános profilokat. Blogposztját, amiben arról írt, az amerikaiaknak hol vannak barátaik, csak apró érdekességnek szánta, habár 220 millió profil adataiből készült.
(Forrás: Wikimedia Commons / Derzsi Elekes Andor / CC BY-SA 3.0)
Habár az adatbázis teljesen valódi volt, Warden meglehetősen lazán vette az elemzést. Azzal a módszerrel definiálta a hasonló érdeklődésű amerikaiakat tartalmazó földrajzi területeket, hogy megnézte a térképen a barátokat összekapcsoló vonalakat, majd csak úgy érzésre körberajzolta őket. Hogy látni lehessen, ez nem egy véresen komoly vizsgálat, Warden olyan vicces neveket adott a földrajzi területeknek, mint a főleg Kaliforniát lefedő „Szocialisztán” vagy a Utah állam középpontú „Mormonia”. De az emberek rávetették magukat az eredményekre... Ahogy az elemző írja:
Azt gondoltam, hogy bemutatok néhány szórakoztató dolgot az általam kinyert adatokkal kapcsolatban, de mindenki úgy kezelte [a cikkemet], mint egy tudományos kutatást.
Mit is csináltak?
Szintén nagy probléma, hogy a teljes elemzés gyakran nem hozzáférhető, vagy nehezen reprodukálható, mert a felhasznált módszert nem, vagy csak nagy vonalakban ismertetik. (Mi például ennek az általunk korábban bemutatott vizsgálatnak a részleteit is szeretnénk megismerni...) Ilyen esetben gyakorlatilag csak a közlő sajtótermék tekintélyében bízhatunk – igaz, ez a hagyományos, nem adatorientált újságírás esetében is így van.
Az internet azonban lehetőséget ad arra, hogy a felhasznált adatbázisok, statisztikai módszerek mind-mind közzétehetőek legyenek anélkül, hogy ez más fontos hírek elől venné el a helyet. Sok adatújságíró él ezzel a lehetőséggel: a The Guardian adatújságírás-műhelye például rendre közzéteszi nyers adatait is. A lap munkatársai már több száz, a cikkeknek alapul szolgáló adatbázist tettek elérhetővé, igen változatos témákban. A brit vasútállomások kihasználtságától kezdve a Doctor Who sci-fi tévésorozatban feltűnő ellenségek és gonoszok listájáig igen sokféle adatbázist tölthetünk le saját használatra. (Ez utóbbi többek között az ellenségek motivációit is tartalmazza – gyakori például a „hatalomvágy” és a „főgonoszok szolgálata”.) De ez a gyakorlat messze nem általános, a felhasznált adatok sokszor nem hozzáférhetőek.
Már csak azért is érdemes az adatokat nyilvánosságra hozni, mert hátha épp egy olvasó fog előállni a következő nagy felfedezéssel, szemkápráztató szemléltetéssel. Sorozatunkban erre már mutattunk példát – egy brit oknyomozó újságírókból álló csoportosulás amerikai dróntámadásokkal kapcsolatos adataiból mások is készítettek rendkívül hatásos grafikonokat.
Kettős mérce?
Felmerülhet bennünk a kérdés, nem vagyunk-e túl szigorúak az adatújságírókkal szemben. Elvégre a hagyományos tudományban sem igazán szokás mindent közzétenni! Ez azonban változóban van. Már olyan kezdeményezések is megjelentek, amelyek egyenesen köteleznék a tudósokat arra, hogy hozzanak nyilvánosságra mindent. A kimondottan az orvostudományra összpontosító AllTrials például arra törekszik, hogy „minden korábbi és mai klinikai vizsgálatot regisztrálni kelljen, és a teljes módszertani részt és az eredményeket hozzák nyilvánosságra”.
(Forrás: Wikimedia Commons / Linda Bartlett)
De miért olyan fontos mindez? – Leginkább azért, mert igencsak torzíthatja a kutatók által levont következtetéseket, ha nem minden vizsgálat eredményei hozzáférhetőek.
Elsuvasztják?
A kutatásmódszertanban fiókproblémának nevezik azt a torzítást, amikor csak a hipotézist megerősítő eredmények látnak napvilágot, a többi „fiókban marad”. A fiókproblémát számos tényező idézheti elő – ilyen például az, hogy a negatív eredmények kevésbé érdekesek, a szakfolyóiratok kevésbé hajlamosak leközölni őket. De az is elősegítheti ennek a torzításnak a megjelenését, hogy a legtöbb kutató nem szereti beismerni, hogy nem arra jutott, amire szeretett volna. Így valósnak tűnhetnek olyan eredmények is, amelyek csak a véletlennek köszönhetően álltak elő, mert a többi, unalmasabb eredményt sosem publikálják.
Az adatújságírásnak is van fiókproblémája, ráadásul talán még súlyosabb, mint a fentebbi példában szereplő orvostudománynak. A napisajtó sokkal inkább a szenzációkból él, mint a tudományos folyóiratok; ki tudja, mennyi elemzés születik, amit sosem közölnek le. Érdekelne bárkit is, hogy X. Y. politikus nem lop, csal és hazudik? Egy klinikai vizsgálatnak megvan a maga bonyolult procedúrája, nem lehet csak úgy a sufniban nekiállni. Így könnyen lehet mondani azt, hogy minden klinikai vizsgálat kerüljön be egy központi adatbázisba. De ma már az internet tele van nagy adatbázisokkal, egy kis technikai tudással pedig akárki nekiállhat elemezni őket – legközelebb arról is írunk, hogyan...
További olvasnivaló, felhasznált irodalom
Why you should never trust a data scientist
(Not) trusting data