2021. október 15-én, pénteken este 8 órakor a Díszteremben Prószéky Gábor programozó matematikus, nyelvész tart előadást Emberi nyelvek feldolgozása a mesterséges intelligencia eszközeivel címmel. Az előadás beharangozója és a beszámoló alább olvasható.Úgy tűnik, az utóbbi években egy technikai áttörés megváltoztatta az emberi nyelvek számítógépes leírásáról kialakult képet. Valóban így van ez, vagy csak olyan eszközöket használunk, amelyeknek nagyon bonyolult leírni a pontos működését? Hogy jobban megérthessük a problémát, áttekintjük a konkrét szövegek elemzésén alapuló modern közelítés, a korpusznyelvészet alapelveit. Áttekintjük a – ma szinte mindenhol mesterséges intelligenciának nevezett – gépi tanulásos módszereknek és az utóbbi időkben azon belül is szinte egyeduralkodóvá váló neurális hálóknak a működését, és további új kérdéseket teszünk fel velük kapcsolatban.
Az előadó a Pázmány Péter Katolikus Egyetem egyetemi tanára, az MTA Nyelvtudományi Intézetének igazgatója, a MorphoLogic nevű számítógépes nyelvészeti vállalkozás alapító tulajdonosa, amely a Microsoft nyelvhelyesség-ellenőrző szoftvereinek volt beszállítója.
Az előadás az MTA Alumni-programjának keretében valósul meg.
Minden érdeklődőt szeretettel hívunk és várunk!
Beszámoló
A korpusznyelvészet alapjai – Prószéky Gábor előadása
Emberi nyelvek feldolgozása a mesterséges intelligencia eszközeivel. Ezzel a címmel tartott előadást Prószéky Gábor programozó matematikus, nyelvész a Pannonhalmi Bencés Gimnázium diákjainak. A szakember a korpusznyelvészet alapjaiba vezette be a fiúkat. És még arra is fény derült, hogy mi köze van ehhez az ismert színész-műsorvezetőnek, Stohl Bucinak. Az előadás az MTA Alumni-programjának részeként valósult meg.
A gépeknek lehet szabályokat megadni, és képesek tanulni is, azokból a szövegekből, amelyek léteznek – mondta előadásában Prószéky Gábor. A nyelv gépi tanulásának kiindulópontja a szövegkorpusz, azaz a valamilyen szempont alapján kiválogatott szövegmennyiség – fejtette ki. Ezeken végez aztán vizsgálatokat a nyelvész. Ahogy mi emberek képesek vagyunk, nem a nyelvtani szabályrendszer megismerése, hanem az elhangzott szövegek alapján megtanulni beszélni, erre a számítógép is képes. A szövegből való tanulással próbáljuk átadni azt a gépnek, ahogy mi is megértjük ezeket a nyelvtani jelenségeket – magyarázta.
Mint mondta, létezik az úgynevezett korpuszalapú módszer, amikor a nyelvész adja meg az összefüggést, és azt próbálja meg igazolni, avagy cáfolni a szövegtestek segítségével. A korpuszvezérelt ezzel szemben azt jelenti, hogy maga a gép adja meg az összefüggést. A Nyelvtudományi Intézet igazgatója arra is rámutatott azonban, hogy a korpusz torz képet is adhat, majd egy példával is személtette. Évekkel ezelőtt kíváncsi volt arra, hogy az „akkorát esett, mint…” fordulat a szóhasználatunkban milyen gyakran fejeződik be azzal, hogy „mint az ólajtó” és mennyiszer úgy, hogy „mint a ház”. Rá is keresett az interneten, ami rengeteg találatot dobott ki, és meglepetésére az ólajtó sokszorosan túlszárnyalta a házat. Ennek oka azonban az volt – mint arra rájött –, hogy az összes mondat így hangzott: „Stohl Buci akkorát esett, mint az ólajtó”. Vagyis miután a bulvárhírt az összes portál átvette, lényegesen megnőtt az „ólajtó” keresési találata.
A korpusznyelvészet alapja, hogy sok példát adunk oda a számítógépnek. és abból levonja a következtetéseket. Ehhez viszont rengeteg szó kell, milliárdos nagyságrendű – fejtette ki Prószéky Gábor. Mint mondta, ma már rendelkezésre áll ekkora mennyiség, ezek a szövegek azonban nagyon sokfélék, és egy-egy kifejezés mást jelent mondjuk a sportban, és mást a hétköznapi életben. Míg az emberek a különböző jelentéseket meg tudják különböztetni – például, hogy a daruról mint madárról vagy mint gépről beszélünk – a gépnek ez zajos. Ha a szövegeket viszont teljesen homogénné tesszük, akkor meg kevés lesz ahhoz, hogy dolgozni lehessen velük – tette hozzá. Egyben arra is felhívta a figyelmet, hogy ha úgy adunk szöveget a számítógépnek, hogy azt nem kellően készítettük elő, akkor furcsa eredmények jöhetnek ki. A statisztikai módszereknek abban rejlik a veszélye, hogy ott mindig a sok győz a kevés felett – mondta. Vagyis míg az egyedi, kivételes eseteket az ember felismeri, és tudja, hogy most egy adott szó, mást jelent, mint általában, a számítógép azt hiszi el, amiből több van. Ezt azzal lehet kiküszöbölni, hogy nagy szövegkörnyezetet adunk meg. Ha különböző környezetekből gyűjtünk sok szót, akkor egyik környezetben az egyik, míg másikban a másik jelentése lesz a gyakoribb – magyarázta.
Prószéky Gábor elmondta, hogy bejöttek az úgynevezett disztribúciós modellek, az első ilyen a szóbeágyazás volt. Ennek lényege, hogy minden egyes nyelvi szót a gép átkonvertál egy pöttyé egy nagyon absztrakt térben. Azok a pöttyök lesznek körülötte, amelyik szó valamelyik értelemben hasonlít hozzá. A hasonlóságot pedig a szavak környezetéből ismeri fel. Mint mondta, két kollégájával gépi tanulásos kísérleteket folytattak a jelentések kinyerésére a szövegkorpuszokból. Ezekből kiderült, hogy láthatóan olyan dolgokat is ismer a számítógép, amelyeket nem tudjuk, hogy honnan vesz. Például egy angol tulajdonnevet megadva, angol tulajdonneveket dobott ki mint hasonlókat. A McCartney nevet beírva pedig még arra is képes volt, hogy zenészeket, vagy egyenesen a Beatleshez kapcsolódó neveket ismerje fel mint jelentésben közelállókat. Kiderült az is, hogy stilisztikai megkülönböztetésre is képes.
A gépi tanulással a gépi fordítást is lehetett tökéletesíteni, és létrejött az úgynevezett figyelem-alapú neurális fordítás, azaz a rendszer a környezetet is figyelembe veszi, nem csak a szót fordítja le. A módszert pedig beszédfelismerésre is lehet alkalmazni. De ugyanígy képi leírásra is képes az algoritmus, és akár azt is le tudja írni, hogy mi történik egy videón. Azt, hogy a jövőben a Prószéky Gábor által kifejtett módszerekkel mire leszünk majd képesek, egyelőre nem tudni, de az bizonyos, hogy számos izgalmas kérdést tartogat még az emberiség számára a téma.