Jelenlegi hely

Intézeti szeminárium

Félév: 
2017/18 I. félév
Helyszín: 
Árpád tér 2. II. em. 220. sz.
Dátum: 
2017-11-21
Időpont: 
14:00-15:00
Előadó: 
Recski Gábor (BME)
Cím: 
Szemantikai elemzés gráf-transzformációkkal
Absztrakt: 
A szemantikai elemzés (semantic parsing) természetes nyelven írt 
szövegekhez rendel jelentés-reprezentációt. A jó minőségű szemantikai 
elemzés elengedhetetlen az olyan nehéz, a mesterséges intelligencia 
területéhez tartozó feladatok elvégzéséhez, mint pl. a kérdés-megválaszolás 
(Question Answering, QA) vagy a következmény-felismerés (Recognizing Textual 
Entailment, RTE). Az egyre szélesebb körben megjelenő chatbotok és személyi 
asszisztensek (Apple Siri, Amazon Alexa, Google Now, stb.) képességeit is 
az korlátozza, hogy a természetes nyelven születő felhasználói bemenet olyan 
többértelműségeket és hiányosságokat hordoz, melyeket ugyan egy másik emberi 
beszélő könnyedén kezel, a ma létező algoritmusok csak korlátozottan, felszíni 
jegyek alapján képesek feldolgozni.
 
A szemantikai reprezentációk egy nagy csoportját a gráf-alapú reprezentációk 
alkotják, melyek egy szó, mondat, vagy szöveg jelentését fogalmak irányított 
gráfjaként reprezentálják. A szemantikai elemzés egy kezdeti lépése a választott 
reprezentációtól függetlenül pedig a mondatok szintaktikai szerkezete alapján 
történő függőségi elemzés (dependency parsing), mely az egyes mondatok felszíni 
szemantikai szerkezetét szintén a szavak irányított, élcímkézett gráfjaként 
reprezentálja. Így a mély szemantikai elemzés olyan gráf-transzformációnak 
fogható fel, mely a szintaxistól független jelentés-gráfokat (esetenként 
hipergráfokat) ezekből a függőségi gráfokból közvetlenül állítja elő. Az utóbbi 
években több olyan szemantikai elemző is megjelent, mely a fenti átalakítást 
ún. (hiper)gráf-újraíró nyelvtanokkal valósítja meg.
 
Kutatásunk során olyan kísérleti szemantikai elemzőt hozunk létre, mely a 
mondatok függőségi szerkezetét és a mély szemantikai reprezentációt alkotó 
gráfokat egyaránt képes környezetfüggetlen nyelvtanokkal generálni. Kettő vagy 
több ilyen nyelvtan szabályai közti megfeleltetéssel jönnek létre az IRTG 
(Interpreted Regular Tree Grammar) nyelvtanok, melyek lehetővé teszik az egyes 
reprezentációk közötti nagyon gyors fordítást. Mivel a függőségi elemzők is 
leggyakrabban gráf-transzformációk segítségével képeznek nyers szöveget függőségi 
gráfra, ezért a megfelelő IRTG nyelvtan később a szemantikai elemzés és generálás 
mellett közvetlenül használható lehet gépi fordításra is.