Jelenlegi hely
Intézeti szeminárium
Félév:
2017/18 I. félév
Helyszín:
Árpád tér 2. II. em. 220. sz.
Dátum:
2017-11-21
Időpont:
14:00-15:00
Előadó:
Recski Gábor (BME)
Cím:
Szemantikai elemzés gráf-transzformációkkal
Absztrakt:
A szemantikai elemzés (semantic parsing) természetes nyelven írt
szövegekhez rendel jelentés-reprezentációt. A jó minőségű szemantikai
elemzés elengedhetetlen az olyan nehéz, a mesterséges intelligencia
területéhez tartozó feladatok elvégzéséhez, mint pl. a kérdés-megválaszolás
(Question Answering, QA) vagy a következmény-felismerés (Recognizing Textual
Entailment, RTE). Az egyre szélesebb körben megjelenő chatbotok és személyi
asszisztensek (Apple Siri, Amazon Alexa, Google Now, stb.) képességeit is
az korlátozza, hogy a természetes nyelven születő felhasználói bemenet olyan
többértelműségeket és hiányosságokat hordoz, melyeket ugyan egy másik emberi
beszélő könnyedén kezel, a ma létező algoritmusok csak korlátozottan, felszíni
jegyek alapján képesek feldolgozni.
A szemantikai reprezentációk egy nagy csoportját a gráf-alapú reprezentációk
alkotják, melyek egy szó, mondat, vagy szöveg jelentését fogalmak irányított
gráfjaként reprezentálják. A szemantikai elemzés egy kezdeti lépése a választott
reprezentációtól függetlenül pedig a mondatok szintaktikai szerkezete alapján
történő függőségi elemzés (dependency parsing), mely az egyes mondatok felszíni
szemantikai szerkezetét szintén a szavak irányított, élcímkézett gráfjaként
reprezentálja. Így a mély szemantikai elemzés olyan gráf-transzformációnak
fogható fel, mely a szintaxistól független jelentés-gráfokat (esetenként
hipergráfokat) ezekből a függőségi gráfokból közvetlenül állítja elő. Az utóbbi
években több olyan szemantikai elemző is megjelent, mely a fenti átalakítást
ún. (hiper)gráf-újraíró nyelvtanokkal valósítja meg.
Kutatásunk során olyan kísérleti szemantikai elemzőt hozunk létre, mely a
mondatok függőségi szerkezetét és a mély szemantikai reprezentációt alkotó
gráfokat egyaránt képes környezetfüggetlen nyelvtanokkal generálni. Kettő vagy
több ilyen nyelvtan szabályai közti megfeleltetéssel jönnek létre az IRTG
(Interpreted Regular Tree Grammar) nyelvtanok, melyek lehetővé teszik az egyes
reprezentációk közötti nagyon gyors fordítást. Mivel a függőségi elemzők is
leggyakrabban gráf-transzformációk segítségével képeznek nyers szöveget függőségi
gráfra, ezért a megfelelő IRTG nyelvtan később a szemantikai elemzés és generálás
mellett közvetlenül használható lehet gépi fordításra is.