Jelenlegi hely
Szeminárium
Az online Q&A fórumok, mint például a Stack Overflow, egyre fontosabb
szerepet játszanak a fejlesztők napi feladatainak támogatásában. Ezek
a websiteok olyan találkozási pontok a tapasztalt fejlesztők és a hobby
programozók közösségének, akik valamely fejlesztéssel összefüggő
problémájukra keresnek megoldás. Mivel ezeken a fórumokon bármely
fejlesztői háttérrel és tapasztalattal rendelkező felhasználó tehet fel
kérdéseket, és válaszolhat is azokra, a Q&A közösség különböző szabályok
segítségével próbálja meg fenntartani az adott oldal minőségét, mint
például a nem megfelelő hozzászólások lezárása és törlése útján.
A StackOverflow esetében több mint 8000 hozzászólás érkezik naponta,
amelyek ellenőrzése manuálisan rendkívül időigényes, ezért automatizált
megoldásokra van szükség. Kutatásunk olyan módszereket keres a probléma
megoldására, amelyek csak a beküldés során ismert szöveges információkra
támaszkodnak, nem használnak a felhasználóra, vagy a poszt múltjára
vonatkozó információkat. Ebben a megközelítésben rejlik kutatásunk
újdonsága, mert az eddigi kutatások eredményei támaszkodtak ezekre a
jellemzőkre, amely a gyakorlati alkalmazás szempontjából nehézséget
jelenthet egy adott kérdést megfogalmazó felhasználó számára. Modellünkben
természetes nyelvi feldolgozásra épülő módszereket és a mélytanulásban
alkalmazott technológiákat alkalmazzuk a StackOverflow kérdések
osztályozására minőség, illetőleg lezárás prediktálása céljából.
Eredményeink biztatóak, az osztályozást 70% feletti pontossággal sikerült
végrehajtanunk mind a minőség, mind a lehetséges lezárás meghatározása
során kizárólag a kérdés megfogalmazásakor ismert szöveges információkra
támaszkodva.