Jelenlegi hely
Kutatószeminárium
Az internet széleskörű elterjedésével az elmúlt néhány évben a közösségi média népszerűsége jelentős mértékben megnövekedett, naponta több százmillió mondatnyi szöveget írnak le a felhasználók. Ezekben a szövegekben elmondják véleményüket különböző entitásokról, például termékekről, szolgáltatásokat nyújtó cégekről vagy hírességekről. Ennek a hatalmas mennyiségű adatnak (BigData) az emberi feldolgozása lehetetlen, olyan módszerekre van szükség, amelyek automatikus véleménydetekciót végeznek, azaz egyrészt képesek kiszűrni a megfelelő információt az adatfolyamokból, másrészt a szükségleteknek megfelelően képesek értelmezni azokat. Napjainkban számos kutatást folytatnak ebben a témakörben. Közkedvelt feladat különböző termékek értékelésének automatikus feldolgozása, részvény árak változásának előrejelzése, választási eredmények megbecslése. Előadásomban gépi tanulás alapú módszereket mutatok be, melyeket szövegek vélemény tartalmának elemzésére dolgoztam ki. Ismertetem a véleménydetekció különböző szintjeit annak tekintetében, hogy mire vonatkozóan szeretnénk információkat gyűjteni, illetve hogy mennyire részletes elemzést szeretnénk végezni. Bemutatok néhány nyelvi eszközt, melyek a szövegek mélyebb megértését teszik lehetővé, valamint szó lesz angol és magyar nyelvű szövegek elemzésének különbségeiről.