Adatbányászat

(Data Mining)


  • 2 óra előadás (kollokvium), 2 óra gyakorlat (aláírás)
  • 5 kredit, őszi félév

Tantárgyleírás

Informatikai rendszerek fejlesztése és integrálása, az informatikai célú kutatási-fejlesztési feladatok ellátása.

Tematika

Bevezetés: Adatbányászat fogalma, összetevői; adathalmazok, struktúrák, jóság-függvények, optimalizálás; mértékek és adatok; mérési skálák, távolságmértékek. Vizualizáció: megjelenítési technikák; alapvető statisztikák, egy és kétváltozós eset, többváltozós eset; multidimenziós skálázás (MDS); lokálisan lineáris beágyazás (LLE). Regresszió: lineáris modellek; általánosított lineáris modellek; mintakeresés; dinamikus programozás; szerkesztési távolság, dinamikus idővetemítés. Text Retrieval: szöveg reprezentáció; LSI (Latent Semantic Indexing). Klaszterezés: alapfogalmak, mértékek; szekvenciális algoritmusok; BSAS, módosított BSAS; TTSAS; hierarchikus algoritmusok; GAS, GDS, dendrogram. Valószínűségi algoritmusok: G-PAS, fuzzy C-mean, k-mean.

Ajánlott irodalom

1. D. Hand, H. Mannila, P. Smyth: Principles of Data Mining, MIT Press, 2001 (546p).
2. Tan, M. Steinbach, V. Kumar: Introduction to Data Mining, Pearson Addison Wesley, 2006 (769p)
3. Han, M. Kamber: Data mining: Concepts and Techniques, 2nd ed., Morgan Kaufman, 2006 (800p)

Tantárgy felelőse

Csirik János egyetemi tanár, DSc