DMwstep.pdf

(699 KB) Pobierz
Zaawansowana eksploracja danych
Jerzy Stefanowski
Instytut Informatyki
Politechnika Poznańska
Wykład wstępny. dla spec. TPD
Poznań 2008
Zmiany 2009/10
1
Kilka uwag wstępnych
Kont. wcześniejszego wykładu „Eksploracja
danych”
(prof.. Morzy)
Powstaje WWW poświęcona przedmiotowi
http://www.cs.put.poznan.pl/jstefanowski/tpd.html
Będzie powiązana z instrukcjami do wykonywania
ćwiczeń
laboratoryjnych.
Oprogramowanie
WEKA –
źródło
+ dokumentacja i podręczniki dostępne w WWW.
RapidMiner
(i inne)
Statsoft Dataminer / Statistica 8.0
MOA –
projekt dla eksploracji strumieni danych
Warto spojrzeć na zasoby internetowe
KDnuggets
bogaty serwis WWW w j. ang. / także wiele materiałów
dydaktycznych.
2
Wymagania wstępne – wcześniejsze przedmioty
Eksploracja danych (TPD)
Reguły asocjacyjne i wzorce sekwencyjne
Algorytmy budowy klasyfikatorów
Drzewa decyzyjne (C4.5, CART, pruning)
Klasyfikacja bayesowska
K-NN
Algorytmy analizy skupień
K-means i AHC
Ocena ważności atrybutów
Statystyczna analiza danych
Miary opisowe, testy statystyczne, regresja prosta
3
Literatura anglojęzyczna
Han Jiawei and Kamber M. Data mining: Concepts and techniques,
Morgan Kaufmann, 2001 (1 ed.), there is 2d
Hand D., Mannila H., Smyth P. Principles of Data Mining, MIT Press,
2001 (tłumaczenie polskie WNT).
Kononenko I., Kukar M., Machine Learning and Data Mining:
Introduction to Priniciples and Algorithms. Horwood Pub, 2007.
Maimon O., Rokach L., The data mining and knowledge discovery
Handbook, Springer 2005.
Witten I., Eibe Frank, Data Mining, Practical Machine Learning Tools
and Techniques with Java Implementations, Morgan Kaufmann, 1999.
Weiss S., Indurkhya N., Predictive data mining, Morgan Kaufmann,
1998.
4
Polskie …
Larose D., Odkrywanie wiedzy z danych. Wprowadzanie do
eskploracji danych, PWN, 2006.
Larose D., Metody i modele eksploracji danych, PWN 2008.
Hand D., Mannila H., Smyth P. Eksploracja danych, WNT, 2005.
Polskie książki
Dobry podręcznik jeszcze nie istnieje …
Koronacki J.,
Ćwik
J., Statystyczne systemy uczące się, WNT 2005
(kolejne wydanie w drodze).
Krawiec K, Stefanowski J., Uczenie maszynowe i sieci neuronowe,
Wyd. PP, 2003.
Cichosz P., Systemy uczące się. WNT, 2000.
Lasek M., Data mining: Zastosowanie w ocenach i analizach klientów
bankowych. Biblioteka Menadżera, 2003.
5
Zgłoś jeśli naruszono regulamin