dr inż. Krzysztof Regulski
← www.metal.agh.edu.pl/~regulski/ [Eksploracja danych - niestacjonarne]


Eksploracja Danych - niestacjonarne

Laboratoria 2.
Indukcja drzew decyzyjnych:



    → Zbiór Adult (oryginalne źródło)
    → Zbiór Adult (serwer sendzimir)



	Indukcja drzew decyzyjnych:
						
	0. Zaimportuj plik adult.data do STATISTICA.
	1. Utwórz drzewo decyzyjne interakcyjne algorytmem CART dla zmiennej zależnej Income.
	   (wykład 3: indukcja reguł, slajdy od 42) 
	2. Określ ważność predyktorów z użyciem wykresu.
	3. Odczytaj i sformalizuj na podstawie drzewa 3 reguły dla najbardziej wyrazistych klas.
	4. Oceń pewność (prawdopodobieństwo, ufność) tych reguł.
	5. Wygeneruj macierz klasyfikacji (wykres i tabela) oceń całkowity błąd drzewa.
	6. Wykonaj punkty od 1-5 z użyciem algorytmu CHAID.
	7. Porównaj ufność reguł i całkowity błąd klasyfikacji modelu CART i CHAID.

	 8. Wykonaj drzewo regresyjne dla zmiennej hours-per-week: najpierw interakcyjne algorytmem CART
	 9. Wykonaj ocenę ważności predyktorów.
	10. Oceń drzewo: współczynnik determinacji drzewa (R^2); wariancja w liściach.
	    (wykład 3: indukcja reguł, slajdy od 64-71) 
	11. Odczytaj 5 reguł dla liści o najmniejszej wariancji.
	12. Zbuduj drzewo dla 3 najważniejszych predyktorów i porównaj wyniki. 

	13. Wygeneruj drzewa dla swoich hipotez (z pierwszych zajęć). 
	14. Oceń ich przydatność (macierz klasyfikacji, wariancja). Wyciągnij wnioski.
	15. Wykonaj sprawozadnie z drzew decyzyjnych obejmujące wszystkie potrzebne wnioski i interpretacje 
		(głównie z perspektywy swoich hipotez).

	 WYSŁAĆ SPRAWOZDANIE: regulski@agh.edu.pl; temat i nazwa pliku: ED-NS-DRZEWA-__nazwiska___

 


mail: regulski@agh.edu.pl

©Krzysztof Regulski - Kraków 2018