dr inż. Krzysztof Regulski
← www.metal.agh.edu.pl/~regulski/ [Eksploracja danych - niestacjonarne]


Eksploracja Danych - niestacjonarne

Projekt 2.




Projekt 2: Drzewa decyzyjne i analiza skupień

	1. Utwórz drzewo decyzyjne interakcyjne algorytmem CART dla każdej zmiennej zależnej (z hipotez).
	2. Określ ważność predyktorów z użyciem wykresu.
	3. Odczytaj i sformalizuj na podstawie drzewa 5 reguł dla najbardziej wyrazistych klas.
	4. Oceń pewność (prawdopodobieństwo) tych reguł.
	5. Wygeneruj macierz klasyfikacji (wykres i tabela) oceń całkowity błąd drzewa.
		Jeżeli zmienne zależne są ilościowe, oceń wariancję w liściach.

	6. Analiza skupień metodą k-średnich (5-krotny sprawdzian krzyżowy) dla wybranych zmiennych (w oparciu o hipotezy).
	7. Wykonaj interpretację wyników (opisz charakterystykę poszczególnych skupień na podstawie zmienych jakościowych i ilościowych).
	8. Analiza skupień metodą EM.
	9. Charakterystyka skupień dla EM.
	10. Podsumować obie metody analizy skupień w oparciu o hipotezy.

	11.  WYSŁAĆ SPRAWOZDANIE: regulski@agh.edu.pl; temat i nazwa pliku: ED-NS-PROJ2-___nazwiska___
	
	Zachowaj na następne zajęcia plik z danymi (*.sta) i projekt (*.stw) ze STATISTICA

 


mail: regulski@agh.edu.pl

©Krzysztof Regulski - Kraków 2018