dr inż. Krzysztof Regulski ← www.metal.agh.edu.pl/~regulski/ [Eksploracja danych - niestacjonarne]
|
Eksploracja Danych - niestacjonarne Projekt 2.
|
Projekt 2: Drzewa decyzyjne i analiza skupień 1. Utwórz drzewo decyzyjne interakcyjne algorytmem CART dla każdej zmiennej zależnej (z hipotez). 2. Określ ważność predyktorów z użyciem wykresu. 3. Odczytaj i sformalizuj na podstawie drzewa 5 reguł dla najbardziej wyrazistych klas. 4. Oceń pewność (prawdopodobieństwo) tych reguł. 5. Wygeneruj macierz klasyfikacji (wykres i tabela) oceń całkowity błąd drzewa. Jeżeli zmienne zależne są ilościowe, oceń wariancję w liściach. 6. Analiza skupień metodą k-średnich (5-krotny sprawdzian krzyżowy) dla wybranych zmiennych (w oparciu o hipotezy). 7. Wykonaj interpretację wyników (opisz charakterystykę poszczególnych skupień na podstawie zmienych jakościowych i ilościowych). 8. Analiza skupień metodą EM. 9. Charakterystyka skupień dla EM. 10. Podsumować obie metody analizy skupień w oparciu o hipotezy. 11. WYSŁAĆ SPRAWOZDANIE: regulski@agh.edu.pl; temat i nazwa pliku: ED-NS-PROJ2-___nazwiska___ Zachowaj na następne zajęcia plik z danymi (*.sta) i projekt (*.stw) ze STATISTICA
|
|
|