dr inż. Krzysztof Regulski ← www.metal.agh.edu.pl/~regulski/ [Eksploracja danych - niestacjonarne]
|
Eksploracja Danych - niestacjonarne Laboratoria 2. Indukcja drzew decyzyjnych:
|
Indukcja drzew decyzyjnych: 0. Zaimportuj plik adult.data do STATISTICA. 1. Utwórz drzewo decyzyjne interakcyjne algorytmem CART dla zmiennej zależnej Income. (wykład 3: indukcja reguł, slajdy od 42) 2. Określ ważność predyktorów z użyciem wykresu. 3. Odczytaj i sformalizuj na podstawie drzewa 3 reguły dla najbardziej wyrazistych klas. 4. Oceń pewność (prawdopodobieństwo, ufność) tych reguł. 5. Wygeneruj macierz klasyfikacji (wykres i tabela) oceń całkowity błąd drzewa. 6. Wykonaj punkty od 1-5 z użyciem algorytmu CHAID. 7. Porównaj ufność reguł i całkowity błąd klasyfikacji modelu CART i CHAID. 8. Wykonaj drzewo regresyjne dla zmiennej hours-per-week: najpierw interakcyjne algorytmem CART 9. Wykonaj ocenę ważności predyktorów. 10. Oceń drzewo: współczynnik determinacji drzewa (R^2); wariancja w liściach. (wykład 3: indukcja reguł, slajdy od 64-71) 11. Odczytaj 5 reguł dla liści o najmniejszej wariancji. 12. Zbuduj drzewo dla 3 najważniejszych predyktorów i porównaj wyniki. 13. Wygeneruj drzewa dla swoich hipotez (z pierwszych zajęć). 14. Oceń ich przydatność (macierz klasyfikacji, wariancja). Wyciągnij wnioski. 15. Wykonaj sprawozadnie z drzew decyzyjnych obejmujące wszystkie potrzebne wnioski i interpretacje (głównie z perspektywy swoich hipotez). WYSŁAĆ SPRAWOZDANIE: regulski@agh.edu.pl; temat i nazwa pliku: ED-NS-DRZEWA-__nazwiska___ | |
|