← www.metal.agh.edu.pl/~regulski/ [Eksploracja danych]


Eksploracja Danych
Analiza skupień



Analiza skupień:

1. Dokonaj analizy skupień metodą aglomeracyjną (Statystyka | Wielowymiarowe techniki eksploracyjne | Analiza skupień | Aglomeracja)
2. Odczytaj, które zmienne są najbliższe sobie, a które najbardziej oddalone (macież odległości). Zapisz te pary.
3. Wykonaj analizę grupowania obiektów i cech dla zmiennych age, education-num oraz hours-per-week 
   dla pierwszych 50 przypadków (select cases). Wcześniej zestandaryzuj te zmienne w nowych kolumnach.
4. Wykonaj losowanie warstwowe (Dane|Próba|Losowanie warstwowe; warstwy ustaw w zależności od zmiennej zależnej np. Income/50%-50%) tak by uzyskać zbiór około 1000 rekordów.
5. Analiza skupień metodą k-średnich (5-krotny sprawdzian krzyżowy) dla wybranych zmiennych (na wylosowanej grupie rekordów).
6. Wykonaj interpretację wyników (opisz charakterystykę poszczególnych skupień na podstawie zmienych jakościowych i ilościowych).
7. Spróbuj dopasować poszczególne skupienia do grup ze swoich hipotez. Zweryfikuj, czy skupienia potwierdzajš hipotezy.
8. Analiza skupień metodą EM.
9. Charakterystyka skupień dla EM.

10.  Opracuj raport z zajęć. Przedstaw wyniki do oceny.
	



 


mail: regulski@agh.edu.pl

©Krzysztof Regulski - Kraków 2019