dr inż. Krzysztof Regulski
← www.metal.agh.edu.pl/~regulski/ [Eksploracja danych - niestacjonarne]


Eksploracja Danych - niestacjonarne

Laboratoria 3.
Analiza skupień



    → Zbiór Adult (oryginalne Ľródło)
    → Zbiór Adult (serwer sendzimir)


	Analiza skupień

	0. Zaimportuj plik adult.data do STATISTICA.
	1. Dokonaj analizy skupień metod± aglomeracyjn± (Statystyka | Wielowymiarowe techniki eksploracyjne | Analiza skupień | Aglomeracja)
	2. Odczytaj, które zmienne s± najbliższe sobie, a które najbardziej oddalone (macież odległo¶ci). Zapisz te pary.
	3. Wykonaj losowanie warstwowe (warstwy ustaw w zależności od zmiennej zależnej np. Income/50%-50%) 
	   tak by uzyskać zbiór około 1000 rekordów, w którym obie klasy s± podobnie liczne.
	4. Analiza skupień metod± k-¶rednich (5-krotny sprawdzian krzyżowy) dla wybranych zmiennych (w oparciu o własne hipotezy).
	5. Wykonaj interpretację wyników (opisz charakterystykę poszczególnych skupień na podstawie zmienych jako¶ciowych i ilo¶ciowych).
	   Spróbuj dopasować poszczególne skupienia do grup ze swoich hipotez. Zweryfikuj, czy skupienia potwierdzają hipotezy.
	6. Analiza skupień metod± EM.
	7. Charakterystyka skupień dla EM.

	8.  WYSŁAĆ SPRAWOZDANIE: regulski@agh.edu.pl; temat i nazwa pliku: ED-NS-GRUPOWANIE-___nazwiska___

 


mail: regulski@agh.edu.pl

©Krzysztof Regulski - Kraków 2018