← www.metal.agh.edu.pl/~regulski/ [Eksploracja danych]


Eksploracja Danych

Ćwiczenia projektowe 3.
STATISTICA: dobór zmiennych



Celem zajęć jest wykonanie statystyk opisowych oraz poszukiwanie skorelowanych zmiennych.
Proszę wykorzystać znane wam instrumenty, w zależności od specyfiki waszych DANYCH:
histogramy, wykresy skategoryzowane (histogramy, ramka-wąsy, średnich w grupach) - interakcji,
tabele wielodzielcze (przestawne, raportujące), wykresy rozrzutu, korelacje, test Chi^2, regresja, etc.


STATISTICA:
1.	Opracuj podstawowe statystyki dla KAŻDEJ ZMIENNEJ ilościowej ze swoich hipotez.
	Statystyki opisowe: 	(1)N ważnych; (2)% Ważnych; (3)średnia; 
				(5)Mediana; (6)Moda; (9)Minimum; 
				(10)Maksimum; (14)Wariancja; (15)Odch.std;
2.	Opracuj tabele liczności dla KAżDEJ ZMIENNEJ jakościowej z hipotez.
3.	Opracuj tabelę wielodzielczą dla zmiennych jakościowych wybranych do analizy.
	LUB:  Opracuj podobną tabelę raportującą (Menu: Dane | Tabele raportujące). 
4.	Opracuj histogram skategoryzowany dla zmiennych zależnych względem (grupująca) wybranych do analizy zmiennych. 
5.	Opracuj wykres średnich w grupach (wykres interakcji LUB prosta ANOVA) dla wartości wybranych do analizy. 
6. 	Wykonaj macierz korelacji dla wszystkich zmiennych ilościowych (statystyki podstawowe i tabele);
7. 	Wykonaj obliczenia testu Chi^2 dla predyktorów jakościowych i ilościowych 
	(menu: Data Mining || dobór i eliminacja zmiennych);
	Przedstaw diagram ważności.
8. 	Wykonaj wykresy ramka-wąsy dla wszystkich zmiennych ilościowych z hipotez.
	Wybierz dwie pary zmiennych (ilościowa-jakościowa) i wykonaj wykresy skategoryzowane ramka-wąsy.
9. 	Wykonaj test normalny dla zmiennych - oznacz wartości odstające 
	(Statystyki opisowe | karta Odporne LUB Dane | Czyszczenie Danych | Zamień odstające)
10. 	Wykonaj wykresy rozrzutu dla trzech par zmiennych skorelowanych.
	Wykonaj wykresy rozrzutu dla tych samych zmiennych, ale skategoryzowane względem wybranej zmiennej jakościowej.

11. Napisz opracowanie wyników i wnioski: 
	- jakie zmienne są skorelowane ze zmiennymi zależnymi w ramach postawionych hipotez, 
	- które mają najsilniejszy wpływ na zmienne zależne,
	- czy zmienne objaśniające są wzajemnie skorelowane?
	- jakiej postaci jest ta zależność,
	- czy model może być liniowy?,
	- jaki jest kierunek zależności?

12. Sprawozdanie wysłać mailem: (regulski@agh.edu.pl; Subject i nazwa pliku: ED-PROJ3-GRUPA___-ZESPÓŁ__[nazwiska]__)



mail: regulski@agh.edu.pl

©Krzysztof Regulski - Kraków 2019