← www.metal.agh.edu.pl/~regulski/ [Eksploracja danych]


Eksploracja Danych

Ćwiczenia projektowe 2.
Przygotowanie danych


WYBÓR TEMATU i ZBIORU DANYCH:
  → Otwarte zbiory danych na UC Irvine Machine Learning Repository
  → Otwarte zbiory danych na Data Mining Community's Top Resource
  → inne otwarte zbiory danych


EXCEL:
1. 	Przygotuj wybrany przez siebie zbiór danych do pracy w excelu... 
	Znajdź i przepisz postawione na poprzednich zajęciach hipotezy badawcze.
2.	Przeanalizuj zmienne. 
3.	Narysuj histogram dla wybranych zmiennych zależnych.
	Narysuj histogramy skategoryzowane względem wybranej zmiennej jakościowej.
4. 	Policz wartość oczekiwaną dla wybranej zmiennej zależnej lub zbadaj jej wartości jakościowe.
5. 	Policz odchylenie standardowe.
6. 	Sprawdź poprawność danych. // Wykonaj test 3 sigma na zmiennych ilościowych.
7.	Wykonaj wykresy rozrzutu dla trzech par zmiennych powiązanych ze sobą.
	O ile to możliwe, narysuj wykresy rozrzutu skategoryzowane względem wybranej zmiennej jakościowej.
8. 	Sprawdź, czy zmienna zależna jest skorelowana z innymi zmiennymi 
	// stwórz macierz korelacji.
9.	Zbuduj model regresji liniowej do oceny wpływu zmiennych na zmiennš zalezną. Zweryfikuj i zinterpretuj otrzymany model.
10.	Opracuj tabelę przestawną dla każdej hipotezy. Wyciągnij z nich wnioski.
11. 	Plik .xls lub .doc nazwij wg wzorca ED-PROJ2-GRUPA___-ZESPÓŁ__[nazwiska]__
	(tylko wyniki, zrzuty z ekranu, komentarze i wnioski, bez danych) dołącz do sprawozdania.


 


mail: regulski@agh.edu.pl

©Krzysztof Regulski - Kraków 2019