Data Science w Excelu 4: Analiza danych – analiza zależności i modelowanie

Cel kursu

Zapoznanie uczestników z metodami analizy zależności, modelowania liniowego i nieliniowego (Data Modeling), podstawami analizy szeregów czasowych oraz identyfikacją i oceną siły tendencji rozwojowych zjawisk w czasie zgodnie z koncepcją Data Science przy użyciu oprogramowania MS Excel.

Opis kursu

(1) Test niezależności chi-kwadrat. Wykorzystanie średnich brzegowych:  Test niezależności chi-kwadrat. Ograniczenia i interpretacja wyników testu. Poprawka Yatesa. Współczynniki V-Cramera, T-Czuprowa, C-Pearsona, fi-Yula jako mierniki siły zależności. Wykorzystanie sortowania i sum brzegowych do określania kierunku zależności.

(2) Korelacja liniowa i rangowa. Badanie istotności współczynników korelacji:  Wykresy rozrzutu. Identyfikacja wstępna rodzaju zależności korelacyjnej. Kowariancja. Korelacja liniowa Pearsona. Wrażliwość współczynnika korelacji liniowej na wartości odstające. Korelacja rangowa Spearmana. Wykorzystanie formuł i funkcji do obliczania wartości współczynników korelacji. Testy nieistotności współczynnika korelacji dla małej (statystyka testowa rozkładu t-Studenta) i dużej próby (statystyka testowa rozkładu normalnego standaryzowanego).

(3) Modele regresji liniowej. Modele analityczne regresji liniowej wielorakiej. Współczynniki determinacji. Dobór zmiennych do modelu: Wykorzystanie i formatowanie linii trendu na wykresie rozrzutu. Model regresji liniowej prostej. Współczynnik determinacji. Dopasowany współczynnik determinacji. Interpretacja współczynników determinacji. Analiza modeli linii trendu w połączeniu z analizą wartości współczynników korelacji liniowej Pearsona i rangowej Spearmana. Model regresji liniowej wielorakiej. Dobór zmiennych objaśniających do modelu: metoda Hellwiga, metoda Nowaka.

(4) Klasyczna metoda najmniejszych kwadratów. Rozwiązanie modelu. Narzędzie Analiza danych. Ocena jakości modelu. Istotność parametrów modelu: Rozwiązanie modelu metodą macierzową. Ocena jakości dopasowania modelu do danych empirycznych: przy użyciu błędów, przy użyciu współczynników determinacji. Istotność parametrów modelu. Test Fishera-Snedecora. Interpretacja. Narzędzie Analiza danych. Interpretacja wyników: ocena jakości dopasowania modelu, ocena istotności parametrów strukturalnych modelu. Eliminacja z modelu parametrów nieistotnych statystycznie.

(5) Modele ze zmiennymi binarnymi. Ocena poprawności postaci analitycznej modelu. Test serii. Narzędzie Solver. Modele regresji nieliniowej: Modele regresji liniowej ze zmiennymi binarnymi (przyjmującymi dwie wartości). Ocena poprawności postaci analitycznej modelu. Wykonanie i interpretacja testu serii. Modele regresji nieliniowej. Linearyzacja modeli nieliniowych. Narzędzie Solver. Budowa i wykorzystanie praktyczne modeli analitycznych hybrydowych.

(6) Szeregi czasowe. Prognozowanie na podstawie modeli regresji liniowej i nieliniowej. Ocena jakości dopasowania modeli: Szeregi czasowe: specyfika i obszary wykorzystania. Prognozy jakościowe na podstawie modeli analitycznych regresji liniowej prostej i wielorakiej oraz nieliniowej. Metody symulacji parametrów modeli prognostycznych jakościowych liniowych i nieliniowych. Wartości odstające: rodzaje, sposoby identyfikacji i postępowania. Sprawdzenie stabilności parametrów modelu prognostycznego jakościowego. Test Chowa. Ocena jakości dopasowania modeli do danych empirycznych w szeregu czasowym.

Korzyści

Uzyskanie kompetencji: wiedzy teoretycznej i umiejętności praktycznych w zakresie analizy zależności, modelowania liniowego i nieliniowego (Data Modeling), podstaw analizy szeregów czasowych oraz identyfikacji i oceny siły tendencji rozwojowych zjawisk w czasie zgodnie z koncepcją Data Science przy użyciu najpopularniejszego na rynku oprogramowania użytkowego MS Excel.

Terminy zajęć

21.09.2019 (sobota): 9:00-14:00
22.09.2019 (niedziela): 9:00-14:00

Dokładna lokalizacja kursu będzie dostępna dla Słuchaczy, którzy opłacili kurs, po zalogowaniu się na swoje konto Słuchacza.

Dane kursu

  • 16C61
  • Edycja XVI - lato 2019
  • 21.09.2019
  • Piotr Jałowiecki
  • 12
  • 18
  • Człowiek i technika
  • 400 zł
  • 150 zł
  • Kampus SGGW Ursynów