Data Science w Excelu 3: Analiza danych – podstawy

Cel kursu

Zapoznanie uczestników z podstawami statystycznej analizy danych, w tym opisu i wnioskowania statystycznego (Data Analytics) zgodnie z koncepcją Data Science przy użyciu oprogramowania MS Excel.

Opis kursu

(1) Podstawy opisu statystycznego. Identyfikacja i ocena pozycji centralnej i rozproszenia: Miary centralne (pozycyjne): średnia arytmetyczna, arytmetyczna ważona, geometryczna, harmoniczna, chronologiczna, mediana, moda (dominanta). Obszary zastosowania poszczególnych rodzajów średnich. Miary rozproszenia: wariancja, odchylenie standardowe, odchylenie standardowe ważone, współczynnik zmienności. Interpretacja miar rozproszenia. Dobór wag do miar ważonych.  Zakres wartości, kwartyle, percentyle. Inne miary rozproszenia: rozstęp ćwiartkowy (kwartylny), odchylenie kwadratowe, odchylenie bezwzględne, średnie odchylenie bezwzględne.

(2) Szeregi rozdzielcze punktowe i przedziałowe: Zasady konstruowania szeregów rozdzielczych szczegółowych. Zasady konstruowania szeregów rozdzielczych przedziałowych: Dobór liczby klas, metody ustalenia szerokości klasy, domykanie przedziałów klasowych. Wyznaczanie miar centralnych i rozproszenia w szeregach rozdzielczych. Momenty centralne i ich interpretacja. Współczynniki skośności i kurtozy.

(3) Metody kategoryzacji danych: Typowy obszar zmienności. Reguła trzech sigm. Identyfikacja i sposób postępowania z wartościami odstającymi. Metody kategoryzacji danych: równomierna względem zakresu wartości, według wartości średniej i krotności odchylenia standardowego, nierównomierna. Wykorzystanie funkcji tekstowych i wyboru do przetwarzania danych tabelarycznych.

(4) Rozkłady zmiennych losowych dyskretnych. Prawdopodobieństwo, dystrybuanta i wartość zmiennej losowej dyskretnej: Zmienna losowa. Rozkład zmiennej losowej. Dystrybuanta zmiennej losowej dyskretnej. Prawdopodobieństwo przyjęcia wartości przez zmienną losową. Zmienne losowe dyskretne. Rozkłady dyskretne: Bernoulliego (dwumianowy), Poissona, Pascala (ujemny dwumianowy), geometryczny, hipergeometryczny.

(5) Rozkłady zmiennych losowych ciągłych. Rozkłady normalny i normalny standaryzowany. Funkcja gęstości prawdopodobieństwa, dystrybuanta i wartość zmiennej losowej ciągłej. Przedziały ufności:  Zmienne losowe ciągłe. Funkcja gęstości prawdopodobieństwa. Dystrybuanta zmiennej losowej ciągłej. Obliczanie prawdopodobieństw i wartości zmiennej losowej. Wykorzystanie funkcji statystycznych dla rozkładów. Rozkład normalny. Rozkład normalny standaryzowany. Standaryzacja rozkładów w celu porównania badanych prób i populacji. Przedziały ufności dwustronne i jednostronne. Poziom istotności. Poziom ufności. Interpretacja i wykorzystanie przedziałów ufności. Maksymalny błąd szacunku. Przedziały ufności dla frakcji.

(6) Testy statystyczne. Rozkłady t-Studenta, chi-kwadrat, Fishera-Snedecora. Test zgodności chi-kwadrat: Testy statystyczne jedno- i dwustronne. Hipotezy testowe. Statystyka testowa. Stopnie swobody. Przeprowadzanie i weryfikacja testów: przy użyciu wartości empirycznej i teoretycznej statystyki testowej, z wykorzystaniem wartości p. Testy na wartość średniej, na równość średnich, na wartość frakcji, równość frakcji. Mała i duża próba. Rozkłady ciągłe t-Studenta, Chi-kwadrat. Testy na wartość wariancji, zgodności (z rozkładem normalnym) Chi-kwadrat. Rozkład ciągły Fishera-Snedecora. Testy na równość średnich i równość wariancji.

Korzyści

Uzyskanie kompetencji: wiedzy teoretycznej i umiejętności praktycznych w zakresie statystycznej analizy danych, w tym opisu i wnioskowania statystycznego (Data Analytics) zgodnie z koncepcją Data Science przy użyciu najpopularniejszego na rynku oprogramowania użytkowego MS Excel.

Terminy zajęć

14.09.2019 (sobota): 9:00-14:00
15.09.2019 (niedziela): 9:00-14:00

Dokładna lokalizacja kursu będzie dostępna dla Słuchaczy, którzy opłacili kurs, po zalogowaniu się na swoje konto Słuchacza.

Dane kursu

  • 16C60
  • Edycja XVI - lato 2019
  • 14.09.2019
  • Piotr Jałowiecki
  • 12
  • 18
  • Człowiek i technika
  • 400 zł
  • 150 zł
  • Kampus SGGW Ursynów