MD360P03Z Statistika
Stránka přednášejícího doc. Zváry: http://www.karlin.mff.cuni.cz/~zvara
Předběžný program výuky (pro rok 2007/08 je stejný jako 2006/07):
plan0607.xls
Předběžný program výuky pro rok 2005/06:
rozvaha.xls
Odkaz na stránku s datovými soubory v MS Excel
Příklady úloh na zápočet: zapAB.R
Tabulky kritických hodnot
tabulka.pdf
Instalace programu R:
Je to volně šiřitelný program, dostupný například
zde .
Zvolíte Windows (95 and later),
na dalším odkazu volba base, dále Setup program (číslování dle aktuální verze).
Tento soubor si stáhnete a po jeho spuštění se program nainstaluje.
Datové soubory pro použití s programem R:
soubor data.zip - prij.RData, kraje.RData, okresy.RData (byly upraveny názvy dat uvnitř souborů na okresy, resp. kraje)
soubor kojeni.zip - data používaná k výpočtům v přednášce doc. Zváry
soubor odhady06.zip - odhady studentů (2006/07)
soubor odhady.zip - odhady studentů (2005/06)
Soubory s programem a postupem cvičení - v roce 2007/08 (stejné jako 2006/07):
- 1. cvičení (2. 10. 2007)
- prij01.R
četnosti (absolutní, relativní, kumulativní) a jejich výpočet; histogram; určování mediánu
- 2. cvičení (9. 10. 2007)
- prij02.R
charakteristiky polohy a jejich vlastnosti, výpočet průměru, rozptylu, mediánu a kvartilů; krabicový diagram (boxplot).
- 3. cvičení (16. 10. 2007)
-
kraje.R - opraven název tabulky dat na kraje,
stred.R.
krabicový diagram, např. pro ss2, rozdělení podle pohlaví apod.;
geografický střed jako aplikace váženého průměru
- 4. cvičení (23. 10. 2007)
- okresy.R - opraven název tabulky dat na okresy, mapaCR.doc,
Lorenz.R, Lorenz2.R
geografický medián, koeficient koncentrace, Lorenzova křivka
- 5. cvičení (30. 10. 2007)
- Opakování Lorenzovy křivky, geografického mediánu. Giniho koncentrační koeficient - výpočet s konkrétními hodnotami počtu obyv (8, 10, 30, 12) a
rozlohou (1, 2, 3, 4) na tabuli.
Binomické rozdělení. Náhodný pokus hod kostkou, resp. mincí. 12 (resp. 8) opakování a zjišťování četností, s jakou náhodná veličina (počet padnutí konkrétní strany kostky resp. mince) nabyla příslušné hodnoty. Výpočet pravděpodobností, porovnání s relativními četnostmi.
Skupina 1 2006 - 6 opakování, (0; 7), (1; 9), (2; 4).
Skupina 2 2006 - 10 opakování, (0; 3), (1; 8), (2; 4), (3; 3), (4; 2), (5; 2), (6; 1).
Skupina 2 2007 - mince, 8 opakování, (0; 0), (1; 3), (2; 1), (3; 4), (4; 6), (5; 4), (6; 2), (7; 1), (8; 0).
- 6. cvičení (6. 11. 2007)
- Data z odhadů - grafické znázorňování závislostí veličin různého typu (krabicový diagram, xy graf, tabulka četností).
Pravděpodobnosti jevů - konkrétní výpočty vč. podmíněné psti.
binom.R, norm.R - rozdělení - příklad binomického (diskrétní) a normálního (spojitá veličina). Distribuční funkce a hustota.
- 7. cvičení (14. 11. 2006)
- Opakování normálního rozdělení, souvislost distribuční fce a hustoty.
Výběrový průměr a jeho variabilita. Interval spolehlivosti pro populační průměr a jeho konstrukce
vybprum.R.
- 8. cvičení (21. 11. 2006)
- Výpočty z-skórů a jejich význam; šikmost, špičatost. Opakování intervalu spolehlivosti pro populační průměr, pro relativní četnost. Testováni hypotéz - úvod.
intspol2.R.
- 9. cvičení (28. 11. 2006)
- testy1.R
Střední hodnota náhodné veličiny. Opakování jednovýběrového t-testu. Dvouvýběrový t-test.
- 10. cvičení (5. 12. 2006)
- testy2.R
Testování hypotéz - procvičování. Opakování dvouvýběrového t-testu. Dvouvýběrový Wilcox. test, párové testy.
- 11. + 12.cvičení
- testy3.R, prijexcel.xls
Ukázka výpočtu dvouvýběrového
t-testu v programu MS Excel.
Regrese a korelace (závislost dvou spojitých veličin).
Kontingenční tabulky a jejich hodnocení (závislost dvou nominálních veličin).
- 13.cvičení (9. 1. 2007)
- zapAB.R
Samostatná práce - viz zadání v souboru.
Soubory s programem a postupem cvičení - v roce 2005/06 (pro předběžnou představu):
- 1.cvičení
- prij01.R
četnosti (absolutní, relativní, kumulativní) a jejich výpočet; histogram; určování mediánu
- 2.cvičení
- prij02.R,
kraje.R,
okresy.R,
mapaCR.doc,
stred.R.
charakteristiky polohy a jejich vlastnosti, výpočet průměru, rozptylu, mediánu a kvartilů; krabicový diagram (boxplot); geografický medián
- 3.cvičení
-
stred.R,
Lorenz.R,
prijexcel.xls (výpočty na datech prij prováděné v Excelu).
vážený průměr, geografický střed; střední diference, Ginniho koeficient koncentrace, Lorenzův oblouk
- 4.cvičení
- dvevelic.R.
opakování geogr. střed a koef. koncentrace; výpočty z-skórů, šikmosti; závislost dvou kvalitativních veličin - kontingenční tabulky, výpočet očekávaných četností (kdyby jevy byly nezávislé...)
- 5.cvičení
- dvevelic.R.
dvě veličiny, výpočet korelačního koeficientu; pravděpodobnost jevů, nezávislost jevů
- 6.cvičení
- binom.R, norm.R.
- 7.cvičení
- Lorenz2.R,
program1611.R
znovu koeficient koncentrace (na osách vynášíme kumulativní relativní četnosti dvou veličin); výpočet střední hodnoty jako očekávané průměrné výhry,
normální rozdělení a jeho hustota a distribuční funkce, výběrový průměr a jeho variabilita, interval spolehlivosti.
- 8.cvičení
- intspol.R ,
odhady.xls.
Intervaly spolehlivosti, kritické hodnoty normálního a t rozdělení.
Výpočty v Excelu.
- 9.cvičení
- ttesty.R ,
odhady.xls.
Dvouvýběrový t-test, Wilcoxonův dvouvýběrový test, párový t-test.
- 11.cvičení
- korel.R .
Regrese a korelace, závislost dvou spojitých veličin.
- 12.cvičení
- zap1.R .
Samostatná práce.
Zpět na úvodní stránku