MD360P03Z Statistika

Stránka přednášejícího doc. Zváry: http://www.karlin.mff.cuni.cz/~zvara

Předběžný program výuky (pro rok 2007/08 je stejný jako 2006/07): plan0607.xls

Předběžný program výuky pro rok 2005/06: rozvaha.xls

Odkaz na stránku s datovými soubory v MS Excel

Příklady úloh na zápočet: zapAB.R

Tabulky kritických hodnot tabulka.pdf

Instalace programu R:

Je to volně šiřitelný program, dostupný například zde . Zvolíte Windows (95 and later), na dalším odkazu volba base, dále Setup program (číslování dle aktuální verze). Tento soubor si stáhnete a po jeho spuštění se program nainstaluje.

Datové soubory pro použití s programem R:

soubor data.zip - prij.RData, kraje.RData, okresy.RData (byly upraveny názvy dat uvnitř souborů na okresy, resp. kraje)

soubor kojeni.zip - data používaná k výpočtům v přednášce doc. Zváry

soubor odhady06.zip - odhady studentů (2006/07)

soubor odhady.zip - odhady studentů (2005/06)

Soubory s programem a postupem cvičení - v roce 2007/08 (stejné jako 2006/07):

1. cvičení (2. 10. 2007)
prij01.R
četnosti (absolutní, relativní, kumulativní) a jejich výpočet; histogram; určování mediánu
2. cvičení (9. 10. 2007)
prij02.R
charakteristiky polohy a jejich vlastnosti, výpočet průměru, rozptylu, mediánu a kvartilů; krabicový diagram (boxplot).
3. cvičení (16. 10. 2007)
kraje.R - opraven název tabulky dat na kraje, stred.R.
krabicový diagram, např. pro ss2, rozdělení podle pohlaví apod.; geografický střed jako aplikace váženého průměru
4. cvičení (23. 10. 2007)
okresy.R - opraven název tabulky dat na okresy, mapaCR.doc, Lorenz.R, Lorenz2.R
geografický medián, koeficient koncentrace, Lorenzova křivka
5. cvičení (30. 10. 2007)
Opakování Lorenzovy křivky, geografického mediánu. Giniho koncentrační koeficient - výpočet s konkrétními hodnotami počtu obyv (8, 10, 30, 12) a rozlohou (1, 2, 3, 4) na tabuli.
Binomické rozdělení. Náhodný pokus hod kostkou, resp. mincí. 12 (resp. 8) opakování a zjišťování četností, s jakou náhodná veličina (počet padnutí konkrétní strany kostky resp. mince) nabyla příslušné hodnoty. Výpočet pravděpodobností, porovnání s relativními četnostmi.
Skupina 1 2006 - 6 opakování, (0; 7), (1; 9), (2; 4).
Skupina 2 2006 - 10 opakování, (0; 3), (1; 8), (2; 4), (3; 3), (4; 2), (5; 2), (6; 1).
Skupina 2 2007 - mince, 8 opakování, (0; 0), (1; 3), (2; 1), (3; 4), (4; 6), (5; 4), (6; 2), (7; 1), (8; 0).
6. cvičení (6. 11. 2007)
Data z odhadů - grafické znázorňování závislostí veličin různého typu (krabicový diagram, xy graf, tabulka četností).
Pravděpodobnosti jevů - konkrétní výpočty vč. podmíněné psti.
binom.R, norm.R - rozdělení - příklad binomického (diskrétní) a normálního (spojitá veličina). Distribuční funkce a hustota.
7. cvičení (14. 11. 2006)
Opakování normálního rozdělení, souvislost distribuční fce a hustoty.
Výběrový průměr a jeho variabilita. Interval spolehlivosti pro populační průměr a jeho konstrukce vybprum.R.
8. cvičení (21. 11. 2006)
Výpočty z-skórů a jejich význam; šikmost, špičatost. Opakování intervalu spolehlivosti pro populační průměr, pro relativní četnost. Testováni hypotéz - úvod. intspol2.R.
9. cvičení (28. 11. 2006)
testy1.R
Střední hodnota náhodné veličiny. Opakování jednovýběrového t-testu. Dvouvýběrový t-test.
10. cvičení (5. 12. 2006)
testy2.R
Testování hypotéz - procvičování. Opakování dvouvýběrového t-testu. Dvouvýběrový Wilcox. test, párové testy.
11. + 12.cvičení
testy3.R, prijexcel.xls
Ukázka výpočtu dvouvýběrového t-testu v programu MS Excel.
Regrese a korelace (závislost dvou spojitých veličin).
Kontingenční tabulky a jejich hodnocení (závislost dvou nominálních veličin).
13.cvičení (9. 1. 2007)
zapAB.R
Samostatná práce - viz zadání v souboru.



Soubory s programem a postupem cvičení - v roce 2005/06 (pro předběžnou představu):

1.cvičení
prij01.R
četnosti (absolutní, relativní, kumulativní) a jejich výpočet; histogram; určování mediánu
2.cvičení
prij02.R, kraje.R, okresy.R, mapaCR.doc, stred.R.
charakteristiky polohy a jejich vlastnosti, výpočet průměru, rozptylu, mediánu a kvartilů; krabicový diagram (boxplot); geografický medián
3.cvičení
stred.R, Lorenz.R, prijexcel.xls (výpočty na datech prij prováděné v Excelu).
vážený průměr, geografický střed; střední diference, Ginniho koeficient koncentrace, Lorenzův oblouk
4.cvičení
dvevelic.R.
opakování geogr. střed a koef. koncentrace; výpočty z-skórů, šikmosti; závislost dvou kvalitativních veličin - kontingenční tabulky, výpočet očekávaných četností (kdyby jevy byly nezávislé...)
5.cvičení
dvevelic.R.
dvě veličiny, výpočet korelačního koeficientu; pravděpodobnost jevů, nezávislost jevů
6.cvičení
binom.R, norm.R.
7.cvičení
Lorenz2.R, program1611.R
znovu koeficient koncentrace (na osách vynášíme kumulativní relativní četnosti dvou veličin); výpočet střední hodnoty jako očekávané průměrné výhry, normální rozdělení a jeho hustota a distribuční funkce, výběrový průměr a jeho variabilita, interval spolehlivosti.
8.cvičení
intspol.R , odhady.xls.
Intervaly spolehlivosti, kritické hodnoty normálního a t rozdělení. Výpočty v Excelu.
9.cvičení
ttesty.R , odhady.xls.
Dvouvýběrový t-test, Wilcoxonův dvouvýběrový test, párový t-test.
11.cvičení
korel.R .
Regrese a korelace, závislost dvou spojitých veličin.
12.cvičení
zap1.R .
Samostatná práce.


Zpět na úvodní stránku