📢 Announcement
Vabljeno predavanje: Erik Štrumbelj
Grega Repovš
Vabimo vas na predavanje prof. Erika Štrumblja z naslovom “Neparametrični testi v teoriji in praksi”, ki bo potekalo v sredo 6. marca od 14:40 do 16:20 v predavalnici 15 na Filozofski fakulteti v Ljubljani.
Profesor Erik Štrumbelj je eden redkih slovenskih raziskovalcev, katerih osnovno raziskovalno področje je statistika. Ni le uporabnik statističnih metod in postopkov temveč jih aktivno raziskuje, razvija ter naslavlja teoretična in praktična vprašanja vezana na njihovo uporabo v raznolikih kontekstih. Če z njim zapletete v pogovor, boste lahko načeli vprašanja, kot so “ali so pie charts res tako hudo neustrezen način prikaza informacij”, “kako narediti slikovni prikaz podatkov čimbolj informativen”, “če bi znali dobro uporabljati le bootstrap, bi lahko z njim nadomestili vse ostale statistične teste”? Je raziskovalec, ki se sprašuje in odgovarja na vprašanja o temeljnih predpostavkah statističnih metod ter ustreznosti in smiselnosti njihove uporabe v različnih kontekstih. Poleg osnov statistike se posveča tudi področjem verjetnosti, strojnega učenja in je strokovnjak za Bayesovo statistiko. Če ga ujamete v prostem času, vam bo morda zaupal, da se vrača z vaje z bandom v katerem igra bas kitaro – hobi, ki ga je navdušil v zadnjih letih.
Na vabljenem predavanju bo Erik delil spoznanja o uporabi neparametričnih statističnih testov. Tema je relevantna za vse, ki se pri svojem delu srečujemo z analizo podatkov in statističnim testiranjem ter pri tem delamo s podatki, ki – vsaj navidez – odstopajo od normalne distribucije, kot tudi za vse tiste, ki smo uporabniki spoznanj, ki slonijo na uporabi neparametričnih testov. Povedano drugače, predavanje je relevantno za vse študente, strokovnjake in raziskovalce na področju psihologije kot tudi vseh drugih področjih uporabe statistike in statističnih testov.
Srčno vabljeni!
Neparametrični testi v teoriji in praksi
Neparametrični testi v teoriji in praksi
Podobno kot drugje v psihologiji ter znanstvenem in strokovnem delu v splošnem, tudi na področju statistike delo pogosto vodijo in usmerjajo davno oblikovani protokoli in hevristike, za katere je dobro občasno preveriti predpostavke in izhodišča, na katerih temeljijo, ter njihov dejanski vpliv in učinek na veljavnost rezultatov. Med takšne ustaljene prakse sodi tudi uporaba neparametričnih testov.
Statistična literatura in praksa v empirični znanosti večinoma pravita, da so neparametrični testi robustna alternativa parametričnim testom. Uporabimo jih, med drugim, ko naša porazdelitev ni normalna, ko imamo malo podatkov, osamelce, ali ko želimo manj predpostavk. V resnici ni tako preprosto in slepo sledenje tem receptom privede do nepotrebne uporabe neparametričnih testov, manjše moči testov in do napačnih zaključkov. Na primeru ocenjevanja pričakovane vrednosti (lokacije) bomo pokazali, kaj neparametrični testi so in kako se izogniti tipičnim napakam pri njihovi uporabi.
Posnetek predavanja
Kratek povzetek
Uporaba neparametričnih testov je eden od statističnih ritualov, ki je potreben presoje o smiselnosti. Ritual, ki ga pogosto srečamo tudi v statističnih učbenikih, lahko opišemo na naslednji način: Ko zbereš podatke in pričenjaš s statistično analizo, izvedi test normalnosti porazdelitve podatkov. Če test pokaže statistično pomembno odstopanje od normalnosti, uporabi neparametrične teste, sicer nadaljuj z uporabo parametričnih testov.
Opisan ritual sloni na dveh predpostavkah: (i) neparametrični testi vključujejo malo ali nič predpostavk o porazdelitivi in (ii) neparametrični testi so bolj robustni kot parametrični. Splošno uveljavljena vodila so, da je potrebno neparametrične teste uporabljati, (i) ko podatki niso normalno porazdeljeni, (ii) v primeru ordinalnih podatkov, (iii) v primeru očitnih osamelcev in (iv) v primeru majhnih vzorcev. S pomočjo simulacij in analize, kako neparametrični testi delujejo, Erik pokaže, da skorajda nič od zapisanega ne drži.
Problema v uporabi rituala sta dva. Prvič, testi normalnosti so pri majhnih vzorcih nezanesljivi in ne odkrijejo nenormalnosti prav pri velikosti vzorca, kjer naj bi imeli neparametrični testi prednost pred neparametričnimi. Pri velikih vzorcih, kjer tudi ob kršenju predpostavke o normalnosti parametrični testi delujejo dobro, pa že ob manjših odstopanjih zavrnejo ničelno hipotezo normalnosti, kar v najboljšem primeru vodi do nepotrebne uporabe neparametričnih testov, v slabšem pa do neveljavnih zaključkov. Drugič, v nasprotju s prepričanjem, najbolj pogost neparametrični test za eno skupino predpostavlja simetričnost porazdelitve podatkov. Kršitev simetričnosti lahko hitro privede do zavrnitve ničelne hipoteze tudi, ko je ta pravilna.
Svoje zaključke Erik ilustrira s pomočjo simulacij podatkov iz znanih porazdelitev ter njihovega testiranja s pomočjo t-testa in Wicoxonovega testa rangov pri različnih velikostih vzorca. R skripti sta pripeti.
Vabilo
V naslednjem predavanju z naslovom Vse, kar potrebujete, je neparametrični bootstrap 20. marca 2024 ob 14:40 v predavalnici 15 Filozofske fakultete bo Erik predstavil uporabo metode bootstrap kot preproste in učinkovite metode za statistično sklepanje, tudi kot nadomestek neparametričnih in parametričnih testov. Kratka napoved in vabilo sta dostopna na spletni strani.
Posnetek predavanja
Kratek povzetek
Uporaba neparametričnih testov je eden od statističnih ritualov, ki je potreben presoje o smiselnosti. Ritual, ki ga pogosto srečamo tudi v statističnih učbenikih, lahko opišemo na naslednji način: Ko zbereš podatke in pričenjaš s statistično analizo, izvedi test normalnosti porazdelitve podatkov. Če test pokaže statistično pomembno odstopanje od normalnosti, uporabi neparametrične teste, sicer nadaljuj z uporabo parametričnih testov.
Opisan ritual sloni na dveh predpostavkah: (i) neparametrični testi vključujejo malo ali nič predpostavk o porazdelitivi in (ii) neparametrični testi so bolj robustni kot parametrični. Splošno uveljavljena vodila so, da je potrebno neparametrične teste uporabljati, (i) ko podatki niso normalno porazdeljeni, (ii) v primeru ordinalnih podatkov, (iii) v primeru očitnih osamelcev in (iv) v primeru majhnih vzorcev. S pomočjo simulacij in analize, kako neparametrični testi delujejo, Erik pokaže, da skorajda nič od zapisanega ne drži.
Problema v uporabi rituala sta dva. Prvič, testi normalnosti so pri majhnih vzorcih nezanesljivi in ne odkrijejo nenormalnosti prav pri velikosti vzorca, kjer naj bi imeli neparametrični testi prednost pred neparametričnimi. Pri velikih vzorcih, kjer tudi ob kršenju predpostavke o normalnosti parametrični testi delujejo dobro, pa že ob manjših odstopanjih zavrnejo ničelno hipotezo normalnosti, kar v najboljšem primeru vodi do nepotrebne uporabe neparametričnih testov, v slabšem pa do neveljavnih zaključkov. Drugič, v nasprotju s prepričanjem, najbolj pogost neparametrični test za eno skupino predpostavlja simetričnost porazdelitve podatkov. Kršitev simetričnosti lahko hitro privede do zavrnitve ničelne hipoteze tudi, ko je ta pravilna.
Svoje zaključke Erik ilustrira s pomočjo simulacij podatkov iz znanih porazdelitev ter njihovega testiranja s pomočjo t-testa in Wicoxonovega testa rangov pri različnih velikostih vzorca. R skripti sta pripeti.
Vabilo
V naslednjem predavanju z naslovom Vse, kar potrebujete, je neparametrični bootstrap 20. marca 2024 ob 14:40 v predavalnici 15 Filozofske fakultete bo Erik predstavil uporabo metode bootstrap kot preproste in učinkovite metode za statistično sklepanje, tudi kot nadomestek neparametričnih in parametričnih testov. Kratka napoved in vabilo sta dostopna na spletni strani.