Statistica
Dispersia in cazul caracteristicii alternative - felurile dispersiilor - analiza dispersionalaDispersia in cazul caracteristicii alternative - Felurile dispersiilor - Analiza dispersionala Dupa cum se cunoaste, in cazul caracteristicii alternative valoarea medie este egala cu proportia numarului unitatilor care detin caracteristica urmarita in totalul unitatilor care formeaza colectivitatea statistica (p). Pentru caracteristica alternativa dispersia si abaterea medie patratica se calculeaza astfel:
Notatia q” este acordata proportiei numarului unitatilor care nu detin caracteristica urmarita in totalul unitatilor care formeaza colectivitatea statistica si in consecinta, . De asemenea, se mentioneaza ca p” este ponderea (frecventa) relativa pentru varianta 1, iar q” este ponderea relativa pentru varianta 0. Felurile dispersiilor Pentru a marii paleta concluziilor care privesc aspectele structurale ale colectivitatilor statistice se procedeaza la impartirea acestora in grupe omogene dupa doua sau mai multe caracteristici. Grupele constituite difera intre ele atat prin valoarea lor medie, cat si prin nivelul intern al gradului de variabilitate. Indicatorii variatiei calculati pentru intreaga colectivitate sintetizeaza doua categorii de influente: - influenta factorilor cu actiune intamplatoare localizati la nivelul grupelor care determina variatia interna a grupelor; - influenta factorilor obiectivi reprezentati prin continutul si tipologia caracteristicilor de grupare care au puterea de a determina departajarea colectivitatii in grupe care evidentiaza tipuri calitative distincte si care determina variatia dintre grupe. Analiza colectivitatilor statistice impartite pe grupe, prin calcularea unor indicatori specifici ai variatiei, are in vedere urmatoarele tipuri de indicatori: - dispersia caracteristicii statistice la nivelul colectivitatii (dispersia generala), - dispersia caracteristicii statistice la nivelul fiecarei grupe (dispersia de grupa), - media dispersiilor calculate pe grupe, - dispersia dintre grupe. a) Dispersia generala () oglindeste variatia caracteristicii statistice existenta in colectivitatea totala si produsa ca urmare a influentei tuturor factorilor obiectivi si intamplatori care actioneaza asupra unitatilor statistice,
in care, sunt cele “i” variante ale caracteristicii din grupa “j”, este media caracteristicii la nivelul colectivitatii totale, k reprezinta numarul de grupe in care s-a impartit colectivitatea, este frecventa grupei “j”, este frecventa variantei “i” din grupa “j”. b) Dispersia de grupa () caracterizeaza variatia caracteristicii la nivelul unei grupe de unitati, in care, este valoarea medie a caracteristicii in grupa “j”. c) Media dispersiilor calculate pe grupe () reflecta acea parte din variatia caracteristicii, existenta in colectivitatea totala, care este produsa de factorii cu actiune intamplatoare,
d) Dispersia dintre grupe () este masura gradului de imprastiere a mediilor calculate pe grupe de la media generala. Aceasta dispersie reflecta variatia caracteristicii din colectivitatea totala provocata de influenta factorului obiectiv reprezentat prin caracteristica folosita pentru a realiza gruparea,
Rezulta, din cele expuse, ca dispersia generala cumuleaza atat influenta factorilor intamplatori cat si influenta factorului obiectiv, respectiv a factorului de grupare, exprimand, astfel, masura nivelului total al varibilitatii caracteristicii studiate, fapt confirmat si prin relatia care atesta “regula de adunare a dispersiilor”,
Analiza dispersionala Analiza dispersionala este o operatiune de testare statistica ce se bazeaza pe felurile dispersiilor si care ofera posibilitatea cunoasterii unor aspecte definitorii, cum ar fi: - semnificatia factorului principal de grupare, - identificarea existentei unei corelatii statistice intre doua variabile, - semnificatia raportului de corelatie, - egalitatea a doua sau mai multor valori medii calculate pentru caracteristici statistice identice inregistrate de unitatile care compun colectivitatile supuse comparatiei. Analiza dispersionala, datorita suportului sau metodologic de aplicare, se mai numeste si Criteriul F” deoarece se conformeaza legii de repartitie Fisher. Verificarea “ipotezei nule” cu ajutorul Criteriului F” consta in a compara o marime F-statistic, obtinuta prin calcul pe baza datelor de observare, cu o marime F-tabelara. Valoarea tabelara este o marime teoretica care se extrage din tabela cu valorile functiei de repartitie Fisher in functie de probabilitatea cu care se doreste sa fie garantata concluzia testarii (pragul de semnificatie) si de numarul gradelor de libertate (Anexa 5). Daca F-statistic este mai mare decat F-tabelar, diferenta care se constata intre dispersia dintre grupe si dispersia din interiorul grupelor, are o marime semnificativa din punct de vedere statistic si, in aceste conditii, se respinge ipoteza nula”. Exemplul.7 Verificarea semnificatiei factorului principal de grupare (vechimea in munca) este o operatiune statistica care se poate realiza cu ajutorul analizei dispersionale ( Criteriul F”). Pentru aceasta vom considera situatia din tabelul 7. Tabelul 7 Gruparea salariatilor dupa vechimea in munca si salariul lunar
Numarul randurilor: i = 1,…,v ;Numarul coloanelor: j = 1,…,c Numarul total al unitatilor statistice: Tabloul sinoptic al rezultatelor testarii
Tabelul calculelor intermediare
Deoarece se constata ca, , se respinge ipoteza nula” si prin urmare grupele constituite dupa vechimea in munca difera semnificativ intre ele prin prizma salariului lunar pe care il inregistreaza cei 20 de subiecti. Concluzia prezentata este garantata cu o probabilitate de 95%, sau prezinta un prag de semnificatie (un probabil risc de a gresi) de 5%. In aceste conditii, se confirma faptul ca factorul principal de grupare (vechimea in munca) conduce la o departajare semnificativa a colectivitatii statistice pe trei tipuri calitative. De asemenea, se mentioneaza ca testarea efectuata ne permite sa constatam ca intre vechimea in munca si salariul lunar se identifica o anumita forma de corelatie statistica. Aceasta interdependenta este confirmata si prin modul de dispunere a frecventelor in tabelul 7, care cuprinde datele empirice grupate dupa cele doua caracteristici luate in consideratie () si care tind sa se aglomereze in jurul diagonalei principale. Se remarca faptul ca, pe masura ce are loc o crestere a vechimei in munca se majoreaza si salariul lunar. Nota: In Anexa 6 sunt prezentate si alte aplicatii ale analizei dispersionale precum si modul de calcul si interpretare al felurilor dispersiilor. Numarul gradelor de libertate este dat de diferenta dintre numarul elementelor considerate simultan (numarul unitatilor statistice) si numarul relatiilor independente care le leaga. Se mentioneaza ca numarul gradelor de libertate este un parametru al functiilor de repartitie, Fisher, Student si care au numeroase aplicatii in domeniul verificarii ipotezelor statistice
|