Statistica
Statistica inferentialaInferenta = operatia prin care pe baza acceptarii unor enunturi ca adevarate, se accepta ca adevarat un alt enunt derivat logic din celelalte enunturi (acelasi principiu ca la inductie matematica sau inferenta logica). Inferenta statistica=obtinerea unor concluzii asupra caracteristicilor unei populatii, pe baza statisticilor unui esantion (extras din populatia respectiva). Populatie (statistica) = multime de entitati care satisfac un criteriu prestabilit (propriu unei cercetari). Entitatile sunt de obicei, in psihologie, indivizi. Observatie: Acelasi individ poate face parte din mai multe populatii. (vezi detalii in Stan&Clocotici Statistica aplicata in psihologie cap6.) Parametru = indicator numeric calculat din date care provin de la toti membrii populatiei. Are valoare fixa si se modifica doar la modificarea marimii populatiei. Esantion = submultime a populatiei statistice. Inferenta statistica presupune estimarea valorii parametrilor (populatiei) pe baza statisticilor din esantion. Esantionul este alcatuit din unitati de sondaj. Marimea unui esantion este data de numarul de unitati. Sondajul/esantionarea = operatia de formare a unui esantion. Clasificarea esantioanelordupa marime/volum: o esantioane mici pana in 30 o esantioane mari peste 30 dupa modul de selectare a elementelor (avem cel putin 2 esantioane) o esantioane dependente 2 situatii: aceeasi indivizi in ambele esantioane. Ex:: cercetarile cu masuratori repetate (in mai multe etape) vezi mai jos ; egalizarea indivizilor din punctul de vedere al caracteristicilor. Ex: daca in primul esantion am subiecti de sex masculin, cu varste intre 25-30 de ani, cu studii superioare, atunci, in al doilea esantion trebuie sa am subiecti cu aceleasi caracteristici (sex masculin, varsta intre ) o esantioane independente avem indivizi diferiti in cele doua esantioane, iar selectarea indivizilor dintr-un esantion nu depinde de selectarea indivizilor din celalalt esantion - nu este necesar sa aiba aceleasi caracteristici ba, mai mult, trebuie sa se diferentieze din punctul de vedere al uneia dintre caracteristici. Ex: 2 esantioane diferentiate dupa caracteristica sex un esantion cu subiecti de sex masculin si altul cu subiecti de sex femenin. Esantioanele depndente sunt utilizate in 3 tipuri de cercetari: cercetari in care este necesara controlarea factorului de variatie la nivelul individului. Ex: cercetarile longitudinale panel cercetari in mai multe etape legate intre ele (cu masurari repetate). Ex: cercetarea efectului repetitiei asupra memoriei: in prima etapa se cere subiectilor citirea unei liste de 20 de cuvinte si sa precizeze cuvintele pe care le-au retinut; in a doua etapa li se cere subiectilor sa reciteasca lista si se verifica iar numarul de cuvinte pe care le-au retinut samd (se repeta acelasi lucru). Printr-o astfel de cercetare s-a obtinut curba memoriei lui Ebbinghaus. cercetari in care este necesara controlarea factorului de variatie la nivelul esantionului. Reprezentativitatea unui esantion = capacitatea esantionului de a reproduce cat mai fidel structurile si caracteristicile populatiei din care este extras. Se exprima cantitativ prin 2 indicatori: Eroarea maxima: d = v* v exprima cea mai mare diferenta acceptata intre o valoare gasita pe esantion (v*) si valoarea corespunzatoare din populatie (v).
Nivelul de inredere/probabilitate: P arata ce sanse exista ca eroarea comisa cand se aproximeaza valoarea v (necunoscuta) prin valoarea v*, sa nu depaseasca limita d. Vorbim de o eroare d cand avem in vedere:
Cu ajutorul valorii d si a unei valori v* determinata pe un esantion (media, proportia, abaterea standard etc.) se construieste intervalul de incredere pentru parametrul populatiei (v) : (v* d, v* + d). Ex: pe esantion am gasit o proportie de subiecti de sex feminin de 54%, iar eroarea d = 2%. Atunci proportia de subiecti de sex feminin din populatie se va gasi in intervalul : (54 2, 54 + 2), adica (52, 56). Principii legate de stabilirea reprezentativitatii unui esantion: 1.Plasarea valorii pentru populatie in intervalul (v* d, v* + d) nu este niciodata sigura; ea are loc cu probabilitatea P (0,95 sau 0,99 si respectiv 95% sau 99%). Prin urmare, reprezentativitatea se exprima prin ambii termeni: d si P. 2.Reprezentativitatea este pentru o caracteristica data; nu vorbim in general de ea. Ex: pentru acelasi esantion care are doua caracteristici: sex si varsta, vom avea o reprezentativitate pentru carasteristica sex data de cuplul (d1, P1) si o reprezentativitate pentru carasteristica varsta data de cuplul (d2, P2). 3.Reprezentativitatea este o notiune relativa; astfel un esantion este mai mult sau mai putin reprezentativ (nu avem niciodata reprezentativitate totala 100% vezi principiul 1: P este maxim 99%, dar nici reprezentativitate nula). Putem compara esantioanele din punctul de vedere al reprezentativitatii pentru o caracteristica 4 situatii:
4.Cele doua marimi d si P nu sunt independente. Fixand una dintre ele, cealalta se calculeaza. Dependenta lor se exprima astfel: cu cat scade eroarea (d), cu atat scade si probabilitatea (P). Prin urmare, nu putem ameliora simultan si precizia estimarii (d) si siguranta acesteia (P). 5.Indicatorul p exprima riscul de eroare si este 0,05 sau 0,01 si, respectiv, 5% sau 1 %. Se obtine prin: p=1 P sau p=100% P. Putem vorbi de un esantion reprezentativ, daca in raport cu toate caracteristicile cercetate, eroarea d se afla sub o limita acceptabila, iar marimea p se afla sub pragul de 5% (sau P peste 95%). Gradul de reprezentativitate al unui esantion depinde de urmatoarele a) caracteristicile populatiei un esantion este mai reprezentativ pentru caracteristici ce evidentiaza o mai mare omogenitate (similaritate din punctul de vedere al caracteristicii respective. Ex: populatia studentilor din Iasi este mai omogena din punctul de vedere al varstei decat intreaga populatie a Iasului). Aceasta este o consecinta a legaturii dintre omogenitatea unei caracteristici (exprimata prin indicatori ai imprastierii, din care cel mai folosit este abaterea standard) si eroarea de esantionare (care, cu cat este mai mica, arata o reprezentativitate mai mare a esantionului). Legatura este urmatoarea: eroarea de esantionare este direct proportionala cu abaterea standard (cu cat creste abaterea standard, adica imprastierea care indica neomogenitate, cu atat creste eroarea de esantionare, adica scade reprezentativitatea esantionului). b) Marimea esantionului ( ! Nu a populatiei) Reprezentativitatea creste odata cu numarul de indiviza din esantion, dar aceasta crestere nu este direct proportionala cu cresterea volumului esantionului. Pentru un numar mic de subiecti, adaugarea altora aduce o crestere mare a reprezentativitatii, dar pentru un numar mai mare de subiecti, adaugarea altora duce la o crestere foarte mica a reaprezentativitatii. Observatii: reprezentativitatea nu depinde de marimea populatiei in practica, cresterea efectivului esantionului nu se face pentru sporirea reprezentativitatii acestuia, ci din necesitatea reprezentativitatii unor subgrupuri din esantion corespunzatoare unor subpopulatii. Daca in esantion am un subgrup de 2 subiecti care corespunde unei subpopulatii este evident ca acest subgrup (un esantion si el) nu este reprezentativ pentru subpopulatie (care este populatie pentru esantionul reprezentat de subgrupul din esantionul initial). Prin urmare, apare necesitatea maririi subgrupului astfel incat sa devina reprezentativ, ceea ce duce si la o marire a esantionului mare (initial). Acesta din urma nu va avea o influenta foarte mare asupra reprezentativitatii esantionului mare (care era reprezentativ). Deci, cresterea efectivului se face pentru sporirea reprezentativitatii unor subgrupuri din esantion si nu a esantionului. c) Se poate calcula reprezentativitatea unui esantion doar pentru esantioane obtinte prin tehnici aleatoare sau probabilistice. Chiar si intre acestea exista diferente mari in ce priveste asigurarea reprezentativitatii. Estimator = o entitate a carei valoare poate fi folosita ca valoare aproximativa pentru o alta entitate. Estimatie = valoarea estimatorului. Estimatie statistica = valoarea care aproximeaza, pe baza datelor de sondaj (din esantion), valoarea necunoscuta a unui parametru al populatiei.
|