Statistica
Estimarea parametrilor statistici - estimarea medieiParametrii calculati pentru o colectivitate de selectie pot fi generalizati la intreaga colectivitate in anumite conditii. Aceasta generalizare se refera, in particular, la estimarea parametrilor necunoscuti ai colectivitatii initiale (generale). Determinand un anumit parametru, ne propunem sa obtinem o marime, care intr-o masura oarecare sa fie cat mai apropiata de valoarea reala a parametrului necunoscut. In caz contrar cautam niste limite in interiorul carora, cu o anumita probabilitate, putem afirma ca se afla marimea reala a parametrului necunoscut. In acest caz avem de-a face cu un interval de incredere pentru parametrul necunoscut. Consideram ca populatia statistica satisface legea normala. Astfel toti parametri estimati fac referire la o distributie normala de frecventa.
Estimarea mediei Vom nota cu σ 2 dispersia colectivitatii generale, cu s2 dispersia colectivitatii de selectie (a esantionului). Masura erorii standard pentru medie este
Unde n este marimea esantionului (nr. elementelor care formeza esantionul). In aceasta situatie estimarea pentru media colectivitatii generale este : cu o probabilitate de 0,682 cu o probabilitate de 0,954 cu o probabilitate de 0,997 Estimarea pentru abaterea medie patratica Limitele de confidenta pentru o abatere medie patratica pot fi estimate intr-o maniera similara. Pentru aceasta introducem notiunea de eroare standard a abaterii medii patratice
In mod analog intervalele de incredere sunt date de cu o probabilitate de 0,682 cu o probabilitate de 0,954 cu o probabilitate de 0,997
Estimarea proportiilor Formulele pentru erorile standard pot fi aplicate doar pentru a estima media si abaterea medie patratica. Sunt situatii cand avem exprimari procentuale, cum ar fi procentul de persoane care au optat pentru o anumita situatie (care au votat pentru un partid). Astfel eroarea standard pentru estimarea procentelor este :
unde p este procentul din esantion care poseda un anumit atribut, q este procentul din esantion care nu poseda acel atribut, iar n este numarul de indivizi din esantion. Exemplu. Pe un esantion de 50 indivizi s-a evaluat ca 86% dintre acestia au televizoare (p). Procentul pentru cei care nu au televizoare (q) este de 100 – 86 = 14 (nu au fost numarati ci dedusi). Avem :
Asa cum am procedat la celelalte estimari aceasta eroare standard pote fi folosita pentru a stabili limitele de confidenta a procentului estimat al colectivitatii generale. Astfel avem : Populatia gen % = esantion % ± E% cu probabilitate 0,682 Populatia gen % = esantion % ±2 E% cu probabilitate 0,954 Populatia gen % = esantion % ±3 E% cu probabilitate 0,997 Pentru exemplul de mai sus semnificatia este urmatoarea. Avem o probabilitate de 0,682 ca detinatorii de aparate TV sa fie undeva intre 81,09% si 90,91% (adica 86-4,91 si 86 + 4,91). La un nivel de confidenta de 0,954, procentele vor fi intre 76,18% si 95,82% (86-2 4,91 si 86+2 Marimea esantionului In cele expuse mai sus am introdus erorile standard pentru anumite marimi estimate. Acestea permit evaluarea limitelor de confidenta pe baza unor ipoteze (distributia normala a populatiei si un esantion obtinut intr-o maniera aleatoare). Pentru evaluarea efectiva a acestora trebuie sa stim doar doua lucruri : marimea (n) si abaterea medie patratica (s) a esantionului. In cele ce urmeaza vom revedea problema invers : cat de mic trebuie sa fie esantionul (n) astfel incat media si abaterea medie patratica sa aibe niste limite de confidenta specificate. Din formula erorii pentru medie
explicitam pe n :
Ex. Daca vrem sa avem o eroare pentru medie de 0,25 si o dispersie de 2 => n = 64 Estimari provenite din esantioane mici In general cel care face estimari pe baza de esantioane este o persoana prudenta. Daca esantioanele sunt mici aceasta prudenta trebuie marita. Asa cum am vazut pana acum abaterea medie patratica a esantionului (s) este foarte importanta pentru stabilirea limitelor de confidenta ale mediei si abaterii medii patratice pentru colectivitatea generala. Cand se lucreaza cu esantioane mici, de 10 sau mai mici, trebuie sa adoptam niste limite de confidenta mai mari. Astfel estimarea abaterii standard va fi inlocuita cu « cea mai buna estimare a abaterii » notata cu si care se calculeaza din formula
sau daca calculam direct din esantion
Se observa ca pentru esantioane mari aceasta valoare nu difera prea mult de s, dar pentru valori mici ale lui n aceasta diferenta poate fi semnificativa. Valoarea lui este ceva mai mare decat s si astfel limitele de confidenta vor fi mai largi. Toate calculele privitoare la erori se vor face cu si nu cu s.
|