Statistica
Repartitii de frecventa - reprezentarea grafica: poligonul frecventelor si histogramaAsocierea dintre distributia observata si cea teoretica a fost mult timp neglijata in geografie. Un studiu statistic nu poate fi facut (nu are sens) fara aceasta asociere. Forma unei distributii permite gasirea parametrilor descriptivi cei mai potriviti pentru fenomenul urmarit. Recunoasterea formei unei distributii este un indiciu pentru procedurile de transformare a datelor in mod corespunzator. Totodata incadrarea intr-o lege de distributie teoretica permite atat operatii de interpolare cat si de extrapolare. Ajustarea unei distributii observate la o distributie teoretica-adica la modele probabiliste propriu-zise-implica acceptarea a priori ca legile se incadreaza in repartitia observata/masurata a fenomenului in cauza. O cantitate masurabila care poate varia de la un element la altul se numeste caracteristica cantitativa. Uneori se mai foloseste termenul de variabila. Ansamblul notiunilor consacrate acestor caracteristici poarta numele generic de teoria caracteristicilor cantitative. Reamintim ca, caracteristicile care pot lua orice valoare numerica intre anumite limite sunt numite caracteristici cantitative (variabile) continue. Caracteristicile care pot lua numai anumite valori se numesc caracteristici cantitative (variabile) discrete (discontinue). Daca mai multe sute sau mii de valori ale unei variabile au fost notate intr-o ordine cu totul arbitrara in care au aparut ele in realitate, va fi dificil sa tragem vreo concluzie cu privire la semnificatia acestor date. De aceea va trebui sa condensam datele cu ajutorul unor anumite metode de ordonare sau grupare astfel ca proprietatile datelor sa poata fi usor evidentiate. De regula valorile alese pentru a defini grupele succesive vor fi echidistante, astfel ca numerele provenite din observatii si care apartin la diferite grupe sa poata fi comparabile. Modul in care frecventele de grupa sunt repartizate in intervale succesive se numeste repartitia de frecventa a variabilei. Reprezentarea grafica: poligonul frecventelor si histograma. Deseori este convenabil sa reprezentam o repartitie de frecventa cu ajutorul unei diagrame care sa sugereze configuratia observatiilor. Histograma
- poligonul frecventei: unirea punctelor marcate pe verticala pe mijlocul intervalului.
De observat ca oricare ar fi aceste diagrame (orice forma ar avea), o anumita arie reprezinta un numar de observatii.
Numarul de observatii care cad in intervalul [x1, x2] este proportional cu aria delimitata de curba si cele doua drepte.
Daca intervalele de grupa sunt micsorate, in acelasi timp numarul de observatii creste, astfel incat frecventele de grupa sa ramana finite, poligonul si histograma se apropie din ce in ce mai mult de o curba neteda. O astfel de linie ideala a poligonului si histogramei se numeste curba de frecventa. Este un concept esential in statistica. Cand vom aborda teoria selectiei va trebui sa privim curba de frecventa ca reprezentand o populatie din care datele reale reprezinta un esantion. Poligonul frecventelor si histograma vor fi aproximate cu o curba, dar se vor indeparta de ea in anumite portiuni, datorita fluctuatiilor selectiei. Atunci cand numarul de observatii este considerabil, sa zicem 1000, poligonul frecventelor este suficient de neted pentru a da o buna imagine a formei repartitiei ‘ideale.’ Cateva tipuri uzuale de repartitii de frecventa. Formele histogramelor corespunzatoare diferitelor date statistice sunt aproape fara sfarsit in varietatea lor, dar printre ele putem distinge un numar relativ mic de tipuri fundamentale. 1) Repartitia simetrica. Valoarea medie este valoarea maxima si centrata, iar extremele descresc si tind spre zero (distributia normala) – ideal.
2) Repartitia moderat-asimetrica (oblica). Frecventele de grupa descresc cu mare rapiditate intr-o parte si mai lent in cealalta parte. Este cazul cel mai frecvent.
3) Repartitia in forma de U. Frecventele maxime sunt la capetele intervalului de variatie. Este rar.
4) Repartitia extrem asimetrica.
|