Statistica
Modalitǎti de clasificare a datelor - scheme standard de clasificareModul de stabilire a claselor – determinarea pragurilor minime si maxime ale fiecǎrei clase - determinǎ modul in care sunt atribuite valorile fiecǎrei clase si deci felul in care va arǎta distributia. Prin schimbarea claselor se creaza diagrame cu aspect diferit. In general se urmareste ca valori similare sa fie in aceeasi clasa. Exista doi factori cheie in clasificarea datelor : schema de clasificare utilizatǎ si numǎrul de clase ce se doreste a fi creat. Dacǎ datele sunt bine cunoscute se poate predetermina manual numǎrul de clase. In caz contrar se utilizeaza schemele clasice. Cele mai frecvente scheme de clasificare sunt: natural breaks, quantile, intervale egale si deviatia standard. Acestea sunt descrise in cele ce urmeaza. Scheme standard de clasificare Natural breaks (Jenks) Datele se clasificǎ pe baza grupǎrii naturale a valorilor. Se identificǎ punctele de rupturǎ cǎutand acele modele de grupare implicite ale datelor. Valorile sunt impǎrtite in clase acolo unde granitele sunt marcate prin salturi mari de la o valoare la alta.
Quantile Fiecare clasǎ contine un numǎr egal de valori. O astfel de clasificare este foarte potrivitǎ in cazul datelor liniare. Din cauzǎ cǎ datele sunt grupate dupǎ numǎr in fiecare clasǎ, diagrama rezultatǎ poate fi inselǎtoare. Datele similare pot fi plasate in clase diferite, sau valori foarte diferite pot fi grupate impreunǎ. Aceastǎ distorsiune poate fi evitatǎ mǎrind numǎrul de clase.
Intervale egale Aceastǎ schemǎ de clasificare divide sirul de valori atribut in subsiruri egale. Spre exemplu in cazul unui sir de valori de la 1 la 300 si a trei clase, fiecare clasǎ reprezintǎ un sir de 100 ( 1-100, 101-200, 201-300). Aceastǎ metodǎ accentueazǎ cantitatea de valori atribut relativ la celelalte valori, spre exemplu pentru arǎta cǎ un magazin este parte a unui lant de magazine care a realizat o treime din vanzǎri. Cel mai bine se utilizeazǎ pentru siruri de date dintr-un anumit domeniu cum ar fi tempertura si procentele.
Deviatia standardAceastǎ schemǎ de clasificare arata cu cat variaza o valoare de la medie. Se calculeazǎ media si apoi se genereazǎ clasele adǎugand sau scǎzand din ea deviatia standard.
|