Statistica
Corelatia rangurilor - coeficientul lui SpearmanExista cazuri in care ne intereseaza gradul de corelatie dintre doua serii de marimi, dar cand nu putem efectua masuratorile respective. In anumite tipuri de probleme avem de-a face cu caracteristici care nu pot fi exprimate prin cifre, dar pot fi ordonate dupa un aumit criteriu. In astfel de cazuri vom lua in considerare ordinea lor si nu evaluarea numerica. In cazul in care rangul anumitor caracteristici este mai accesibil decat masuratorile efective, pentru examinarea legaturilor dintre anumiti parametrii, putem cerceta corelatia rangurilor respective. Prezentam mai jos cateva procedee de evaluare a anumitor corelatii in care se tine seama de ordonarea marimilor caracteristice, adica in care se utilizeaza rangul sau pozitia pe care le au anumite marimi, una in raport cu alta. Vom determina deci coeficientul de corelatie al rangurilor. Coeficientul lui Spearman Fie n numarul de elemnte ale unei multimi ordonate dupa caracteristici calitativ diferite. Pentru ca avem n unitati statistice A1, A2, , An, fiecare dintre ele avand doua caracteristici (x1, y1), (x2 , y2),,(xn, yn) Pentru caracteristica x dispunem de ordonarea: x1 , x2 ,,xn, iar pentru caracteristica y avem: y1, y2 ,,yn, unde x si y sunt simple permutari ale celor n numere naturale. Notam: di = xi –yi (k=1, 2,,n) unde vectorul de componente di este o marime a gradului de apropiere pe care o poate avea corespondenta dintre x si y. Daca d=0, inseamna ca toti indivizii considerati au cele doua caracteristici in aceeasi ordine, avem deci o corespondenta perfecta. Cu cat diferentele di sunt mai mari, cu atat mai mare este discordanta intre cele doua caracteristici. Pentru o cercetare a corelatiei rangurilor, vom considera scrise in ordine crescatoare sau descrescatoare toate valorile lui xi iar alaturi scriem valorile corespunzatoare ale lui yi, acestea din urma putind fi sau nu in vreo anumita ordine. Prin urmare, in cadrul ordonarii dupa rang, x ia valorile: 1,2,3,, n intr-o anumita ordine, pe cand y ia aceleasi numere dar ordonate dupa aceasta caracteristica. Pentru ca sa nu existe compensari intre valorile di se va lua patratul acestor valori. Astfel se defineste coefficient de corelatie al rangurilor (coeficientul lui Spearman) ca fiind expresia :
Daca r=1 avem concordanta maxima, iar daca r=-1 avem discordanta maxima. Pentru o ilustrare mai sugestiva vom lua un exeplu. Consideram ca A1, A2, , An reprezinta n persoane, caracteristicile x1 , x2 ,,xn, fiind inaltimea lor masurata in cm, iar caracteristicile y1, y2 ,,yn greutatea lor masuraa in kg. Se pune problema daca exista o corelatie intre aceste doua caracteristici. Pentru simplificare vom lua n=10. Aceasta clasificare are urmatorul rezultat. A1 A2 A3 A4 A5 A6 A7 A8 A9 A10
3 1 10 6 2 5 7 8 4 9 1 2 9 7 4 3 6 10 5 8 In prima linie sunt cele 10 persoane, in linia a doua ordinea pe care o ocupa fiecare persoana dupa inaltime (crescatoare), iar in linia a treia ordinea lor dupa greutate. Aceasta ordonare ne permite sa dam un criteriu privind legatura intre aceste doua caracteristici. Vom deosebi doua situatii extreme. Situatia cea mai strans legata (cel mai inalt este cel mai mare in greutate) : A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 3 1 10 6 2 5 7 8 4 9 3 1 10 6 2 5 7 8 4 9 si situatia cu legatura cea mai slaba (cel mai inalt este cel mai mic in greutate). A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 3 1 10 6 2 5 7 8 4 9 8 10 1 5 9 6 4 3 7 2 Rangurile obtinute in cele doua clasificari pot oferi o indicatie asupra corelatiei dintre cele doua caracteristici. Diferentele dintre cele doua valori sunt (primul sir minus al doilea sir) : 2 -1 1 -1 -2 2 1 -2 -1 1 iar suma patratelor diferentelor este data de iar coeficientul lui Spearman r Apropierea de 1 lui r indica o corelatie destul de mare intre carcatristicile luate in considerare.
|