Calculatoare
Tehnologia OLAP (OnLine Analytical Processing) evaluari si clasificariTehnologia OLAP (OnLine Analytical Processing) este un instrument puternic, performant si usor accesibil de agregare a datelor stocate in arhive mari de date, care printr-o abordare multidimensionala, asigura acces rapid la informatii, iar printr-o analiza multidimensionala ofera raspunsuri concrete, consistente, corecte si in timp real la intrebarile analistilor de marketing privind fenomene, procese si activitati de marketing. Tehnica OLAP permite o modelare dimensionala, prin utilizarea cubului OLAP, o structura multidimensionala, un hipercub, care modeleaza aspectul complex al unui proces sau fenomen, atit prin reprezentarile sale cantitative, masurabile ale activitatii, in stransa legatura cu aspectele calitative sau de context. Context este definit prin dimensiunile/parametrii sai: cand s-a desfasurat, unde s-a desfasurat, cine a initiat, cine a executat-o, cine a beneficiat de ea, cu ce resurse, cu cine a fost efectuata, de la cine si catre cine s-a desfasurat. Trasatura esentiala a acestor intrebari este caracterul lor multidimensional. Exista totusi cateva tipuri uzuale de intrebari, care pot arunca o lumina asupra complexitatii instrumentelor care trebuie sa furnizeze raspunsuri: · rapoarte multidimensionale, ca de exemplu: vanzarile totale ale firmei din produsul X, si respectiv ponderea vanzarilor realizate prin magazinele din orasul Y in perioada . . ? · comparatii, ca de exemplu: care este media abaterii procentuale de la planul de vanzari in primul semestru al acestui an comparativ cu vanzarile din primul semestru al anului trecut ? · clasificari si profiluri statistice, ca de exemplu: care este volumul vanzarilor si media adaosului pentru primii 20 % dintre distribuitori si care este contributia acestora la totalul vanzarilor pe trimestrul trecut ? · agregari libere, ca de exemplu: care sunt veniturile realizate in ultimele doua trimestre de filialele judetene din Muntenia ? · evaluari What – If, ca de exemplu: in ce masura ar influenta profitul total al firmei o crestere cu 15 % a vanzarilor in judetele din Moldova ? Pentru oricine care a formulat interogari in bazele de date multidimensionale (engl. Query), este evident ca exprimarea unor asemenea cereri depaseste posibilitatile oricarui instrument de acces si raportare. Printre calitatile pe care trebuie sa le indeplineasca un bun instrument OLAP se numara: · sa poata sustina analize sofisticate; · sa poata fi utilizate eficient de diverse categorii de utilizatori; · sa fie scalabile la volume oricat de mari de date; · sa permita accesul concurent al unui mare numar de utilizatori; · sa fie usor de intretinut si de configurat; · sa fie bazate pe o arhitectura deschisa deoarece evolutia tehnologiei informatiei poate aduce schimbari radicale in structura sistemului informatic care, insa, nu trebuie sa afecteze instrumentatia utilizata pentru analiza. O baza de date multidimensionala utilizata de tehnologiile OLAP este formata din doua structuri: · Structura datelor prin care se descriu structurile proprii ale bazelor de date referite, cu campurile, atributele si caracteristicile asociate; · Structura metadatelor definita prin dimensiunile, structurile ierarhice ale dimensiunilor, membrii si multipli acestor structuri. Dimensiunile OLAP sunt identificate in bazele de date tranzactionale ca fiind cimpurile ce contin caracteristicile unei tranzactii, datele de identificare a tranzactiei respective si care in cele mai multe cazuri sunt cheile externe utilizate in bazele respective. Dimensiunile reprezinta parametrii in care s-a desfasurat o activitate, nu se intersecteaza cu alte dimensiuni si sunt de natura complet diferita (timp, spatiu, produse, furnizori, clienti, resurse financiare, resurse materiale, resurse umane). Multimea valorilor posibile pe care le poate lua dimensiunea respectiva poarta numele de membrii dimensiunii. Prin regruparea valorilor se genereaza multipli de membrii, grupe de valori ale dimensiunii respective cu o caracteristica comuna. De exemplu se poate defini localitatea ca multiplu de membrii formati din toti clientii organizatiei din localitatea respectiva. Dimensiunile si multipli lor formeaza structuri arborescente cunoscute in
OLAP sub numele de ierarhii. Modelarea dimensionala ofera un model conceptual, cubul OLAP, care permite agregarea datelor intr-o structura ierarhica, simpla si foarte flexibila, fara a modifica structura de baza a colectiilor incorporate in depozit, cu pastrarea legaturilor cu sursele initiale de date si cu posibilitatea de descompunere a datelor centralizate pe niveluri ierarhice inferioare pina la setul de tranzactii initiale. Motorul OLAP foloseste ca mod de vizualizare a datelor in depozitul de date, o reprezentare intr-un spatiu n dimensional, prin care axele dau dimensiunea logica a cubului.
Figura1:Cubul de date Daca luam ca exemplu dimensiunile: Produsul, timpul regiunea (zona), cubul masurilor cantitative sau valorice ar avea reprezentarea din figura 1. Asupra cuburilor n dimensionale motorul analitic executa o serie de operatii care se integreaza in aplicatii OLAP manevrate de utilizatorul final. Pentru executia acestor operatii este necesara „navigarea libera” de-a lungul nivelelor ierarhice definite pentru depozitul de date. Principalele operatii OLAP care se pot efectua sunt: · Specificarea criteriilor de selectie este primul pas in orice analiza. Utilizatorul trebuie sa poata exprima cu usurinta criterii simple, bazate pe valori ale atributelor si/sau pe valori ale metricelor. Aceste criterii simple trebuie sa poata fi apoi combinate prin operatori logici si trebuie sa poata fi salvate in biblioteci pentru eventuale reutilizari. · Rotatiile sunt operatii care permit utilizatorilor sa gaseasca perspectiva care-l intereseaza specificind dimensiunile si directiile de rotatie sau indicand un pivot. · Schimbarea nivelului de agregare permite gasirea nivelului de agregare optim pentru analiza. Se poate adanci analiza spre nivele de detaliu prin operatii de schimbare a sensului de navigarii de-a lungul nivelelor unei ierarhii; prin drill down se poate naviga pe nivelele cu un grad de detaliu mai mare, iar prin roll up se va naviga pe nivelele ierarhice superioare ca nivel de agregare. · Specificarea modului de prezentare trebuie sa permita analistului sa gaseasca modalitatile optime de valorificare vizuala a datelor extrase. In afara de posibilitatile grafice tipice pentru prezentare, este important ca utilizatorul sa poata vizualiza date multidimensionale intr-o maniera tabelara. In acest sens se pot utiliza tabele complexe, care sa poata grupa coloane si linii exprimand dimensiuni diferite (de pilda timpul si dispunerea in spatiu) si nivele de agregare diferite.Perspectiva multidimensionala asupra datelor se face prin operatii care permit obtinerea de vederi (view) bidimensionale dintr-un cub n dimensional, care se mai numesc slice-uri, felii de informatii care servesc unor anumite scopuri si decizii manageriale.
Figura 2: Slice pentru viziunea managerului de produs De exemplu viziunea managerului de produs intereseaza doar vanzarile anumitor produse, in toata regiunea si in toata perioada de timp considerata Alte tipuri de sliceuri pot felia cubul pe toate cele trei coordonate carteziene asa cum se poate vedea in figura de mai jos.
Figura 3: Alte tipuri de sliceuri Pentru prezentarea convenabila a rezultatelor se fac racordari ale vederilor bidimensionale cu baza de date multidimensionala, prin mapari de date, coroborate cu utilizari de grafice si tabele complexe. Fiind o tehnologie relativ noua, modelul de arhitectura OLAP (figura 4) care sa impus pentru sistemele orientate spre analiza multidimensionala este unul de tip client/server in trei straturi.
Figura 4:. Arhitectura unui sistem OLAP a) Data Warehouse formeaza nivelul cel mai de jos, responsabil cu stocarea si regasirea datelor. De regula aplicatiile tranzactionale utilizeaza sisteme relationale dar pentru depozitele de date se folosesc sisteme multidimensionale. Dat fiind volumul mare de date, este recomandabil ca SGBD-urile folosite sa ofere suport pentru prelucrari paralele si distribuite, sa dispuna de mecanisme performante de indexare si de optimizare, sa ofere un inalt nivel de siguranta; b) Motorul analitic OLAP (OLAP engine) are sarcina de a prelua cererile exprimate de utilizatori si, pe baza consultarii metadatelor, sa genereze cererile necesare pentru obtinerea datelor ce vor fi redirectate catre clienti. In plus, datelor obtinute li se vor aplica la acest nivel o serie de prelucrari de generarea de interogari, manipulari de date si de sintetizarea rezultatelor; c) Metadatele – in care sunt stocate dimensiunile, membrii si multipli lor, precum si structurile ierarhice ale dimensiunilor, informatii care apar pe axele cuburilor si sunt prezentate utilizatorului ca nume de rinduri sau de coloane (pivot table); d) Aplicatiile OLAP sunt reprezentate de instrumente manuite de utilizatorul final. Exista aplicatii generale care raspund suficient de bine nevoilor unei categorii largi de utilizatori, exista instrumente specializate pe domenii (cum ar fi de pilda analize regresionale, analize ANOVA, analize SWOT, analiza financiara) si, in fine, exista posibilitatea de a dezvolta instrumente foarte specifice. Din punct de vedere al utilizatorului final, aplicatia pe care o foloseste trebuie sai asigure doua functionalitati importante: navigarea libera prin depozitul de date in cautarea informatiilor relevante si posibilitati diverse de prezentare a datelor. Aceste functionalitati sunt strans legate intre ele si este greu de spus care operatie este de navigare si care este de prezentare. Cerintele de administrare si dezvoltare pentru OLAP, desi similare cu cele pentru instrumentele de interogare si raportare, sunt in general mult mai complexe. Punerea in functiune a unui sistem OLAP si a softului de acces la date necesita o intelegere clara a modelului de date al intreprinderii si a functiilor analitice cerute de conducerea executiva si strategica. Produsele comerciale pot fi de mare folos, dar rareori exista solutii ,,la cheie” pentru OLAP; arhitectura trebuie reglata astfel incat sa suporte sursele de date folosite si sa faca fata cerintelor. In schimb, odata ce sistemul OLAP este functional, suportul tehnic pentru utilizator este minimal.
|