Obiectivul principal al unui depozit de date este suportul in procesul decizional. In acest sens, capacitatea depozitului de date de a oferi informatii pe baza datelor pe care le stocheaza este un element fundamental al functionalitatii sale.
Exista mai multe tehnologii de analiza a datelor din depozitele de date, una dintre cele mai raspandite (atat sub aspectul utilizarii efective, cat si din punct de vedere al suportului software existent), este tehnologia OLAP.
Tehnologia OLAP permite utilizarea eficienta a continutului depozitelor de date in vederea analizei online a datelor, oferind raspuns rapid la interogari complexe. Modelul multidimensional OLAP si tehnicile de agregare specifice permit organizarea unor volume mari de date, care sa poata fi interpretate usor. OLAP ofera viteza de lucru si flexibilitatea necesare analistilor de date, principalii "clienti" ai depozitelor de date.
Legatura dintre depozitele de date si tehnologia OLAP poate fi definita astfel: "in timp ce depozitele de date asigura gestiunea datelor, OLAP implementeaza tehnologii ce asigura transformarea acestor date in informatii strategice"[1].
Termenul OLAP a fost introdus de dr. E.F. Codd, "parintele" modelului relational, intr-un articol publicat in 1993[2], definind 12 principii pentru aplicatiile ce utilizeaza aceasta tehnologie. Ulterior, Nigel Pendse si Richard Creeth au restrans la cinci numarul acestor principii :
viteza: datele trebuie sa fie la dispozitia utilizatorilor atunci cand acestia au nevoie de ele (exista decizii care este necesar sa fie adoptate rapid, daca procesul se bazeaza pe datele dintr-un depozit de date, viteza de acces devine o caracteristica imperativa);
capacitatea de analiza: datele trebuie sa poata fi prelucrate prin metode matematice sau statistice (in cazul depozitelor de date utilizate pentru analiza economica, prelucrarea datelor trebuie sa reflecte principiile modelelor de analiza aplicate de utilizatori);
partajarea: datele sa poata fi accesate de mai multi utilizatori (ceea ce impune ca aplicatiile OLAP sa includa mecanisme de asigurare a confidentialitatii datelor);
caracterul multidimensional: "coloana vertebrala" a aplicatiilor OLAP o reprezinta bazele de date multidimensionale, componente ale depozitelor de date;
informare: toate datele necesare si disponibile pentru o aplicatie sa poata fi accesate, indiferent de sursa si de volumul lor.
Indiferent de scopul si utilizatori sai, orice aplicatie bazata pe tehnologia OLAP trebuie sa prezinte urmatoarele caracteristici:
prezentarea datelor sub forma de cuburi (altfel spus, sa ofere o vedere multidimensionala asupra datelor). Referindu-ne tot la analiza economica, majoritatea modelelor oferite de aceasta disciplina au caracter multidimensional (spre exemplu, modelele balantiere se bazeaza pe descompunerea unui intreg in parti componente, aceasta descompunere se face dupa criterii variate: organigrama firmei, parteneri de afaceri, factori de productie, produse oferite spre desfacere etc.). Fiecare criteriu de clasificare folosit se concretizeaza intr-o dimensiune;
suportul pentru calcule intensive - reflecta capacitatea de analiza prezentata anterior (posibilitatea de realizare a unor analize structurale sau folosirea unor metode pentru determinarea trendului unor indicatori);
capacitatea de a efectua analize in dinamica: se regaseste in dimensiunea universala TIMP, fundamentul oricarei analize complexe. Oricare ar fi subiectul unei analize, rezultatele acesteia trebuie sa includa informatii despre momentele sau intervalele de timp la care se refera datele analizate si rezultatele analizei.
Utilizarea tehnologiei OLAP ofera utilizatorilor depozitelor de date o serie de avantaje, cum ar fi[4]:
executarea rapida a interogarilor, datorita posibilitatii de a stoca in cub valori ante-calculate (calculate inainte de executarea interogarii), cum ar fi valorile agregate;
interogari bazate pe metadate. De exemplu, limbajul de interogare MDX permite generarea nativa a criteriilor de filtrare a rezultatelor unei interogari;
formule de calcul asemanatoare celor utilizate in aplicatiile de calcul tabelar. Principalul avantaj al unui procesor de tabele (atunci cand se pune problema utilizarii lui intr-o firma) este caracterul intuitiv al formulelor: utilizatorii genereaza formule utilizand adresele celulelor ce stocheaza valorile care ii intereseaza. Utilizarea acestui gen de formule intr-un mediu OLAP este usor de realizat, deoarece in formule se poate adresa orice celula din cub.
Tehnologia OLAP utilizeaza structuri de date denumite cuburi, organizate in baze de date multidimensionale. Procesul de definire al structurii cuburilor se numeste modelare dimensionala, similar cu proiectarea structurii depozitului de date. Dat fiind ca orice cub OLAP este destinat extragerii de informatii dintr-un depozit de date, componentele unui cub sunt similare cu componentele unui depozit de date.
Bazele de date multidimensionale reprezinta structuri de date optimizate pentru exploatarea datelor din depozitele de date si pentru analize de tip OLAP.
Modelarea multidimensionala reprezinta "coloana vertebrala" a tehnologiei OLAP. Se poate spune ca modelarea multidimensionala permite prezentarea rezultatelor unei activitati economice in directa corelatie cu unul sau o parte dintre factorii ce au contribuit la formarea lor.
Necesitatea folosirii modelarii multidimensionale apare acolo unde inceteaza "puterea" modelului relational. Desi bazele de date relationale sunt extrem de flexibile in prezentarea informatiei, utilizatorii interesati sa extraga informatii care sa-i ajute in adoptarea deciziilor vor sa primeasca o imagine de ansamblu asupra activitatii, si nu sa vizualizeze datele la nivel de inregistrari. Bineinteles ca SGBD relationale pot oferi o imagine de ansamblu, dar consumul de timp si de resurse conduce la o slaba eficienta in cazul utilizarii acestei solutii.
Principala structura de date utilizata de tehnologia OLAP este deci cubul (uneori, se considera relevanta folosirea notiunii hipercub, deoarece structura de date poate contine mai mult de trei dimensiuni - de analiza, spre deosebire de notiunea de cub din geometria in spatiu, caracterizata prin trei dimensiuni).
Conform SQL Server Books Online, un cub este o "structura de date multidimensionala, care contine dimensiuni si masuri".
Componentele unui cub OLAP sunt urmatoarele:
a. masuri: elementele care descriu indicatorii ce fac obiectul analizei (de exemplu, valoarea primelor subscrise catre o societate de asigurari, valoarea creditelor acordate de o banca, valoarea cheltuielilor unei firme etc.). atunci cand se definesc masurile cubului, este necesar sa se aiba in vedere urmatoarele[5]:
masurile trebuie sa reflecte valori numerice;
masurile sa fie stocate in tabelul de fapte al cubului;
masurile sa fie asociate fiecarui nivel din fiecare dimensiune.
b. dimensiuni: caracteristicile dupa care se face analiza masurilor activitatii[6]. De exemplu, timpul (am prezentat anterior importanta dimensiunii temporale in contextul tehnologiei OLAP), dimensiunea geografica (o astfel de dimensiune poate descrie amplasarea structurilor organizatorice ale firmei sau adresele partenerilor de afaceri), partenerii de afaceri, produsele sau serviciile oferite, elementele componente ale organigramei firmei (sucursale, departamente, magazine, chiar si angajati).
O dimensiune se caracterizeaza prin urmatoarele elemente:
denumirea dimensiunii;
structura dimensiunii (atributele acesteia): reprezinta elementele care caracterizeaza o dimensiune;
membrii dimensiunii: valorile atributelor dimensiunii;
nivelele dimensiunii: un nivel se obtine prin agregarea membrilor unei dimensiuni care au o caracteristica comuna;
ierarhia dimensiunii: structura de tip arborescent a nivelelor parinte-copil ale dimensiunii respective.
c. fapte;
d. tabele de fapte;
e. tabele dimensionale;
Cuburile se pot organiza in doua variante arhitecturale:
a) stea: similar cu depozitul de date, intr-un cub construit dupa schema stea toate tabelele dimensionale se leaga direct cu tabelul de fapte. Se considera ca in majoritatea cazurilor schema stea ofera performante mai bune si este mai usor de intretinut (datorita numarului mai mic de tabele si legaturi);
b) fulg de nea: caracteristic acestei scheme este faptul ca o dimensiune este reprezentata de mai mult de un tabel dimensional. Nivelele dimensiunii astfel construita se regasesc in datele din tabelele dimensionale (intre care se stabilesc legaturi). Un considerent pentru adoptarea unei scheme fulg de nea in loc de stea ar fi lizibilitatea mai ridicata a modelului dimensional, in cazul in care volumul de date este prea mare.
Conform Bain, T si altii, Professional SQL Server Data Warehouse with Analysis Services, Wrox Press Ltd.
Jacobson, R. si colectiv (2006) - "Microsoft SQL Server 2005 Analysis Services Step By Step", Microsoft Press
Politica de confidentialitate |
.com | Copyright ©
2025 - Toate drepturile rezervate. Toate documentele au caracter informativ cu scop educational. |
Personaje din literatura |
Baltagul – caracterizarea personajelor |
Caracterizare Alexandru Lapusneanul |
Caracterizarea lui Gavilescu |
Caracterizarea personajelor negative din basmul |
Tehnica si mecanica |
Cuplaje - definitii. notatii. exemple. repere istorice. |
Actionare macara |
Reprezentarea si cotarea filetelor |
Geografie |
Turismul pe terra |
Vulcanii Și mediul |
Padurile pe terra si industrializarea lemnului |
Termeni si conditii |
Contact |
Creeaza si tu |