Depozitele de date şi tehnologia OLAP au apărut în anii ‘90, însă suportul software disponibil atunci nu răspundea necesităţilor. O soluţie a problemei este SQL Server 7.0, accesibilă utilizatorului final şi adaptată necesităţilor companiilor mici.
Instrumentul SQL îndeplineşte următoarele funcţii: transformarea şi exportarea datele, stocarea datelor în depozite de date şi în baze de date multidimensionale, analiza datelor, prezentarea datelor.
- Serviciul de transformare a datelor
Principala sursa de date a serviciului o reprezintă bazele de date relaţionale. Acesta asigura colectarea si transformarea datelor prin:
- validarea datelor care presupun uniformizarea unităţii de măsura, verificarea încadrării pe categorii, clase sau grupuri, verificarea consistenţei datelor,
- curăţarea datelor, care presupune reconcilierea datelor provenite din mai multe surse prin compararea nomenclatoarelor folosite de diverse aplicaţii şi utilizarea ulterioara a unui singur nomenclator.
- migrarea datelor, presupune transportarea datelor in depozit; un aspect important îl constituie sincronizarea surselor de date în vederea preluării datelor la acelaşi moment;
- transformarea datelor, care presupune pregătirea datelor preluate din sursele primare şi utilizarea lor în analize complexe (de ex: comasarea coloanelor, divizarea coloanelor, transformarea dintr-un format în altul).
- Serviciul de asistare a deciziei
Realizează analiza şi prezentare datelor prin:
- Serverul OLAP, ce are drept funcţie principală extragerea datelor din surse eterogene, agregarea şi procesarea lor şi stocarea în baze de date multidimensionale.
- Serverul de analiză, care pune la dispoziţia utilizatorilor obiecte de suport al deciziei pentru accesarea serverului OLAP.
- Serverul de prezentare a datelor (tabele pivot), care reprezintă o interfaţa pentru utilizările familiarizate cu mediile de lucru EXCEL, ACCES.
- Serverul English-Query, care permite formularea de interogări în limbaj natural, traducerea în clauze SQL.
- Serverul client, instalat pe calculatorului utilizatorului final şi se bazează pe serviciul tabele pivot ce accesează serverul OLAP. Componenta client aduce datele necesare într-o memorie cache pentru a putea fi utilizate şi după ce legătura cu serverul s-a terminat.
- Managerul OLAP, un mediu de lucru accesibil printr-o interfaţă grafica ce permite utilizatorului să-şi construiască o soluţie OLAP pe baza surselor de date existente.
Instrumentele de dezvoltare incluse în SQL Server sunt:
- sisteme de gestiune a datelor operaţionale;
- serviciul de extragere si transformare a datelor;
- serverul OLAP de analiza multidimensionala şi agregare;
- instrumente pentru utilizatorul final.
- Stocarea datelor OLAP
Modelele structurale multidimensionale specifice tehnologiei OLAP se pot stoca în mai multe moduri: ROLAP (Relational OLAP) - stocarea datelor primare şi a agregărilor în structurile relaţionale cu timpi de răspuns slabi, cu avantajul utilizării unui spaţiu pe disc mai mic (se foloseşte pentru datele interogate mai rar).
- MOLAP (Multidimensional OLAP) - stochează în structurile multidimensionale atât datele de baza, cât şi pe cele agregate; calculele necesare se efectuează în interiorul cubului şi are performanţe în ceea ce priveşte timpul de răspuns, dar ocupă spaţiu mare pe disc.
- HOLAP ( Hybrid OLAP) - combinaţie a structurilor enunţate; calculele sunt efectuate în interiorul cubului, iar datele de baza sunt stocate în tabelele depozite de date.
- Analiza datelor folosind limbaje de procesare a datelor multidimensionale
Pentru a răspunde necesităţilor de analiza a datelor, instrumentele OLAP trebuie să ofere o serie de operaţii analitice precum: consolidarea (ROLL-UP), parcurgerea în jos (DRILL-DOWN), secţionarea (slicing), schimbarea perspectivelor (dicing).
Pentru a răspunde acestor cerinţe Microsoft furnizează limbajul MDX, iar ORACLE limbajul EXPRESS. Acestea conţin instrucţiuni de definire a datelor şi instrucţiuni de manipulare de date. Produsele EXPRESS de la ORACLE se caracterizează prin:
- multidimensionalitate,
- reprezentarea datelor nu se limitează la 2 sau 3 foi de calcul,
- întreţinerea ierarhiilor permite o foarte uşoara consolidare şi agregarea datelor la diferite nivele de detaliu,
- procesul de analiză presupune un mediu pentru aplicaţie care implica serii de timp sau analize încrucişate,
- mediul de programare este structurat si cuprinde structuri condiţionate şi repetitive, depanare, compilare, execuţie;
- acces la datele relaţionale, la mai multe baze de date,
- facilităţi de citire a datelor.