Pin It

Depozitele de date şi tehnologia OLAP au apărut în anii ‘90, însă suportul software disponibil atunci nu răspundea necesităţilor. O soluţie a problemei este SQL Server 7.0, accesibilă utilizatorului final şi adaptată necesităţilor companiilor mici.

Instrumentul SQL îndeplineşte următoarele funcţii: transformarea şi exportarea datele, stocarea datelor în depozite de date şi în baze de date multidimensionale, analiza datelor, prezentarea datelor.

  • Serviciul de transformare a datelor

Principala sursa de date a serviciului o reprezintă bazele de date relaţionale. Acesta asigura colectarea si transformarea datelor prin:

  • validarea datelor care presupun uniformizarea unităţii de măsura, verificarea încadrării pe categorii, clase sau grupuri, verificarea consistenţei datelor,
  • curăţarea datelor, care presupune reconcilierea datelor provenite din mai multe surse prin compararea nomenclatoarelor folosite de diverse aplicaţii şi utilizarea ulterioara a unui singur nomenclator.
  • migrarea datelor, presupune transportarea datelor in depozit; un aspect important îl constituie sincronizarea surselor de date în vederea preluării datelor la acelaşi moment;
  • transformarea datelor, care presupune pregătirea datelor preluate din sursele primare şi utilizarea lor în analize complexe (de ex: comasarea coloanelor, divizarea coloanelor, transformarea dintr-un format în altul).
  • Serviciul de asistare a deciziei

Realizează analiza şi prezentare datelor prin:

  1. Serverul OLAP, ce are drept funcţie principală extragerea datelor din surse eterogene, agregarea şi procesarea lor şi stocarea în baze de date multidimensionale.
  2. Serverul de analiză, care pune la dispoziţia utilizatorilor obiecte de suport al deciziei pentru accesarea serverului OLAP.
  3. Serverul de prezentare a datelor (tabele pivot), care reprezintă o interfaţa pentru utilizările familiarizate cu mediile de lucru EXCEL, ACCES.
  4. Serverul English-Query, care permite formularea de interogări în limbaj natural, traducerea în clauze SQL.
  5. Serverul client, instalat pe calculatorului utilizatorului final şi se bazează pe serviciul tabele pivot ce accesează serverul OLAP. Componenta client aduce datele necesare într-o memorie cache pentru a putea fi utilizate şi după ce legătura cu serverul s-a terminat.
  6. Managerul OLAP, un mediu de lucru accesibil printr-o interfaţă grafica ce permite utilizatorului să-şi construiască o soluţie OLAP pe baza surselor de date existente.

Instrumentele de dezvoltare incluse în SQL Server sunt:

  • sisteme de gestiune a datelor operaţionale;
  • serviciul de extragere si transformare a datelor;
  • serverul OLAP de analiza multidimensionala şi agregare;
  • instrumente pentru utilizatorul final.
  • Stocarea datelor OLAP

Modelele structurale multidimensionale specifice tehnologiei OLAP se pot stoca în mai multe moduri: ROLAP (Relational OLAP) - stocarea datelor primare şi a agregărilor în        structurile relaţionale cu timpi de răspuns slabi, cu avantajul utilizării unui spaţiu        pe            disc mai mic (se foloseşte pentru datele interogate mai rar).

  1. MOLAP (Multidimensional OLAP) - stochează în structurile multidimensionale atât datele de baza, cât şi pe cele agregate; calculele necesare se efectuează în interiorul cubului şi are performanţe în ceea ce priveşte timpul de răspuns, dar ocupă spaţiu mare pe disc.
  2. HOLAP ( Hybrid OLAP) - combinaţie a structurilor enunţate; calculele sunt efectuate în interiorul cubului, iar datele de baza sunt stocate în tabelele depozite de date.
  • Analiza datelor folosind limbaje de procesare a datelor multidimensionale

Pentru a răspunde necesităţilor de analiza a datelor, instrumentele OLAP trebuie să ofere o serie de operaţii analitice precum: consolidarea (ROLL-UP), parcurgerea în jos (DRILL-DOWN), secţionarea (slicing), schimbarea perspectivelor (dicing).

Pentru a răspunde acestor cerinţe Microsoft furnizează limbajul MDX, iar ORACLE limbajul EXPRESS. Acestea conţin instrucţiuni de definire a datelor şi instrucţiuni de manipulare de date. Produsele EXPRESS de la ORACLE se caracterizează prin:

  • multidimensionalitate,
  • reprezentarea datelor nu se limitează la 2 sau 3 foi de calcul,
  • întreţinerea ierarhiilor permite o foarte uşoara consolidare şi agregarea datelor la diferite nivele de detaliu,
  • procesul de analiză presupune un mediu pentru aplicaţie care implica serii de timp sau analize încrucişate,
  • mediul de programare este structurat si cuprinde structuri condiţionate şi repetitive, depanare, compilare, execuţie;
  • acces la datele relaţionale, la mai multe baze de date,
  • facilităţi de citire a datelor.