Pin It
  • Locul instrumentelor OLAP în mediul decizional

Un Data warehouse reprezintă o bază destinată procesului decizional în care actualizarea informaţiilor nu se desfăşoară liniar şi interdependent. În context decizional se are în vedere obţinerea unui timp de răspuns optim pentru volumul de date cercetat.

Data warehouse îi permite decidentului să obţină informaţiile necesare în câteva minute, comparativ cu sistemele clasice care generau răspunsuri în câteva zile.

O predefinire din punct de vedere fizic a unor subansamble de date poate optimiza cererile de interogare efectuate în mod frecvent. În acest caz se impune evidenţierea diferită între facilităţile depozitelor de date şi cele asociate unui sistem OLAP. Spre deosebire de instrumentele Data Warehouse, OLAP abordează datele agregate într-o manieră multidimensională.

OLAP versus OLTP (Online Tranzactional Processing)

Metodele bazate pe entitate-asociere, metoda MERISSE şi altele au fost şi sunt utilizate pentru automatizarea producţiei, dar acestea au caracter tranzacţional în care modelele sunt destinate minimizării redundanţei. Ele sunt denumite generic OLTP.

Concepţia este orientată pe proces şi modelul de date intervine ca suport al acestuia. Cererile de informaţii sunt previzibile şi majoritatea testelor se definesc printr-un ansamblu de tranzacţii. Datele sunt accesate prin chei, volumul lor este limitat iar numărul de intrări - ieşiri este previzibil.

În acest context se dezvoltă depozite de date Data Warehouse în care informaţia nu mai este pusă la dispoziţia utilizatorului sub formă liniară ci într-o forma multidimensională. Vorbim de o tehnologie de agregare a datelor şi de accesare rapidă a informaţiilor sub denumire generică de OLAP.

O comparaţie pe scurt între OLAP şi OLTP poate fi sintetizată astfel:

  • Caracteristicile de bază OLAP
  1. Perspectiva multidimensionala a datelor

Acestea pot fi organizate pe mai multe aspecte: timp, localizare, tipuri de produse, clienţi. Acest format se numeşte hypercub.

 

 

  1. Orientare în timp, deoarece timpul ca dimensiune permite realizarea de comparaţii şi analize. Bazele de date multidimensionale utilizate de OLAP stochează straturi de date agregate pe diverse criterii, dar şi date statistice calculate pe fiecare nivel de agregare. De ex.: dacă avem datele lunare pentru un client al unei bănci, acestea ar cuprinde numele clientului, localitatea, numărul de tranzacţii, valoarea tranzacţiilor. Datele de sinteza stocate ar putea fi: numărul de tranzacţii ale clienţilor pe trimestre sau luni, numărul de tranzacţii pe localităţi, comisioane încasate în diverse perioade de timp.
  2. Efectuarea de calcule intensive Aceasta presupune aplicarea de algoritmi asupra datelor hypercubului cu posibilitatea de adresare multidimensionala directa a locaţiilor şi optimizarea timpului de răspuns.

Domeniile de succes OLAP sunt: financiar-bancar (gestiunea portofoliului, urmărirea clienţilor, marketing), distribuţie (marketing, întreţinere, produse de succes), telecomunicaţii (întreruperi, fraude, clasificarea clienţilor), medicină, burse de valori, producţie.

  • Modelarea dimensionala

Este o tehnică de conceptualizare şi reprezentare a aspectelor cantitative ale activităţii în strânsă legătură cu parametrii acestuia: cine, ce, unde, cum. Elementele fundamentale de structura a datelor utilizate în acest proces de analiza on-line este cubul, care modelează activitatea desfăşurată pe o anumită perioadă prin 3 noţiuni :

  • măsura activităţii: volumul tranzacţiilor, volumul         comisioanelor, volumul creanţelor;
  • faptele: colecţii de măsuri ale activităţii, care identifica contextul în care acestea s­au desfăşurat;
  • dimensiunea activităţii: se identifica prin parametrii             acesteia; o dimensiune

reprezintă o perspectiva din care pot fi privite datele. De ex.: vânzările pot fi privite

din punct de vedere al produselor vândute, din punct de vedere al perioadei de timp, zona geografică sau client.

O caracteristică esenţiala a tehnologiei OLAP o reprezintă organizarea valorii dimensiunilor în ierarhii. De ex.: pentru analiza profitului pe centre de profit putem defini următoarele structuri: total organizaţie, departamente, centre de responsabilitate.

La intersecţia dintre valoarea dimensiunilor se afla celulele cubului, care conţin de regula date agregate. Modelul este dificil de vizualizat în toate dimensiunile şi ar trebui desfăşurat pe secţiuni sau proiecţii tridimensionale.

  • Bazele de date multidimensionale

O bază de date multidimensională cuprinde:

  • structura datelor, în care sunt măsurate activităţile preluate din tabele de fapte a departamentului,
  • structura metadatelor, în care sunt stocate dimensiunile şi membrii acesteia, dar şi structurile ierarhice ale dimensiunilor.

Din punct de vedere fizic datele sunt memorate într-un fişier cu acces direct pe baza adreselor fizice absolute sau relative, prin exploatarea tabelelor bitmap. Acestea fac legătura între structurile de date şi structurile de metadate; sunt relativ greu de construit şi construcţia se bazează pe un număr fix de membri.

Structura metadatelor este de tip ierarhic, fiecare dimensiune face parte dintr-o structura arborescenta cu o rădăcina şi cu mai multe ramuri ce pot avea “ frunze comune” (ierarhii alternative). Toate ierarhiile au cel puţin un nivel comun (nivelul frunze), considerat cel mai scăzut nivel de centralizare.

  • Operaţiile OLAP asupra hzpercuburilor

Numărul de membri ai unei dimensiuni exprima granularitatea, nivelul de detaliu necesar pentru efectuarea unei analize. Ajustarea gradului de granularitate se poate face prin :

  • ROLL - UP, care realizează comasarea masurilor analizate;
  • DRILL - DOWN, care realizează descompunerea măsurilor, oferă mai multe detalii.

Asupra hypercuburilor se mai pot efectua si următoarele tipuri de operaţii:

  • slicing, presupune selecţionarea pentru a putea viziona doar un membru al unei dimensiuni (o secţiune plana), selecţie ce ia forma unei tabele pivot. De ex: vânzările de produse bancare in anul 2002 pe clienţi şi produse;
  • dicing, defalcarea sau proiectarea unei dimensiuni pe o alta dimensiune. De ex: vânzarea de produse bancare în 2002 către clienţi şi sucursale.

Proiectarea structurilor, depozitelor de date şi a hipercuburilor continua pe parcursul întregii vieţi a aplicaţiei, dimensiunile cuburilor sunt strâns legate de detaliile activităţii.