Hva er OLAP? Kube, operasjoner og amp; Typer i datavarehus

Innholdsfortegnelse:

Anonim

Hva er OLAP?

Online Analytical Processing (OLAP) er en kategori av programvare som lar brukerne analysere informasjon fra flere databasesystemer samtidig. Det er en teknologi som gjør det mulig for analytikere å hente ut og se forretningsdata fra forskjellige synsvinkler.

Analytikere trenger ofte å gruppere, samle og delta i data. Disse operasjonene i relasjonsdatabaser er ressurskrevende. Med OLAP kan data beregnes og forhåndsaggregeres, noe som gjør analysen raskere.

OLAP-databaser er delt inn i en eller flere kuber. Kubene er utformet på en slik måte at det er enkelt å lage og se rapporter. OLAP står for Online Analytical Processing.

I denne veiledningen vil du lære-

  • OLAP-kube
  • Grunnleggende analytiske operasjoner av OLAP
  • Typer OLAP-systemer
  • ROLAP
  • MOLAP
  • Hybrid OLAP
  • Fordeler med OLAP
  • Ulemper med OLAP

OLAP-kube:

Kjernen i OLAP-konseptet er en OLAP Cube. OLAP-kuben er en datastruktur optimalisert for veldig rask dataanalyse.

OLAP-kuben består av numeriske fakta kalt tiltak som er kategorisert etter dimensjoner. OLAP Cube kalles også hypercube .

Vanligvis utføres datoperasjoner og analyser ved hjelp av det enkle regnearket, der dataverdiene er ordnet i rad- og kolonneformat. Dette er ideelt for todimensjonale data. OLAP inneholder imidlertid flerdimensjonale data, med data vanligvis hentet fra en annen og ikke-relatert kilde. Å bruke et regneark er ikke et optimalt alternativ. Kuben kan lagre og analysere flerdimensjonale data på en logisk og ryddig måte.

Hvordan virker det?

Et datalager vil trekke ut informasjon fra flere datakilder og formater som tekstfiler, Excel-ark, multimediefiler, etc.

De ekstraherte dataene blir renset og transformert. Data blir lastet inn i en OLAP-server (eller OLAP-kube) der informasjon blir forhåndsberegnet på forhånd for videre analyse.

Grunnleggende analytiske operasjoner av OLAP

Fire typer analytiske operasjoner i OLAP er:

  1. Rull opp
  2. Bore ned
  3. Skjære og kutte
  4. Pivot (roter)

1) Opprulling:

Samleoppbygging er også kjent som "konsolidering" eller "aggregering". Opprullingsoperasjonen kan utføres på to måter

  1. Reduserende dimensjoner
  2. Klatring opp konsepthierarki. Konsepthierarki er et system for gruppering av ting basert på deres rekkefølge eller nivå.

Tenk på følgende diagram

  • I dette eksemplet, byer New Jersey og Lost Angles og rullet opp til landet USA
  • Salgstallet i New Jersey og Los Angeles er henholdsvis 440 og 1560. De blir 2000 etter opprulling
  • I denne aggregeringsprosessen flytter data stedhierarki opp fra by til land.
  • I samleprosessen må minst en eller flere dimensjoner fjernes. I dette eksemplet fjernes Quater-dimensjonen.

2) Drill-down

I drill-down data er fragmentert i mindre deler. Det er det motsatte av samleprosessen. Det kan gjøres via

  • Flytter oss ned i konsepthierarkiet
  • Å øke en dimensjon

Tenk på diagrammet ovenfor

  • Quater Q1 er boret ned til månedene januar, februar og mars. Tilsvarende salg er også registre.
  • I dette eksemplet legges dimensjonsmåneder til.

3) Skive:

Her velges en dimensjon, og en ny underkube opprettes.

Følgende diagram forklarer hvordan skiveoperasjonen utførte:

  • Dimensjonstid er skivet med Q1 som filter.
  • En ny kube opprettes helt.

Terning:

Denne operasjonen ligner et stykke. Forskjellen i terning er at du velger to eller flere dimensjoner som resulterer i opprettelsen av en underkube.

4) Pivot

I Pivot roterer du dataaksene for å gi en erstatning for presentasjon av data.

I det følgende eksemplet er pivoten basert på varetyper.

Typer OLAP-systemer

OLAP hierarkisk struktur

Type OLAP Forklaring
Relasjonell OLAP (ROLAP): ROLAP er en utvidet RDBMS sammen med flerdimensjonal datakartlegging for å utføre standard relasjonsoperasjon.
Flerdimensjonalt OLAP (MOLAP) MOLAP Implementerer drift i flerdimensjonale data.
Hybrid OnlineAnalytical Processing (HOLAP) I HOLAP-tilnærming lagres de samlede totalene i en flerdimensjonal database mens de detaljerte dataene er lagret i den relasjonelle databasen. Dette gir både dataeffektivitet for ROLAP-modellen og ytelsen til MOLAP-modellen.
Desktop OLAP (DOLAP) I Desktop OLAP laster en bruker ned en del av dataene fra databasen lokalt, eller på skrivebordet og analyserer den. DOLAP er relativt billigere å distribuere, da det tilbyr svært få funksjoner sammenlignet med andre OLAP-systemer.
Nett-OLAP (WOLAP) Web OLAP som er OLAP-system tilgjengelig via nettleseren. WOLAP er en tredelt arkitektur. Den består av tre komponenter: klient, mellomvare og en databaseserver.
Mobil OLAP: Mobile OLAP hjelper brukere å få tilgang til og analysere OLAP-data ved hjelp av sine mobile enheter
Romlig OLAP: SOLAP er opprettet for å gjøre det lettere å administrere både romlige og ikke-romlige data i et geografisk informasjonssystem (GIS)

ROLAP

ROLAP jobber med data som finnes i en relasjonsdatabase. Fakta og dimensjonstabeller er lagret som relasjonstabeller. Det tillater også flerdimensjonal analyse av data og er den raskest voksende OLAP.

Fordeler med ROLAP-modellen:

  • Høy dataeffektivitet. Det gir høy dataeffektivitet fordi spørringsytelse og tilgangsspråk er optimalisert spesielt for flerdimensjonal dataanalyse.
  • Skalerbarhet. Denne typen OLAP-system tilbyr skalerbarhet for å håndtere store datamengder, og selv når dataene øker jevnt.

Ulemper med ROLAP-modellen:

  • Krav om høyere ressurser: ROLAP trenger høy utnyttelse av arbeidskraft, programvare og maskinvare.
  • Databegrensninger totalt. ROLAP-verktøy bruker SQL for all beregning av samlede data. Det er imidlertid ingen faste grenser for håndtering av beregninger.
  • Langsom spørringsytelse. Spørreytelsen i denne modellen er treg sammenlignet med MOLAP

MOLAP

MOLAP bruker array-baserte flerdimensjonale lagringsmotorer for å vise flerdimensjonale visninger av data. I utgangspunktet bruker de en OLAP-kube.

Lær mer om OLAP her

Hybrid OLAP

Hybrid OLAP er en blanding av både ROLAP og MOLAP. Den tilbyr rask beregning av MOLAP og høyere skalerbarhet av ROLAP. HOLAP bruker to databaser.

  1. Aggregerte eller beregnede data lagres i en flerdimensjonal OLAP-kube
  2. Detaljert informasjon lagres i en relasjonsdatabase.

Fordeler med hybrid OLAP:

  • Denne typen OLAP er med på å spare diskplass, og den forblir også kompakt, noe som bidrar til å unngå problemer knyttet til tilgangshastighet og bekvemmelighet.
  • Hybrid HOLAP bruker kubeteknologi som gir raskere ytelse for alle typer data.
  • ROLAP oppdateres øyeblikkelig, og HOLAP-brukere har tilgang til disse øyeblikkelig oppdaterte dataene i sanntid. MOLAP gir rengjøring og konvertering av data og forbedrer dermed datarelevansen. Dette gir det beste fra begge verdener.

Ulempene med hybrid OLAP:

  • Høyere kompleksitetsnivå : Den største ulempen ved HOLAP-systemer er at den støtter både ROLAP- og MOLAP-verktøy og applikasjoner. Dermed er det veldig komplisert.
  • Potensielle overlappinger : Det er større sjanser for overlapping, spesielt i funksjonaliteten.

Fordeler med OLAP

  • OLAP er en plattform for alle typer virksomheter som inkluderer planlegging, budsjettering, rapportering og analyse.
  • Informasjon og beregninger er konsistente i en OLAP-kube. Dette er en avgjørende fordel.
  • Opprett og analyser raskt "Hva om" -scenarier
  • Det er enkelt å søke i OLAP-databasen etter brede eller spesifikke termer.
  • OLAP gir byggesteinene for forretningsmodelleringsverktøy, data mining verktøy, ytelsesrapporteringsverktøy.
  • Tillater brukere å kutte data i terninger, etter forskjellige dimensjoner, mål og filtre.
  • Det er bra for å analysere tidsserier.
  • Det er enkelt å finne noen klynger og avvikere med OLAP.
  • Det er et kraftig visualiseringsanalysesystem på nettet som gir raskere responstider

Ulemper med OLAP

  • OLAP krever organisering av data i et stjerne- eller snøfnuggskjema. Disse skjemaene er kompliserte å implementere og administrere
  • Du kan ikke ha et stort antall dimensjoner i en enkelt OLAP-kube
  • Transaksjonsdata kan ikke nås med OLAP-systemet.
  • Enhver modifikasjon i en OLAP-kube trenger en fullstendig oppdatering av kuben. Dette er en tidkrevende prosess

Sammendrag:

  • OLAP er en teknologi som gjør det mulig for analytikere å hente ut og se forretningsdata fra forskjellige synsvinkler.
  • Kjernen i OLAP-konseptet er en OLAP Cube.
  • Ulike forretningsapplikasjoner og annen datadrift krever bruk av OLAP Cube.
  • Det er primære fem typer analytiske operasjoner i OLAP 1) Roll-up 2) Drill-down 3) Slice 4) Dice og 5) Pivot
  • Tre typer mye brukte OLAP-systemer er MOLAP, ROLAP og Hybrid OLAP.
  • Desktop OLAP, Web OLAP og Mobile OLAP er noen andre typer OLAP-systemer.